reprezentare logo Kosson

Know-How

Aspecte practice care privesc activitatea de zi cu zi a breslei.

Dat dat data v3

De curând am avut de rezolvat o problemă de transfer a unui fișier masiv - o colecție digitizată a unei reviste. Problema a apărut la momentul în care trebuia să iau o decizie în ceea ce privește modalitatea de transfer. Cel mai repede m-am gândit la un serviciu pe care îl folosesc destul de des, dar dimensiunea fișierului arhivat depășea orice există. Rezolvarea punctuală a fost un stick usb, aproximativ 2 ore pierdute în trafic, dar revederea plăcută cu un vechi prieten. Totuși, știam că există mai multe soluții pe care rețelele peer-to-peer le-ar oferi, iar un punct de start au fost clasicii torrenți. Problema a fost de seeding pentru că trebuie să existe totuși o oarecare coordonare între cei doi comunicatori. Mai știam de o tehnologie pe care am întâlnit-o atunci când exploram ceea ce oferă dezvoltarea aplicațiilor pe Electron, vezi http://electron.io. Această aplicație se numea Dat (https://datproject.org/) și promitea depășirea barierelor mai sus expuse. Timpul limitat și tumultul zilei, au pus în umbră soluția pe care Dat o propunea. Dar nu am uitat-o și m-am întors pentru a o explora îndeajuns de mult ca scenariul anterior descris să nu se mai repete. Ceea ce am descoperit poate fi util într-un cuplaj strâns cu tehnologia blockchain aplicată resurselor științifice și celor de patrimoniu cultural.

Pentru a detalia și explora, voi parcurge white paper-ul și voi jalona reperele cele mai importante pentru a înțelege ce oferă.

Add a comment

webrtc

Folosești WhatsApp? Dar Facebook Messenger, poate Hangouts, de Skype măcar ai auzit. Toate aceste servicii de comunicații folosesc tehnologia WebRTC. De ce? Pentru că nu te forțează să instalezi pluginuri sau software suplimentar și pentru că permite o mai bună omogenitate a părților ce permit un serviciu coerent.

Te vei intreba pe bună dreptate, de ce să adâncim studiul la nivelul de transport, când pe noi ne-ar interesa o perspectivă arhitecturală asupra blochainului și IPFS în special. Răspunsul vine din necesitatea de a înțelege felul în care sunt „traversate” barierele tehnice și de securitate care se ivesc la stabilirea unui canal de comunicare securizat între două noduri care doresc să schimbe date între ele. Și dacă tot nu ești convins, poate că a înțelege câștigul unei comunicări dincolo de limitările arhitecturale ale Internetului actual va produce scânteia de entuziasm ce va alimenta curiozitatea să muști din prăjiturica de mai jos. Deci, să purcedem către WebRTC.

WebRTC vine de la Web Real Time Communication. WebRTC înseamnă comunicare video, audio și date în timp real. Chiar de curând, pe 2 noiembrie, 2017, W3C a lansat prima versiune a recomandării pentru standardizarea API-ului JavaScript pentru WebRTC (WebRTC becomes design-complete strengthening the Web Platform as a solid actor in the telecommunications arena). În acest moment API-ul poate fi considerat a fi unul stabil după un efort de fixare ce a durat aproape șase ani.

WebRTC vine cu trei API-uri importante:

  • mediastream-erul (getUserMedia())
  • RTCPeerConnection
  • RTCDataChannel
Add a comment

Vă mai aduceți aminte de Geocities? Unii da, alții, cu siguranță vor ridica sprâncenele. Povestea pe scurt este așa. În 1994, Geocities era un serviciu gratuit de găzduire a paginilor web. Utilizarea continuă a acestei platforme a condus la acumularea conținutului digital a milioane de utilizatori. Ceva mai târziu, în 1999, compania este cumpărată de Yahoo. La zece ani de la achiziționare, Yahoo închide acest serviciu de găzduire, ceea ce s-a soldat cu pierderea conținutului digital existent de 15 ani. O foarte grea lovitură pentru întreaga cultură pentru că putem privi conținuturile existente online ca fiind expresia umană a zilelor noastre. Este estimat că pierderea a fost de cel puțin 39 de milioane de pagini web și conținuturi ale utilizatorilor.

Cum poți preveni astfel de adevărate combustii digitale?

Soluția vine din felul în care se vor dezvolta rețelele în Internet și cât de repede se va face trecerea de la modelul centralizat, care agregă resursele în jurul unor noduri (servere, ferme de servere aparținând unor furnizori de servicii de găzduire) mari, care în ciuda arhitecturii gândite la începuturile rețelelor, prin „închiderea” câte unui serviciu, produce pierderi incalculabile, dacă privim din perspectivă istorică. Tot de la arhitectură vine și răspunsul, dar acest pas evolutiv, trebuie să fie acceptat la o rată accelerată de actorii Internet. Mă refer la modele descentralizate, care realizează o mai bună distribuție și o redundanță mai eficientă.

Pentru a vă da și mai multă încredere, iată apelul lui Brewster Kahle, Bibliotecar Digital la binecunoscutul Internet Archive:

Add a comment

Bitcoin și blockchain-ul nu sunt una și același lucru. Moneda electronică folosește blockchain-ul. A fost parte din stiva de tehnologii, ce alcătuia Bitcoin la momentul lansării. Poți înțelege blockchain-ul ca pe un registru contabil în care se înregistrează toate elementele de activ și pasiv la un moment dat. Da, pentru cei dintre dumneavoastră care ați identificat definiția, este cea a Cărții Mari din contabilitate. Și cum în limba engleză, Cartea Mare este ledger, acesta este și numele cu care se face referință la blockhain de către specialiștii în monede electronice.

Peste tehnologia blockchain-ului, care este de fapt, o bază de date distribuită pe toate nodurile participante din rețea, se pune o aplicație software, care este dotată cu tot ce este nevoie de a tranzacționa valori. Cum se face legătura dintre această aplicație electronică, să-i spunem wallet, și baza de date distribuită, să-i spunem blockchain? Foarte simplu, printr-un API (Application Programming Interface : Interfață de programare a aplicațiilor), pe care tot baza de date distribuită îl pune la dispoziție.

Concepte de bază

Hash

Un hash este ceea ce obții având o dimensiune fixă în urma aplicării unei funcții criptografice pe un anumit conținut. Acest rezultat este identificat în literatură ca fiind o valoare hash, un digest sau chiar coduri hash. Prin utilizarea hashurilor se poate garanta integritatea conținutului, iar în cazul blockchain-urilor, acestea sunt folosite pentru adresarea blocurilor. Pur și simplu, în loc de o adresă http, cu care suntem foarte familiari, se folosește un hash. Cum arată un hash? este o secvență alfanumerică de o anumită dimensiune. Pentru a experimenta, joacă-te aici: http://passwordsgenerator.net/sha256-hash-generator/

Graf

Numim graf o pereche ordonată de mulțimi, notată G=(X,U), unde X este o mulțime finită și nevidă de elemente numite noduri sau vârfuri, iar U este o mulțime de perechi (ordonate sau neordonate) de elemente din X numite muchii (dacă sunt perechi neordonate) sau arce (dacă sunt perechi ordonate). În primul caz, graful se numește neorientat, altfel acesta este orientat. Așadar un graf poate fi reprezentat sub forma unei figuri geometrice alcătuite din puncte (care corespund vârfurilor) și din linii drepte sau curbe care unesc aceste puncte (care corespund muchiilor sau arcelor). Numim drum într-un graf o succesiune de muchii adiacente și distincte care conectează două vârfuri din graf (numite capetele drumului). Un drum se numește simplu dacă muchiile care îl compun sunt distincte. Numim ciclu un drum care are drept capete un același vârf. Un ciclu se numește hamiltonian dacă este simplu și trece prin toate nodurile grafului G, exact o dată, și se numește eulerian dacă trece prin toate muchiile grafului G, exact o dată. Nu orice graf conține un ciclu hamiltonian (Wikipedia: Graf). Muchiile unui graf pot să indice o direcție. Un graf a cărui muchii indică la un capăt sau la ambele o direcție notată printr-o săgeată este un graf orientat. În cazul grafurilor orientate, perechile de vârfuri din mulţimea perechilor de vârfuri sunt ordonate şi sunt denumite arce. Un graf neorientat sau unul orientat cuplate cu o funcție care atribuie un număr real pozitiv pentru fiecare muchie spunem că formează o rețea. Vârfurile unui graf se mai numesc și noduri.

Modelele de grafuri simple

Un graf orientat a cărui arce sunt într-o succesiune, fiecare următor arc pornind din extremitatea anteriorului se numește drum. În cazul grafurilor neorientate, se numește lanț. Dacă ultimul arc al unui graf orientat intră în originea primului arc al grafului, numim acest graf, un circuit. În cazul grafurilor neorientate, se numește ciclu. Trecerea o singură dată printr-un nod în intenția de a parcurge un nod, se numește drum elementar, iar parcurgerea unui nod, dar de această dată folosind o muchie o singură dată chiar dacă vei trece de mai multe ori printr-un nod, se numește drum simplu. Lungimea unui drum este totalitatea arcelor acelui drum. Acum, un circuit de lungime unu este chiar o buclă. Distanța de la un nod la altul este numărul de arce care leagă cele două noduri. Dată toate nodurile sunt legate de un arc, atunci graful se numește graf complet. Un arbore este un graf finit neorientat cu cel puțin două noduri care este conex (adică pot face un lanț) și nu pot exista cicluri.

Add a comment

Blockchain

Începând cu acest articol, voi face un studiu asupra tehnologiilor blockchain și mai ales ce oferă în acest moment pentru a gestiona resurse de cercetare și din domeniul patrimoniului în dimensiunea sa digitală.

Cum am putea traduce în română conceptul de blockchain? Să desfacem în părțile constituente: block, care este bloc și chain, care este lanț. O traducere apropiată ar fi blocuri înlănțuite. De fapt, se concluzionează prin realizarea unei baze de date distribuite, care ține o evidență în creștere a unor înregistrări ordonate. Blocurile din lanț sunt, de fapt, tranzacții înregistrate ale rețelei, care sunt „înlănțuite” consecutiv. Toate blocurile au o adresă de forma 9fafkei5bDf5n6SriUKjh6wE4HwPDCR089 și pot fi inspectate.

Care sunt problemele care le rezolvă tehnologia blocurilor înlănțuite - blockchains?

  • lipsa de încredere în participanții care tranzacționează resurse în rețea, ci singurul punct de încredere, fiind însuși sistemul,
  • descentralizarea și astfel eliminarea punctelor unice de atac,
  • capacitatea de a garanta o realitate prin consensul participanților la sistem.

Chiar dacă bazele tehnice au fost puse la punct încă de la finele anilor 70, tehnologia blockchain-ului a primit o atenție sporită odată cu apariția monedelor electronice, mai precis odată cu dezvoltarea Bitcoin-ului. Am putea rezuma că Bitcoin a fost prima monedă programabilă. Începând cu toamna anului 2014, a început dezvoltarea Bitcoin 2.0, ceea ce a implicat pe lângă protocol, contracte inteligente (smart contracts) și active inteligente, aplicații descentralizate (DAPPs - decentralized applications), precum și corporații autonome descentralizate (DAC). Un astfel de sistem așa cum este Bitcoin este produsul a trei componente: blockchain-ul, protocolul și moneda.

Resurse

https://medium.com/@lhartikk/a-blockchain-in-200-lines-of-code-963cc1cc0e54 https://en.wikipedia.org/wiki/Blockchain https://en.wikipedia.org/wiki/Distributed_database

Blockchain 101 - A Visual Demo

Add a comment

OWL este un limbaj care are mijloacele expresive să descrie cunoașterea unui anumit segment al realității unui anumit domeniu.

OWL este un limbaj descriptiv pentru exprimarea ontologiilor. Ontologiile sunt vocabulare (un set de enunțuri descriptive precise despre anumite părți ale mediului) organizate formal, care răspund nevoilor unui anumit domeniu, de regulă. Acest limbaj al Web--ului Semantic are capacitatea să reprezinte cunoașterea despre lucruri, grupuri de lucruri și mai ales relațiile care se stabilesc între acestea.

OWL este structurat pe clase, proprietăți, indivizi și valori. Ontologiile OWL sunt considerate în sine a fi documente RDF. OWL face parte din componența Web-ului Semantic: RDF, OWL și SPARQL.

Ce este Web-ul Semantic?

„Web-ul Semantic este webul datelor”.

Add a comment

SKOS este un model pentru structura și conținutul tezaurelor, schemelor de clasificare, listelor de vedete de subiect, taxonomii, folksonomii și a altor tipuri de vocabulare controlate. Acest model este un model de date creat cu intenția de a „interconecta sistemele de organizare a cunoașterii pe Web”. SKOS face parte din inițiativele W3C dedicate transformării web-ului într-un web semantic și intră în categoria vocabularelor.

SKOS este parte a ecosistemului pe care RDF (Resource Description Framework) în stabilește. SKOS este un vocabular RDF. Fiecare concept SKOS este identificat cu un URL unic și se pot forma legături între concepte. SKOS poate fi folosit de sine stătător sau în combinație cu limbaje formale de reprezentare a cunoașterii așa cum este OWL - Web Ontology Language.

Resurse:

Add a comment

20 Ani Web BnF
Biblioteca națională a Franței (BnF) și Institutul național al audiovizualului (INA) au organizat pe 23 noiembrie un simpozion intitulat: « Il était une fois dans le web : 20 ans d’archives de l’internet en France »
http://www.bnf.fr/fr/professionnels/anx_journees_pro_2016/a.jp_161122_23_archivage_web.html

Cadrul juridic e acela al legii depozitului legal, repartizat între două instituții, BnF si INA. Legea DAVDSI din 2006 prevede colectarea automată de către BnF a site-urilor cu extensia .fr si cu alte extensii legate de teritoriul francez, a celor cu extensia .org și .com domiciliate în Franța. INA colectează site-urile legate de radio și televiziune.

http://www.bnf.fr/fr/collections_et_services/livre_presse_medias/a.archives_internet.html
http://www.bnf.fr/fr/professionnels/depot_legal/a.dl_sites_web_mod.html
http://www.institut-national-audiovisuel.fr/collecte-depot-legal-web.html

Bibliografie francofonă :

  1. Gildas Illien, « Le dépôt légal de l'internet en pratique ». Bulletin des bibliothèques de France (BBF), 2008, n° 6, p. 20-27
    http://bbf.enssib.fr/consulter/bbf-2008-06-0020-004
  2. Clément Oury, Sylvie Bonnel, « La sélection de sites web dans une bibliothèque nationale encyclopédique : une politique documentaire partagée pour le dépôt légal de l’internet à la BnF », comunicare la IFLA 2014
    http://library.ifla.org/998/1/107-bonnel-fr.pdf
  3. « Les Archives de l’Internet. Une étude prospective sur les représentations et les attentes des utilisateurs potentiels », Philippe Chevallier et Gildas Illien, ancheta BnF, 2011.
    http://www.bnf.fr/documents/enquete_archives_web.pdf
  4. O fișă pe site-ul ENSSIB (Ecole nationale des sciences de l’information et de sbibliothèques), 2012
    http://www.enssib.fr/le-dictionnaire/archivage-du-web
  5. O bibliografie pe site-ul BnF, 2014
    http://www.bnf.fr/documents/dlweb_bibliographie_complete.pdf
Add a comment

logo wayback 210x77

17 miliarde de URL-uri „recoltate”.
273 de miliarde de pagini web de la 361 milioane de siteuri.
510 miliarde de obiecte web care poartă o marcă de timp.
16 petabytes de date stocate.
[SURSA: https://blog.archive.org/2016/10/23/defining-web-pages-web-sites-and-web-captures/]

Internet Archive are 20 de ani și de 10 ani a lucrat cu specialiștii din biblioteci, arhive și toți cei interesați pentru a conserva resursele existente sau care au existat pe web.
Este nevoie de astfel de servicii pentru a oferi generațiilor viitoare șansa de a intra într-un dialog cu noi, cei care le-am creat în ultimii 20 de ani.

Add a comment

Să ne imaginăm dragi colegi cam cum ar arăta propunerea lui Tim Berners-Lee, dacă acum am aplica drepturile de autor auxiliare. Ceea ce aveți mai jos este modelul propus la începutul anilor 90 ai secolului trecut pentru a dezvolta resurse electronice de informare în cadrul CERN.

ancilary Copyright New Information Model - este modelul propus de TBL și reprelucrat. Peste fiecare link intern care indica o relație, am aplicat un semn al copyright-ului pentru a indica absurditatea propunerilor drepturilor de autor auxiliare

Ar fi amuzant dacă nu puțin înspăimântător. Cum ar fi dacă pentru orice ai face în acest moment pe Internet să ți se ceară o taxă per link, per platformă sau per pachet de conținut. Ar fi cel puțin ca un nu cerc al iadului digital, dacă ar fi chiar considerată o astfel de aberație. Dar haideți să continuăm și în acest articol seria gândurilor pe marginea unor demersuri periculoase, dacă ar fi să ignorăm ridicolul.

Digital Single Market - Piața Unică Digitală

La data de 6 mai 2015, Comisia a adoptat „O strategie privind piața unică digitală pentru Europa (COM(2015) 192 final). Acest document este cel care inițiază eforturile de actualizare a cadrului european privind drepturile de autor. Toată tetavura este despre stabilirea cadrului unitar european privind drepturile de autor. În acest articol, explorăm mai departe câteva aspecte pe care le implică efectele adoptării drepturilor auxiliare - ancillary copyright.

Add a comment

Subcategorii

Membrii comunității sunt încurajați să folosească această categorie pentru a-și încadra articolele cu tematică dedicată.

Această secțiune va găzdui resurse dedicate celor care sunt obișnuiți să învețe cu ajutorul îndrumărilor filmate.

Această secțiune este dedicată practicii conservării paginilor web.