reprezentare logo Kosson
{xtypo_dropcap}A{/xtypo_dropcap}cest manual discută aspecte legale, sociale și tehnice ale datelor deschise.Poate fi folosit de oricine dar este în special conceput pentru cei care doresc să deschidă date. Discută despre de ce, ce anume și cum se deschid datele – de ce să deschizi, ce înseamnă deschis și cum să „deschizi” datele.
Pentru a începe, poate vrei să privești la Introducere. Poți naviga prin raport folosind Cuprinsul (vezi bara laterală).
Primim călduros observațiile cu privire la text și vom încorpora reacțiile pe măsură ce înaintăm. De asemenea acceptăm contribuții și sugestii pentru secțiuni adiționale și zone ce trebuiesc examinate.
{xtypo_dropcap}I{/xtypo_dropcap}ntroducere
Știi exact cât de mulți bani, din taxele plătite de tine, sunt cheltuiți pentru iluminatul stradal sau pentru cercetare în tratarea cancerului? Care este cea mai scurtă, sigură si pitorească rută pentru bicicletă din orașul în care locuiești sau lucrezi? Ce conține aerul pe care îl respiri mergând pe acest drum? Unde în zona ta vei găsi cele mai bune oportunități de angajare și cel mai mare număr de pomi fructiferi pe cap de locuitor? Când poți influența decizii asupra unor subiecte la care ții cu adevărat și cu cine trebuie sa vorbesti despre ele?
Noile tehnologii, disponibile astăzi, oferă posibilitatea de a construi servicii care să dea răspunsul la aceste intrebări în mod automat. Mare parte din datele de care ai nevoie pentru a răspunde la aceste intrebări sunt create de entități publice. Totuși, foarte des datele necesare nu sunt disponibile incă intr-un format ușor de utilizat. Această carte este despre cum să deblochezi potențialul informațiilor oficiale sau de altă natură, despre cum să facilitezi servicii noi, despre cum să îmbunătățești condițiile de viața ale cetățenilor și despre cum să faci guvernul și societatea să colaboreze mai bine.
Noțiunea de open data și în particular open government data - informații, publice sau de alta natură, la care oricine are acces liber și le poate reutiliza în orice scop - este disponibilă de câțiva ani. Începând cu 2009 noțiunea de date deschise a inceput să fie utilizată în masă, diferite guverne (cum ar fi cel din SUA, Regatul Unit, Canada sau Noua Zeelandă) anunțând noi inițiative în vederea deschiderii informațiilor publice.
Această carte explică conceptele de bază cu privire la 'date deschise' și în special relația lor cu autoritățile guvernamentale. Explică cum datele deschise adaugă valoare și cum acestea pot avea un impact pozitiv în diferite domenii. În plus fața de explorarea trecutului, manualul ofera informații concrete despre cum se pot produce date deschise.
{xtypo_dropcap}A{/xtypo_dropcap}cest manual discută aspecte legale, sociale și tehnice ale datelor deschise.Poate fi folosit de oricine dar este în special conceput pentru cei care doresc să deschidă date. Discută despre de ce, ce anume și cum se deschid datele – de ce să deschizi, ce înseamnă deschis și cum să „deschizi” datele.
Pentru a începe, poate vrei să privești la Introducere. Poți naviga prin raport folosind Cuprinsul (vezi bara laterală).
Primim călduros observațiile cu privire la text și vom încorpora reacțiile pe măsură ce înaintăm. De asemenea acceptăm contribuții și sugestii pentru secțiuni adiționale și zone ce trebuiesc examinate.
{xtypo_dropcap}I{/xtypo_dropcap}ntroducere
Știi exact cât de mulți bani, din taxele plătite de tine, sunt cheltuiți pentru iluminatul stradal sau pentru cercetare în tratarea cancerului? Care este cea mai scurtă, sigură si pitorească rută pentru bicicletă din orașul în care locuiești sau lucrezi? Ce conține aerul pe care îl respiri mergând pe acest drum? Unde în zona ta vei găsi cele mai bune oportunități de angajare și cel mai mare număr de pomi fructiferi pe cap de locuitor? Când poți influența decizii asupra unor subiecte la care ții cu adevărat și cu cine trebuie sa vorbesti despre ele?
Noile tehnologii, disponibile astăzi, oferă posibilitatea de a construi servicii care să dea răspunsul la aceste intrebări în mod automat. Mare parte din datele de care ai nevoie pentru a răspunde la aceste intrebări sunt create de entități publice. Totuși, foarte des datele necesare nu sunt disponibile incă intr-un format ușor de utilizat. Această carte este despre cum să deblochezi potențialul informațiilor oficiale sau de altă natură, despre cum să facilitezi servicii noi, despre cum să îmbunătățești condițiile de viața ale cetățenilor și despre cum să faci guvernul și societatea să colaboreze mai bine.
Noțiunea de open data și în particular open government data - informații, publice sau de alta natură, la care oricine are acces liber și le poate reutiliza în orice scop - este disponibilă de câțiva ani. Începând cu 2009 noțiunea de date deschise a inceput să fie utilizată în masă, diferite guverne (cum ar fi cel din SUA, Regatul Unit, Canada sau Noua Zeelandă) anunțând noi inițiative în vederea deschiderii informațiilor publice.
Această carte explică conceptele de bază cu privire la 'date deschise' și în special relația lor cu autoritățile guvernamentale. Explică cum datele deschise adaugă valoare și cum acestea pot avea un impact pozitiv în diferite domenii. În plus fața de explorarea trecutului, manualul ofera informații concrete despre cum se pot produce date deschise.

Audiența țintă și recunoaștere

{xtypo_dropcap}A{/xtypo_dropcap}udiență țintă

Acest manual are o largă audiență:
  • pentru cei care nu au auzit până acum de „date deschise” și pentru cei care se consideră „experți in domeniul datelor”
  • pentru funcționarii publici și pentru activiști
  • pentru jurnaliști cercetători
  • pentru politicieni și dezvoltatori
  • pentru cei pasionați de date și pentru cei care nu au auzit niciodata de o interfaţă de programare standardizată (API).
Cea mai mare parte din informațiile furnizate sunt axate pe datele deținute de sectorul public. Cu toate acestea, intenţiile autorilor sunt de a extinde acest lucru dacă timpul va permite. Sunteți bineveniți să participați pentru a ne ajuta în această direcție.
Acest manual este destinat celor cu puține sau chiar fară cunoștințe despre acest subiect. Dacă descoperiți o porțiune de text care utilizează un jargon sau o terminologie cu care nu sunteți familiar, vă rugăm să consultați glosarul și secțiunea de întrebări și răspunsuri (FAQ) care se găsește la sfârșitul manualului.
Recunoaștere
Credit și drepturi de autor 
Colaboratori
Daniel Dietrich
Jonathan Gray
Tim McNamara
Antti Poikola
Rufus Pollock
Julian Tait
Ton Zijlstra

Surse existente folosite direct
Propunere tehnică pentru implementarea IATI. Grupul de consultare tehnică al IATI condus de Simon Parrish
Unlocking the Potential of Aid Information. Rufus Pollock, Jonathan Gray, Simon Parrish, Jordan Hatcher
Manual finlandez scris de Antti Poikola
Beyond Access Report. Access Info and the Open Knowledge Foundation

Alte surse
W3C Publishing Government Data (2009) http://www.w3.org/TR/gov-data/

De ce date libere?


{xtypo_dropcap}D{/xtypo_dropcap}e ce date libere?


Open data, în special open government data, reprezintă o resursă imensă care este încă neexplorată. Multe persoane și organizații colecteză un număr mare de tipuri de date pentru a-și îndeplini sarcinile. Administrația guvernamentală ocupă un seminifcativ loc în acest context, atât datorită cantității și centralizării seturilor de date, cât și datorită faptului că majoritatea datelor guvernamentale sunt publice prin lege, și astfel pot fi deschise, devenind disponibile pentru public. De ce este de interes?
Există multe domenii unde datele deschise pot aduce valoare, și domenii unde găsim exemple de cum datele deschise au fost deja folosite. Sunt deja multe grupuri diferite de oameni și organizații, inclusiv guvernul, care pot beneficia din disponibilitatea datelor deschise. In același timp, este imposibil de prezis cu acuratețe când și unde valoarea va fi adăugată. Avantajul inovației stă în faptul că dezvoltarea vine din locuri neașteptate.
Este deja posibil să identificăm un număr mare de domenii unde datele guvernamentale deschise aduc valoare. Unele dintre acestea arii includ:
  • transparență și control democratic
  • participare
  • împuternicire personală
  • produse și servicii noi sau îmbunătățite
  • inovație
  • îmbunătățirea eficienției serviciilor guvernamentale
  • îmbunătățirea eficacității serviciilor guvernamentale
  • evaluarea eficienței politicilor adoptate
  • noi informații obținute prin recombinarea surselor de date cu tiparele existente în seturile mari de date
Pentru majoritatea acestor domenii, există exemple.
În ceea ce privește transparență, proiecte precum cel finlandez "tax tree" (Arborelele taxelor) sau cel britanic "where does my money go" (Unde se aduc banii mei?) arată cum guvernul cheltuie banii obținuți din taxe. Un exemplu foarte bun este cel oferit de Canada, unde datele deschise au dus la identificarea unei fraude de 3.2 $ miliarde din banii oferiți pentru scopuri caritabile. De asemenea, situri web precum cel danez, folketsting.dk, monitorizează activitatea din parlament, și procesele decizionale politice, pentru a facilita transparența, pentru a urmări activitatea parlamentarilor.
Datele guvernamentale deschise te poate ajuta, de asemenea, să iei decizii mai bune în viața personală, sau să devii mai activ în societate. O femeie, în Danemarca, a construit situl findtoilet.dk, care arăta locațiile tuturor toaletelor daneze publice, astfel încât persoanele pe care ea le cunoștea cu probleme urinare să aibă mai multă încredere în a ieși în oraș. În Olanda, există un serviciu disponibil, vervuilingsalarm.nl, care să te avertizeze printr-un mesaj dacă, în apropierea ta, calitatea aerului va atinge un prag ales de tine, în următoarea zi. In New York, poți cu ușurință afla în ce parcuri îți poți plimba câinile sau să afli ce oameni folosesc aceleași parcuri. Servicii precum „mapumental” în Marea Britanie sau „mapnificent” în Germania îți permite să descoperi ce zone de locuit sunt bune pentru tine, lunând în considerare timpul petrecut către muncă, prețul caselor, cât de frumoasă este zona. Toate aceste servicii reprezintă exemple de folosire a datelor guvernamentale deschise.
Datele libere sunt de mare importanță și din punct de vedere economic. Un număr semnificativ de studii au estimat valoare economică a datelor deschise la mai multe milioane de euro anual numai în Uniunea Europeană. Noi produse și companii refolosesc datele deschise. Situl danez husetsweb.dk te ajută să găsești modalități de a reduce energia folosită în gospodărie, incluzând planificarea financiară și găsirea firmelor care pot face ajustările necesare. Situl se bazează pe reutilizarea informațiilor cadastrale și pe informațiile despre subvențiile guvernamentale, precum și pe datele preluate din registrul comerțului. Google Translate folosește volumul imens de documente oficiale ale Uniunii Europene care apar în toate limbile europene pentru a antrena algoritmii de traducere și astfel îmbunătățind calitatea serviciului.
Datele deschise sunt valoroase și pentru administrația guvernamentală. De exemplu, se poate imbunătăți eficiența serviciilor guvernamentale. Ministerul german al Educației, a publicat pe Internet toate datele legate de educație pentru reutilizare. De atunci, numărul întrebărilor primite a scăzut, reducând volumul de muncă și costurile. De asemenea, răspunsurile la intrebările recepționate sunt mai ușor de oferit, deoarece funcționarii publici identifică mai bine unde pot găsi informația relevantă. Datele deschise face ca administrația guvernamentală să fie mai eficientă, lucru care, în ultimă instanță, determină reducerea costurilor. Departamentul german pentru patrimoniul cultural își publică proactiv datele și colaborează cu societățile și grupurile de pasionați de istorie precum Fundația Wikimedia pentru a-și îndeplini sarcinile într-un mod mai eficient. Acestea vor duce nu numai la îmbuntățirea calității datelor, ci și la, în ultimă instanță, reducerea numărului de angajați.
În timp ce sunt numeroase exemple de moduri în care datele libere deja aduc valoare socială și economică, nu știm încă ce lucruri noi vor deveni posibile. Noi combinații de date pot determina noi informații, noi perspective care pot duce la noi domenii de aplicații. Am mai asistat la așa ceva în trecut, când Dr.Snow a descoperit relația dintre apa potabilă și holeră din Londra secolului al XIXlea, combinând datele deținute despre morțile cauzate de holeră cu locațiile fântânilor. Acest demers a dus la construcția sistemului de canalizare al Londrei și astfel la îmbunătățirea stării de sănătate generale a populației. Este foarte probabil să asisităm din nou la astfel de inovații și la perspective neașteptate din diferitele combinări de date deschise.
Acest potențial neexplorat poate fi dezlănțuit dacă transformăm datele guvernamentale publice în date libere. Asta se va întîmpla, totuși, dacă datele sunt întradevar libere, dacă nu li se aplică restricții (legale, financiare sau tehnologice) la reutilizarea de către alte persone. Orice restricție va exclude persoane de la reutilizarea datelor publice, și va îngreuna identificarea modurilor de reutilizare. Pentru realizarea întregului potențial, datele publice trebuie sa fie date libere.

Ce sunt datele deschise?

{xtypo_dropcap}C{/xtypo_dropcap}e sunt datele deschise?


Acest ghid este despre datele deschise, dar ce este aceasta mai precis? În particular ce face datele deschise să fie deschise, și despre ce date e vorba?

Ce înseamnă deschis?


Acest ghid este despre datele deschise – dar ce sunt datele deschise? Pentru scopurile noastre, datele deschise sunt definite de către Open Definition:
Datele deschise sunt date ce pot fi utilizate în mod liber, reutilizate și redistribuite de către oricine – supuse doar, cel mult, la necesitatea atribuirii în condiții identice.
Definiția completă a deschiderii (full Open Definition) oferă detalii precise asupra a ce înseamnă aceasta. Sumarizarea celor mai importante:
Valabilitate și acces: datele trebuie să fie valabile ca un întreg și la nimic peste un cost rezonabil de reproducere, preferabil prin descărcare de pe internet. Datele trebuie să fie valabile într-o formă convenabilă și modificabilă.
Reutilizare și redistribuție: datele trebuie să fie oferite sub termeni ce permit reutilizarea și redistribuirea inclusiv combinarea cu alte seturi de date.
Participare universală: toată lumea trebuie să poată să utilizeze, reutilizeze și redistribuie - nu trebuie să existe nicio discriminare împotriva ariilor de cercetare sau împotriva persoanelor sau grupurilor. De exemplu, restricții 'necomerciale' care ar preveni utilizarea 'comercială', sau restricții asupra utilizării în anumite scopuri(e.g. doar în educație), nu sunt permise.
Dacă vă întrebați de ce este atât de important să fim clari asupra a ceea ce înseamnă deschis și de ce această definiție este folosită, răspunsul este simplu: interoperabilitate.
Interoperabilitatea denotă abilitatea diverselor sisteme și organizații de a lucra împreună (inter-opera). În acest caz, este abilitatea de a interopera - sau combina - diferite seturi de date.
Interoperabilitatea este importantă pentru că permite diferitelor componente să lucreze împreună. Această abilitate de a componentiza și de a „lega” componente este esențială pentru a construi sisteme complexe și mari. Fără interoperabilitate aceasta devine aproape imposibil — după cum este evidențiat în cel mai faimos mit al Turnului Babel unde (in)abilitatea de a comunica (de a interopera) a rezultat în prăbușirea completă a construcției turnului.
Suntem puși în fața unei situații similare cu privire la date. Nucleul unei „comune” a datelor (sau codurilor) este aceea că o bucată de material „deschis” conținută poate fi combinată liber cu alte materiale „deschise”. Această interoperabilitate este cheia absolută în realizarea beneficiilor practice principale ale „deschiderii”: abilitatea dramatic sporită de a combina seturi de date diferite și astfel de a crea produse și servicii mai multe și mai bune (aceste beneficii sunt discutate pe larg în secțiunea 'de ce' date deschise).
Oferirea unei definiții clare asupra deschiderii asigură că atunci când faci rost de două seturi de date deschise din două surse diferite, le vei putea combina, și asigură evitarea propriului nostru „Turn Babel”: multe seturi de date dar o abilitate scăzută sau inexistentă de a le combina în sisteme mari unde se află adevărata valoare.

{xtypo_dropcap}D{/xtypo_dropcap}espre ce date este vorba?


Cititorii au văzut deja exemple de tipuri de date care sunt sau ar putea deveni deschise - și vor vedea mai multe exemple mai jos. Însă, va fi util să schițăm pe scurt ce tipuri de date sunt, sau ar putea fi, deschise – și, la fel de important, ce nu va fi deschis.
Punctul cheie este că atunci când datele sunt deschise, accentul este pus pe datele nepersonale, adică, date ce nu conțin informații despre indivizi specifici.
În mod similar, pentru anumite tipuri de date guvernamentale, restricții privind siguranța națională pot fi aplicate.

Cum să deschizi datele

{xtypo_dropcap}C{/xtypo_dropcap}um să deschizi datele


Această secțiune reprezintă partea centrală a acestui ghid. Oferă sfaturi concrete și detailate pentru deținătorii de date despre cum pot să deschidă datele. Vom trece prin chestiunile de bază, dar vom arăta și pericolele. În final, vom discuta despre problemele mai subtile care pot apărea.
Noi recomandăm să fie urmate trei reguli de bază când se deschid date:
  • Nu complica lucrurile. E bine să începi cu puține date, pentru că e simplu și rapid. În acest moment, nu există cerințe să fie deschise toate seturile de date dintr-o dată. Dacă începi cu deschiderea unui set de date, sau chiar a unei părți dintr-un set mai mare de date, tot este bine – bineînțeles, cu cât poți să deschizi mai multe seturi de date, cu atât mai bine. Nu uita că acest proces implică inovație. Este bine să te miști cât de repede posibil, pentru că înseamnă că poți lua avânt și învăța din experiență – inovația poate să ducă la eșec așa cum poate să ducă la succes și nu orice set de date va fi util.
  • Colaborează devreme și colaborează des. Colaborează cu utilizatori reali, potențiali și care refolosesc datele cât mai devreme și cât de des poți, fie aceștia cetățeni, afaceriști sau dezvoltatori. Astfel te vei asigura că următoarea iterație a serviciului tău va fi cât mai relevantă. Este esențial să ai în vedere că o mare pare din date nu va ajunge la utilizatorii finali în mod direct, ci prin „info-mediari”. Aceștia sunt oamenii care iau datele și le transformă sau le recombină pentru prezentare. De exemplu, cei mai mulți dintre noi nu doresc sau nu au nevoie de o bază mare de date cu coordonate GPS, în schimb preferăm o hartă. De aceea, e bine să colaborezi prima dată cu infomediarii. Ei vor refolosi și vor găsi noi utilități materialului.
  • Abordează temerile și confuziile comune. Acest lucru este foarte important dacă lucrezi cu sau într-o instituție mare cum sunt cele guvernamentale. Când deschizi date, te vei lovi de o serie de întrebări și temeri. Este foarte important (a) să le identifici pe cele mai importante și (b) să le abordezi, pe cât posibil, din primele etape.

Deschiderea datelor presupune efecturarea a patru pași de bază, fiecare dintre ei fiind acoperiți în detaliu mai jos. Ordinea lor este aproximativă - mulți dintre acești pași pot fi făcuți simultan.
  1. Alege-ți setul (sau seturile) de date. Alege-ți setul/seturile de date pe care plănuiești să îl/le deschizi. Ai în vedere că poți (sau chiar ești nevoit) să te întorci la acest pas dacă întâmpini probleme într-o etapă ulterioară.
  2. ** Folosește o licență deschisă.**
    1. Determină ce drepturi de proprietate intelectuală sunt în date.
    2. Aplică o licență „deschisă” potrivită care cuprinde toate aceste drepturi și se încadrează la definiția deschiderii care a fost discutată în secțiunea anterioară despre „Ce sunt datele deschise”.
    3. Observație: dacă nu poți să treci de acest pas, întoarce-te la primul pas și alege un alt set de date.
  3. Pune datele la dispoziție - tot volumul și într-un format accesibil. S-ar putea să iei în considerare alternative de publicare, cum este, de exemplu, o interfață de programare.
  4. Fă datele ușor de găsit - publică pe Internet și eventual organizează seturile tale de date deschise într-un catalog central care le listează.

Alegerea setului (seturilor) de date

{xtypo_dropcap}A{/xtypo_dropcap}legerea setului (seturilor) de date


Alegerea setului (seturilor) de date pe care intenționezi să îl deschizi este primul pas – deși ține minte că întregul proces de deschidere a datelor este iterativ și te poți întoarce la acest pas dacă întâmpini probleme ulterior.
Dacă știi deja care sunt seturile de date pe care intenționezi să le deschizi, poți să treci direct la secțiunea următoare. Totuși, în multe situații, în special în cazul instituțiilor mari, alegerea seturilor de date pe care să te concentrezi poate fi o provocare. Cum se procedează în acest caz?
Crearea acestei liste ar trebui să fie un proces rapid care identifică ce seturi de date pot fi deschise încă de la început. Va fi timp în fazele ulterioare pentru verificarea în detaliu dacă fiecare set de date este potrivit.
Nu există nici o cerință pentru crearea unei liste atotcuprinzătoare a seturilor tale de date. Principalul lucru de care trebuie ținut seama este fezabilitatea publicării acestor date (fie deschis, fie în alt fel) – vezi secțiunea “Care Date” de mai sus.

Consultarea comunității


Îți recomandăm în primul rând să întrebi comunitatea. Aceasta reprezintă persoanele care vor accesa și utiliza datele, astfel încât s-ar putea să aibă o bună înțelegere a datelor care ar putea fi de valoare.
  1. Pregătește o listă scurtă a eventualelor seturi de date asupra cărora dorești opinii. Nu este nevoie ca această listă să corespundă așteptărilor tale, intenția principală este să obții un indiciu asupra cererii. Lista se poate baza pe cataloagele de open data ale altor țări.
  2. Creează o solicitare de comentarii.
  3. Publică solicitarea ta pe o pagină web. Fii sigur că este posibilă accesarea solicitării printr-un URL propriu. Astfel, solicitarea poate fi găsită ușor când este distribuită prin rețele sociale.
  4. Pune la dispoziție modalități simple pentru trimiterea răspunsurilor. Evită înregistrări obligatorii, deoarece acestea reduc numărul răspunsurilor.
  5. Distribuie solicitarea prin liste de discuții relevante, forumuri și persoane individuale, direcționând către pagina principală.
  6. Organizează un eveniment de consultare. Fii sigur că acesta se desfășoară într-un moment potrivit pentru ca orice antreprenor, administrator de date și funcționar să poată participa.
  7. Solicită unui politician să vorbească în numele instituției tale. E posibil ca datele deschise să facă parte dintr-o politică mai largă de îmbunătățire a accesului la informațiile guvernamentale.

Baza de cost


Câți bani cheltuiesc instituțiile pentru colectarea și administrarea datelor pe cale le dețin? În cazul în care cheltuiala este mare pentru un anumit set de date, atunci este foarte probabil ca alții să dorească să le acceseze.
Acest argument poate fi destul de vulnerabil în fața temerilor privind beneficii nemeritate. Întrebarea la care va trebui să răspunzi este „de ce să obțină alte persoane în mod gratuit informații care sunt atât de costisitoare?”. Răspunsul este că acest cost este suportat de sectorul public pentru îndeplinirea unei anumite funcții. Costul transmiterii acestor date către terți, odată ce acestea au fost colectate, este practic nul. De aceea, nu ar trebui percepută nici o taxă.

Ușurința de publicare


Uneori, în loc de a decide care date ar fi cele mai valoroase, ar fi util să vezi care date sunt mai simplu de pus la dispoziția publicului. Publicări de date ușoare și în număr mic pot funcționa ca un catalizator pentru o schimbare mai largă a comportamentului în cadrul organizațiilor.

Totuși fii atent cu această abordare. Este posibil ca aceste publicări să fie de o valoare atât de mică încât să nu se poată dezvolta nimic pe baza lor. În acest caz, întregul proiect poate fi compromis.

Observă colegii


Datele deschise constituie o mișcare în creștere. Este posibil să fie mulți oameni în zona ta care înțeleg ce se întâmplă în alte domenii. Alcătuiește o listă pe baza a ceea ce fac alte instituții.

Aplicarea licențelor de tip deschis (libertatea legală)

{xtypo_dropcap}A{/xtypo_dropcap}plicarea licențelor de tip deschis (libertatea legală)


În majoritatea jurisdicțiilor, există drepturi de proprietate intelectuală referitoare la date, care restricționează terții să utilizeze, reutilizeze și să distribuie date fără o permisiune explicită. Chiar in zonele unde existența acestor drepturi este incertă, este importantă existența și aplicarea unei licențe, pentru a dobândi mai multă transparență și claritate. În consecință, dacă plănuiești să dai acces la setul tău de date, ar trenbui să aplici o licență corespunzătoare - și dacă dorești să desemnezi datele ca și date de tip deschis, acest aspect este și mai important.
Ce tip de licență poți utiliza? Recomandăm ca pentru datele de tip deschis, să utilizezi una dintre licențele în conformitate cu Open Definition și să fie marcate in mod corespunzător. Această listă (împreună cu instrucțiunile de utilizare) poate fi găsită la:
http://opendefinition.org/licenses/
Un scurt ghid de instrucțiuni de o pagină referitor la aplicarea licențelor pentru datele de tip deschis poate fi accesat la site-ul Open Data Commons:

http://opendatacommons.org/guide/

Fă datele accesibile (deschiderea tehnică)

Fă datele accesibile (deschiderea tehnică)


Open data trebuie să fie atât deschise din punct de vedere tehnic cât și din punct de vedere legal. Mai precis, datele trebuie să fie disponibile în vrac (bulk), într-un format care poate fi citit de către un calculator (machine-readable).
Available
Datele trebuie să fie disponibile la un preț mai mic decât costul rezonabil de reproducere, preferabil ca o descărcare gratuită de pe Internet. S-a ajuns la acest model de tarifare pentru că agenția ta nu trebuie să suporte nici un cost atunci când furnizează date utilizatorilor
In bulk
Datele ar trebui să fie disponibile sub forma unui set complet. Dacă ai un registru care este colectat sub această formă, întregul registru trebuie să fie disponibil pentru descărcare. O interfață de programare (API) web sau un serviciu similar ar putea fi deasemenea foarte utile, dar ele nu substituie accesul în vrac.
In an open, machine-readable format
Re-utilizarea datelor deținute de către sectorul public nu trebuie să fie subiectul unor restricții generate de licențe sau patente. Și mai important, dacă te asiguri că furnizezi datele in formate care pot fi citite automat, permiti un grad mai mare de re-utilizare. Pentru a ilustra acest fapt, ia în considerare datele statistice publicate ca documente în format PDF, un format ales uzual datorită calității de imprimare ridicat. În timp ce aceste statistici pot fi citite de către oameni, sunt foarte greu utilizabile de către un calculator. În acest mod este îngrădită major abilitatea altora de a re-utiliza datele.
Mai jos câteva direcții care vor aduce beneficii majore:
  • păstrează o formă simplă,
  • mișcă-te repede,
  • fii pragmatic.
În mod special este mai bine să furnizezi chiar acum datele brute, decât să furnizezi date într-un format perfect.
Sunt foarte multe moduri diferite de a face datele accesibile către alții. Cel mai natural mod, în epoca Internetului, este publicarea online. Există multe variațiuni ale acestui model. Formula de bază este ca agențiile care dețin date publice să asigure accesul la date prin intermediul proprilor sit-uri web, iar un catalog central direcționează vizitatorii către sursa adecvată. În orice caz, există alternative.
Când conectivitatea (connectivity) este limitată sau mărimea setului de date este este extrem de mare, ar putea fi asigurată distribuirea prin intermediul altor formate. Această secțiune va discuta alternative care ar putea avea un rol în a menține tarifele foarte scăzute.

Metode online


Prin intermediul sit-ului tău web deja existent
Sistemul care este cel mai familiar echipei tale de conținut web este de a furniza fișiere pentru a fi descărcate de pe pagini web. La fel cum oferiți în acest moment acces la documente pentru discuții, pot fi oferite și fișierele.
Problema este că este dificil pentru cineva din exterior să descopere unde poate să găsească informația actualizată. Această opțiune îngreunează crearea de unelte pentru datele respective, pentru anumite persoane.
Prin intermediul sit-urilor altor persoane
Multe depozite au devenit puncte central pentru distribuția datelor în anumite domenii. De exemplu, pachube.com este creat pentru a facilita conexiunea între persoanele care folosesc sisteme senzoriale cu cei doresc să acceseze datele deținute de ele. Sit-uri precum Infochimps.com și Talis.com permit agențiilor publice să stocheze gratis cantități mari de date.
Sit-urile altor persoane sunt foarte utile. Acest lucru se datorează faptului că ei au adunat deja o comunitate de persoane interesate și alte seturi de date. Atunci când informațiile tale fac parte din aceste platforme, se crează un interes comun.
Platforme de date în volum mare oferă infrastructura necesară care răspunde cererii. Adesea ele furnizează informații statistice și informații privind utilizarea. Pentru agențiile din sectorul public, acestea sunt în general gratuite.
Aceste platform implică două tipuri de costuri. Primul este independența. Agenția ta trebuie să poată preda controlul și altora. Acest lucru este adesea dificil din punct de vedere politic, legal sau operațional. Al doilea cost îl implică deschiderea. Asigură-te că platforma ta de date este accesibilă de către toată lumea. Dezvoltatorii de software și oamenii de știință folosesc multe sisteme de operare, de la telefoane inteligente la supercalculatoare. Ar trebui ca toată lumea să poată să acceseze datele.
Prin intermediul Protocolului pentru Transferul Fișierelor (FTP)
O metodă mai puțin la modă pentru acordarea accesului la fișiere este prin FTP. Acest lucru este potrivit atunci când audiența ta are cunoștințe tehnice, precum dezvoltatorii de software și oamenii de știință. Sistemele FTP înlocuiesc HTTP, dar sunt special create pentru transferal de fișiere.
FTP a ieșit din grații. Mai degrabă decât furnizarea unui sit, să te uiți printr-un server este ca și cum te-ai uita prin dosare într-un calculator. Deși este în concordanță cu obiectivul, capacitatea firmelor de dezvolatare web de a taxa pentru personalizare este mult mai mica.
Ca torenți
BitTorrents este un sistem care a devenit familiar celor care conturează politici datorită asocierii cu încălcarea dreptului de copier. BitTorrent folosește fișiere numite torenți, care funcționează prin împărțirea costului de distribuire a fișierelor între toate persoanele care accesează respectivele fișiere. În loc ca serverele să se supraîncarce, oferta creștea pe măsură ce creștea cererea. Acesta este motivul pentru care acest sistem este atât de eficient pentru distribuirea filmelor. Este o metodă foarte eficientă pentru distribuirea unor volume mari de date.
Ca API
Datele pot fi publicate prin Interfețe de Programare cu Aplicație (API). Aceste interfețe au devenit foarte cunoscute. Ele permit programatorilor să selecteze anumite fragmnte de date, mai degrabă decât să furnizeze toate într-un vrac (bulk), ca fișiere mari. API sunt conectate în mod obișbuit la o bază de date care este actiualizată în timp real. Acest lucru înseamnă că a face informația disponibilă prin intermediul unei API ne asigură că informația este actualizată la zi.
Publicarea datelor primare în volum mare ar trebui să fie principala preocupare a tuturor inițiativelor privind datele deschise. Interfețele de programare cu aplicație presupun o serie de costuri:
Prețul. Au nevoie de mai multă mentenanță decât furnizarea fișierelor.
Așteptările. Pentru a încuraja o comunitate de utilizatori să folosească sistemul, este important să ofero certitudine. Atunci când lucrurile nu merg bine, se va aștepta de la tine să acoperi costul reparațiilor.
Accesul la un volum mare de informații asigură că:

nu există dependență față de furnizorul primar de date, acest lucru însemnând că, dacă o restructurare sau un ciclu bugetar schimbă situația, informațiile sunt încă disponibile.
Oricine altcineva poate obține o copie și o poate redistribui. Acest lucru reduce costurile cu distribuția, luându-le de la agenția sursă și presupune faptul că nu există un singur loc unde sunt stocate informațiile (single point of failure).
Alții pot dezvolta propriile servicii folosind informațiile, pentru că au siguranța că informațiile nu le vor fi luate.
Furnizând informațiile în volum mare, le permite altora să folosească informațiile dincolo se scopul lor primar. De exemplu, permite ca acestea să fie transformate în formate noi, să fie conectate cu alte surse, sau să fie create alte versiuni și arhivate în multiple locații. În timp ce ultima versiune a informației poate fi pusă la dispoziție printr-o API, datele primare ar trebui puse la dispoziție în volum mare, la intervale regulate de timp.
De exemplu, serviciul de statistică Eurostat (http://epp.eurostat.ec.europa.eu/portal/page/portal/eurostat/home/) conține posibilitatea de a descărca volume mari, oferind peste 4000 de fișiere de date. Este actualizat de două ori pe zi, oferă date în format cu valori separate tabular și include documentația privind fișierele de date și posibilitatea de descărcare.
Un alt exemplu este Catalogul de Date al Districtului Columbia (District of Columbia Data Catalog), care permite ca datele să fie descărcate în formate CSV și XLS, în plus față de actualizarea în timp real a datelor.

Fă datele cât mai ușor de găsit

Fă datele cât mai ușor de găsit


Datele deschise (Open data) nu înseamnă nimic fără utilizatori. Trebuie să fii sigur de faptul că oamenii vor găsi materialul-sursă. Această secțiune va acoperi diverse abordări de acest gen.
Cel mai important lucru este crearea unui spațiu neutru care să poată depăși atât politicile inter-agenții, cât și ciclurile bugetare viitoare. Frontierele juridice, atât cele sectoriale, cât și cele geografice, pot face cooperarea dificilă. Cu toate acestea, există beneficii semnificative în cazul îmbinării acestor forțe. Cu cât este mai ușor pentru cei din afară să descopere datele, cu atât mai repede se vor construi instrumente noi și utile.

Instrumentele existente


Există un număr de instrumente ce pot fi găsite pe Internet care sunt create în mod special pentru a face datele mult mai ușor de descoperit.
Unul dintre cele mai proeminente este DataHub, un catalog și un magazin de date pentru seturi de date din întreaga lume. Acest site facilitează publicarea materialelor de către persoane fizice și organizații și descoperirea lor de către utilizatorii de date.
Mai mult decât atât, există numeroase cataloage specializate din diverse sectoare și domenii. Multe comunități științifice au creat un sistem de cataloage pentru domeniile pe care le reprezintă, deoarece adesea sunt necesare diverse date pentru ca materialele respective să poată fi publicate.

Pentru guvern


Pentru o agenție de top, crearea unui catalog pentru datele provenite de la guvern reprezintă o practică ortodoxă. Atunci când creezi un catalog, încearcă să stabilești niște structuri care să le permită numeroaselor departamente să-și actualizeze informația ușor.
Rezistă tentației de a construi un software care să împiedice deteriorarea catalogului. Există soluții software libere și cu sursă deschisă (FOSS) care au fost deja adoptate de multe guverne. Prin urmare, investițiile într-o altă platformă nu sunt necesare.
Există câteva lucruri care lipsesc adesea din cataloagele de date deschise. Programul dumneavoastră le-ar putea lua în considerație pe următoarele:
Elaborarea unei căi care ar permite sectorului privat și cel comunitar să adauge propriile lor date. Ar fi util să te gândești la catalogul de date mai degrabă ca la unul regional decât ca la unul ce aparține guvernului.
Facilitarea îmbunătățirii datelor prin permiterea seturilor derivate de date de a fi catalogate. De exemplu, cineva ar putea adăuga o geolocație adreselor și ar dori să împărtășească aceste rezultate cu toată lumea. Dacă nu vei permite versiuni derivate, ci doar singulare, aceste îmbunătățiri vor rămâne inaccesibile.
Fii tolerant cu apariția datelor tale oriunde în altă parte. Asta înseamnă că există posibilitatea ca acest conținut să fie duplicat pentru comunitățile de interes. Dacă deții date cu privire la monitorizarea nivelului râurilor, de exemplu, este foarte probabil ca acele date să apară într-un catalog al hidrologilor.
Asigură-te că accesul este echitabil. Încearcă să eviți crearea unui nivel privilegiat de acces pentru oficiali sau cercetători titularizați, deoarece aceasta va submina participarea și implicarea comunității.
Pentru societatea civilă
Fii dispus de a crea un catalog suplimentar pentru datele neoficiale.
Situațiile în care guvernele se asociază cu surse neoficiale sau ne-autorizate sunt foarte rare. Adeseori, oficialii au făcut tot posibilul să se asigure că nu vor exista situații politice stânjenitoare sau nu vor fi cauzate alte prejudicii din cauza folosirii improprii a datelor sau încrederii depline în acestea.
Mai mult decât atât, e puțin probabil ca guvernele să fie dispuse să sprijine activități prin care informațiile lor sunt puse laolaltă cu cele ale întreprinderilor. Guvernele sunt pe bună dreptate sceptice pe motive de profit. Așadar, crearea unui catalog independent for grupuri de comunități, afaceriști sau altele poate fi justificată.

Am deschis niște date, și acum?

{xtypo_dropcap}A{/xtypo_dropcap}m deschis niște date, și acum?


Ne-am uitat la cum se face informația guvernamentală legal și tehnic reutilizabilă. Următorul pas este încurajarea altora să folosească datele acelea.
Această secțiune privește la lucruri suplimentare ce pot fi făcute pentru a promova reutilizarea.

{xtypo_dropcap}Î{/xtypo_dropcap}mpărtășește lumii


În primul rând, spune că ai intrat într-o campanie care promovează open data în domeniul tău de expertiză.
Dacă deschizi mai multe seturi de date, merită să îți răpești puțin din timpul tău pentru a le spune și altora, sau să faci în așa fel încât să poată avea și alții acces la aceste informații.
În plus, pe lângă comunicatele de presă, postările de pe website-ul propriu, sau alte acțiuni similare, ai putea să iei în calcul:
Contactarea organizațiilor sau a persoanelor care lucrează sau sunt interesate de acest domeniu
Împărtășește pe liste de discuții și rețele sociale
Contactează direct potențiali utilizatori, care crezi că ar fi interesați de aceste date

Adaptează-te audienței


Asemeni oricărei situații de comunicare, mesajul trimis comunității de utilizatori trebuie să fie individualizat. La fel ca în cazul altor factori interesați, mesajul poate fi irosit dacă nu este adresat în mod corespunzător.
Comunitățile digitale sunt deschise în ceea ce privește împărtășirea de noi informații, dar sunt și consumatori rapizi. Scrieți ca și cum mesajul vostru ar fi citit pe diagonală, mai degrabă decât să dați toate detaliile.
Este mai puțin probabil ca mermbrii comunității tehnologice să folosească MS Windows, folosit îndeosebi de publicul larg. Acest lucru înseamnă că nu ar trebui salvate documente în formate MS Office care pot fi citite în mod deconectat. Există două argumente care susțin acest lucru:
Primul este faptul că aceste documente ar fi mai puțin accesibile. Cititorii vor vedea mai degrabă o copie imperfectă de la o sursă alternativă decât documentul pe care îl vezi pe ecran.
În al doilea rând, agenția ta trimite un mesaj implicit că nu ești dispus să faci un pas înspre dezvoltatori. În schimb, arăți că aștepți comunitatea tehnologică să vină la tine.

Postează-ți materialele pe website-urile altor persoanelor


Multe bloguri pe teme specifice au un număr foarte mare de viziualizări. Se merită să îți postezi articolul despre inițiativa ta pe website-ul lor. Acest lucru este benefic ambelor părți. În felul acesta tu vei stârni interesul, iar autorul blogului va beneficia de o postare gratuită pe domeniul său.

Folosește rețelele sociale


Este nerealist să te aștepți ca funcționarii să folosească rețelele sociale. Totuși, există o serie de lucruri pe care le poți face în așa fel încât conținutul tău să fie împărtășit cu ușurință între utilizatori. Câteva sfaturi:
Elaborați pagini unice pentru fiecare fragment de conținut:
  • Atunci când un mesaj este partajat cu alții, destinatarul se va uita rapid peste conținutul relevant.
  • Avoid making people download your press releases:
    Este bine să dai comunicate de presă. Sunt mesaje concise despre lucruri punctuale. Totuși, dacă le ceri persoanelor să descarce conținutul și dacă acesta nu se va deschide într-un browser de web, atunci vor fi mai puțini cei care îl vor citi. Este puțin probabil ca motoarele de căutare să indexeze conținutul. Este mai puțin probabil ca persoanele să descarce printr-un click.
  • Consider using an Open license for your content:
    Pe lângă asigurarea partajării informației de către persoanele interesate, trebuie să trimiți un mesaj din care să reiasă că agenția ta înțelege ce înseamnă deschiderea datelor. Acest lucru va crea un impact mai mare decât orice altă propoziție din comunicatul de presă.

Rețelele sociale


Este ineficient pentru agențiile care nu au fonduri să petreacă ore pe website-urile rețelelor sociale. Pentru a vă asigura că sunteți auziți prin intermediul acestor rețele, trebuie ca postările voastre să fie ușor de preluat. Acest lucru înseamnă că trebuie să vă asigurați că ați citit ultima secțiune înainte de a trece la următoarea. Rămânând cu acest lucru în minte, iată câteva sugestii:
  • Discussion fora:
    Twitter a fost inițiat ca o platformă pentru diseminarea rapidă a informației. Orice etichetat #opendata va fi citit imediat de mii de persoane.
    LinkedIn cuprinde o selecție de grupuri care sunt orientate către datele deschise.
    În timp ce Facebook este perfect pentru publicul larg, nu a primit prea multă atenție din partea comunității de date deschise.
  • Link aggregators:
    Pune conținutul pe canale de știri pentru pasionați. Reddit și Hacker News sunt cele mai mari de acest gen. Slashdot și Digg sunt unelte utile în acest domeniu.
    Aceste website-uri au tendința de a atrage atenția asupra materialului interesant. Ele sunt de asemenea focalizate pe teme specifice.

Adunând persoane la un loc: Unconferences, Meetups and Barcamps


Întâlnirile directe pot fi o soluție foarte eficientă de a-i încuraja pe alții să folosească datele dumneavoastră. Motivele pe care ați putea considera să le includeți într-un eveniment:
  • Aflați mai multe despre potențialii reutilizatori
  • Aflați mai multe despre cerințele legate de diferite seturi de date
  • Aflați mai multe despre cum participanții vor să refolosească datele dumneavoastră
  • Permiteți posibililor reutilizatori să afle mai multe despre datele pe care le aveți
  • Permiteți posibililor reutilizatori să se întâlnească între ei (astfel ei pot colabora)
  • Expuneți datele dumneavoastră unei audiențe mai largi (de exemplu: postările de pe bloguri sau ceea ce apare în media pe care evenimentul poate ajuta să le genereze)
Există multe modalități diferite de derulare a evenimentelor și diferite tipuri de evenimente în funcție de ceea ce dumneavoastră țintiți să obțineți. Din moment ce există multe modele tradiționale de conferințe care includ chestiuni precum discuții formale pregătite anterior, prezentări și demonstrații, așa există diferite tipuri de evenimente conduse de participanți, în care aceia care sunt prezenți pot:
  • Să îndrume sau definească agenda evenimentului
  • Să se prezinte singuri, să vorbească despre ceea ce îi interesează și la ce anume lucrează, într-un mod ad-hoc
  • Să ofere spontan prezentări scurte despre ceea ce lucrează în prezent
  • Să conducă sesiunile înspre ceea ce ei sunt interesați
Există multe documente online despre cum se dirijează astfel de evenimente, documente pe care le puteți găsi prin căutarea unor cuvinte ca: „unconference”, „barcamp”, „meetup”, „speedgeek”, „lightning talk” și altele. Poate fi folositor și contactarea unor persoane din alte țări, care au condus aceste tipuri de evenimente și care de obicei sunt foarte dornici să vă ajute și să vă sfătuiască în ceca ce privește evenimentul dumneavoastră. Un parteneriat cu alte organizații poate fi valoros ( de exemplu: organizație a societății civile, o organizație media sau instituție didactică) pentru a vă lărgi baza participanților și pentru a crește mediatizarea.

Făcând lucruri! Hackdays, premii și prototipuri


Structura acestor competiții este constă din faptul că un număr de seturi de date sunt oferite iar programatorii au la dispoziție apoi o perioadă scurtă de timp - de la mai puțin de 48 de ore până la câteva săptămâni - pentru a devolta aplicații folosind aceste date. Apoi este oferit un premiu celei mai bune aplicații. Competițiile au fost ținute în câteva țări incluzând Marea Britanie, Statele Unite, Norvegia, Australia, Spania, Danemarca și Finlanda.

Exemple de competiții


Show us a better way a fost prima competiție de acest gen. A fost inițiată de Guvernul Marii Britanii „Grupul Operativ pentru Forța Informației” condus de Secretarul de Stat Tom Watson în Martie 2008. Această competiție a pus întrebarea „Ce ai putea crea din informații publice?” și a fost deschis programatorilor din întreaga lume, având un premiu tentant de 80.000 de lire sterline pentru primele cinci cele mai bune aplicații.

Una dintre primele competiții din Statele Unite, Apps for Democracy, a fost lansată în octombrie 2008 de Vivek Kundra, în acel moment Director pentru Tehnologie (CTO) al Guvernului Local al Columbiei (SUA). Kundra a devoltat catalogul datelor http://data.octo.dc.gov, o noutate la acel moment, care a inclus seturi de date acum ar fi fluxuri în timp real privind criminalitatea, notele elevilor și indicatorii privind pauperitatea. La acel moment era cel mai complet catalog din întreaga lume. Provocarea a fost de a-l face util cetățenilor, vizitatorilor, afacerilor și agențiilor guvernamentale din Wahington, DC.

Soluția creativă a fost de a iniția competiția Apps for Democracy. Strategia a fost de a cere participanților de a elabora aplicații care să folosească datele din catalogul proaspăt constituit. Exista posibilitatea de depunere online a aplicațiilor, mai multe premii mici opus câtorva substanțiale și câteva categorii separate, precum premiul „La Alegerea Publicului”. Comptetiția a fost deschisă pentru 30 de zile și a costat Guvernul 50.000 de dolari. În schimb, au fost devoltate 47 de aplicații pentru iPhone, Facebook și web cu o valoare peste 2.600.000 de dolari pentru economia locală.
Competiția Abre Datos (Open Data). Competiția care s-a desfășurat în Spania în aprilie 2010 a atras devoltatori pentru a crea aplicații cu sursă deschisă și care să facă uz de date publice în doar 48 de ore. S-au concurat 29 de echipe care au devoltat aplicații ce au inclus un program pentru un terminal mobil pentru accesarea informațiilor privind traficul din Țara Bascilor și pentru accesarea datelor privind orarul autobuzelor și stațiile de autobuz din Madrid, care au și câștigat primul și al doilea premiu în valoare de 3.000 și 2.000 de euro.
Nettskap 2.0. În aprilie 2010 Ministerul Administrației din Norvegia a inițiat „Nettskap 2.0”. Devoltatorii norvegieni - companii, agenții publice sau persoane - au fost provocate să vină cu idei bazate pe tehnologii web în zona devoltării serviciilor, fluxuri de lucru eficiente și creșterea nivelului de participare democratic. Utilizarea datelor guvernamentale a fost încurajată în mod explicit. Chiar dacă termenul limită era doar de o lună, pe 9 mai, Ministrul Rigmor Aasrud a afirmat că răspunsul a fost „copleșitor”. În total au fost primite 137 de aplicații dintre care nu mai puțin de 90 s-au axat pe reutilizarea datelor guvernamentale. Un cuantum de 2,5 milioane de coroane norvegiene au fost distribuite între 17 câștigători în timp ce suma pentru care s-a aplicat de cele 137 de aplicații a fost de 28,4 milioane.
Mashup Australia. Grupul Operativ 2.0 al Guvernul Australiei au invitat cetățenii să arate de ce accesul deschis ar fi un lucru bun pentru economia țării și pentru devoltarea socială. Concursul s-a desfășurat între 7 octombrie și 13 noiembrie 2009. Grupul Operativ a oferit câteva seturi de date sub o licență deschisă și într-o gamă variată de formate reutilizabile. Cele 82 de aplicații care au fost primite constituie o dovadă în plus în favoarea aplicațiilor noi și inovative care pot reulta din accesarea datelor guvernamentale în contextul deschiderii.

Conferințe, barcam-uri, hackday-uri


Una din căile mai eficiente pentru ca organizațiile societății civile (ONG-uri) să demonstreze guvernelor valoarea adusă prin deschiderea seturilor de date este de a arăta multiplele moduri prin care informația poate fi gestionată pentru a aduce beneficii sociale și economice. ONG-urile care promoveaă reutiliarea s-au dovedit a fi instrumentale în țările în care s-a văzut evoluția în elaborarea politicii și a legislației pentru a asigura faptul că seturile de date sunt deschise din punct de vedere tehnic cât și legal.
Activitățile tipice care sunt întreprinse ca parte a acestor inițiative, de regulă includ competiții, conferințe guvernamentale open government data, „unconferințe”, ateliere de lucru și „hack day-uri”. Aceste activități sunt organiate de regulă de comunitatea utiliatorilor cu date care deja au fost publicare proactiv sau care au fost obținute prin solicitări de acces la informații. În alte cazuri, promotorii societății civile au lucrat împreună cu reprezentanți luminați ai administrației pentru a asigura noi versiuni ale seturilor de date care pot fi utiliate de programatori pentru a crea aplicații inovative.

Glosar

{xtypo_dropcap}G{/xtypo_dropcap}losar


Anonymisation
Procesul de adaptare a datelor astfel încât să nu se mai poată reconstitui identitatea indivizilor.
Anonymization
Vezi Anonymisation.
API
Vezi Application Programming Interface.
Application Programming Interface
O metodă prin care programele de calculator pot comunica între ele.
AR
Vezi Information Asset Register.
Attribution License
O licență care obligă utilizatorii să distribuie materialul în aceleași condiții juridice ca și materialul inițial.
BitTorrent
BitTorrent este un protocol pentru distribuirea capacității de transfer între calculatoarele care participă în tansfer. În loc să descarce un fișier de la o sursă anume, BitTorrent permite participanților să descarce fragmente ale fișierului unii de la alții.
Connectivity
Conectivitatea se referă la posibilitatea comunităților de a se conecta la Internet, în special World Wide Web.
Copyright
Un drept pentru creatorii de opere pentru a nu permite altor persoane utilizarea operelor lor. Titularul dreptului de autor poate să decidă cum pot alte persoane să utilizeze acea operă.
DAP
Vezi Data Access Protocol.
Data Access Protocol
Un sistem care permite utilizatorilor externi să acceseze baze de date fără a supraîncărca sistemul.
Data protection legislation
Legislația nu se referă la protejarea datelor, ci mai degrabă protejarea drepturilor cetățenilor să trăiască fără grija că viețile lor pot deveni publice. Legea protejează intimitatea (cum ar fi informație despre situația economică a persoanei, sănătate și convingere politică) și alte drepturi cum ar fi dreptul la libertatea de circulație și de întrunire. De exemplu, în Finlanda a funcționat un sistem de carduri care înregistra călătoriile pasagerilor. Sistemul a dat naștere unei dezbateri din perspectiva libertății de mișcare iar colectarea datelor de călătorie a fost abandonată în baza legii de protejare a datelor personale.
Database rights
Un drept de a nu permite altor persoane a extrage și reutiliza conținut dintr-o bază de date. Există în special în jurisdicțiile europene.
EU
Uniunea Europeană.
EU PSI Directive
Directiva de reutilizare a informației din sectorul public, 2003/98/EC. “se ocupă cu modul în care entități din sectorul public ar trebui să îmbunătățească reutilizarea resurselor informaționale.”` Acțiuni legislative - Directiva PSI <http://ec.europa.eu/information_society/policy/psi/actions_eu/policy_actions/index_en.htm>;`_
IAR
Vezi Information Asset Register.
Information Asset Register
IAR sunt regiștri special făcuți pentru a stoca și organiza meta-date despre vastele cantități de informații deținute de departamentele guvernamentale și agenții. Un IAR cuprinzător include date de baze, seturi vechi de fișiere, fișiere electronice recente, colecții de statistici, cercetare și așa mai departe.
Termenul Directiva Europeană PSI recunoaște importanța registrilor de bunuri pentru viitorii reutilizatori de informații publice. Impune membrilor statelor să furnizeze liste, portaluri, sau ceva asemănător. Se precizează:
Tools that help potential re-users to find documents available for re-use and the conditions for re-use can facilitate
considerably the cross-border use of public sector documents.
Member States should therefore ensure that practical arrangements are in place that help re-users in their search for documents available for reuse. Assets lists, accessible preferably online,of main documents (documents that are extensively re-used or that have the potential to be extensively re-used), and portal sites that are linked to decentralised assets lists are examples of such practical arrangements.

IAR pot fi dezvoltate în diferite moduri. Departamentele guvernamentale pot dezvolta propriile IAR și acestea pot fi legate la IAR naționale. IAR pot include informații care sunt deținute de entități publice dar care nu au fost încă – și poate nu vor fi – publicate proactiv. Prin urmare acestea îngăduie publicului larg să identifice ce informatie există și poate fi cerută.
Pentru ca publicul să folosească aceste IAR, este important ca orice registre de informații deținute să fie complete, pe cât posibil, pentru a se avea încredere că documentele pot fi găsite. Necompletarea unor registre este o problemă însemnată deoarece creează un grad de nesiguranță care poate descuraja pe unii de la a folosi registrele pentru a căuta informații.
Este esențial ca metadatele din IAR să fie cuprinzătoare astfel încât motoarele de căutare să poată funcționa corespunzător. În spiritul datelor guvernamentale deschise, entitățile publice ar trebui să își facă IAR disponibile publicului general ca date brute sub o licență deschisă astfel încât hăcuitorii civici să poată folosi aceste date, spre exemplu pentru a construi motoare de căutare și interfețe cu utilizatorul.
Intellectual property rights
Monopol atribuit indivizilor pentru creații intelectuale.
IP rights
Vezi Intellectual property rights.
Machine-readable
Formate citibile automat sunt acele formate din care pot fi extrase datele ușor de către un calculator. Documentele PDF nu sunt citibile automat. Caltulatoarele pot afișa text frumos, dar au dificultăți mari în a înțelege contextul din jurul textului.
Open Data
Datele deschise pot fi folosite în orice scop. Mai multe detalii pe opendefinition.org.
Open Government Data
Date deschise (Open data) produse de guvern. E vorba în general despre date adunate de către guvern în decursul activităților obișnuite, care nu identifică indivizi și nu afectează interese economice. Datele guvernamentale deschise sunt parte din informații din sectorul public (Public Sector Information). Vezi http://opengovernmentdata.org pentru mai multe informații.
Open standards
Înțeles în general ca standarde tehnice care nu sunt constrânse prin restricții de licențiere. Poate fi interpretat ca standarde dezvoltate independent de un anumit furnizor.
PSI
Vezi Public Sector Information.
Public domain
Nu există drepturi de autor pentru material. Conceptul nu există în toate jurisdicțiile.
Public Sector Information
Informații adunate sau controlate de către sectorul public.
Re-use
utilizarea conținutului dincolo de scopul original.
Share-alike License
O licență care obligă utilizatorii să distribuie materialul în aceleași condiții juridice ca și materialul inițial.
Tab-separated values
Tab-separated values (TSV) este un format comun de fișier text utilizat pentru distribuția datelor tabulare. Formatul este foarte simplu și citibil automat (machine-readable).
Web API
Un API proiectat să funcționeze prin Internet.

Anexe - Formate de fișier

{xtypo_dropcap}A{/xtypo_dropcap}nexe


{xtypo_dropcap}F{/xtypo_dropcap}ormate de fișier


O privire de ansamblu asupra formatelor fișierelor


JSON
JSON este un format de fișier simplu care este foarte ușor de interpretat prin orice limbaj de programare. Simplitatea sa constă în ușurința cu care computerele procesează acest format spre deosebire de altele, cum ar fi XML.
XML
XML este un format pentru schimbul de date folosit pe scară largă, deoarece oferă oportunități de a păstra structura în date și în modul în care fișierele sunt construite. De asemenea îngăduie dezvoltatorilor să scrie părți din documentație fără a interveni asupra modului de citire.
RDF
Un format recomandat de W3C ce face posibilă reprezentarea datelor într-o formă ce face ușoară combinarea din mai multe surse. Datele RDF pot fi stocate în XML și JSON, printre altele. RDF încurajează folosirea URL ca identificatori, care oferă un mod convenabil de a interconecta inițiativele de open data de pe web. RDF nu este încă foarte răspândit, dar a devenit o tendință printre inițiativele de guvernare deschisă, inclusiv proiectele de date deschise conectate ale guvernelor Marii Britanii și Spaniei (British and Spanish Government Linked Open Data). Inventatorul Web, Tim Berners-Lee, a propus o schemă cinci-stele (five-star) care include date RDF conectate ca scop al căutării de inițiative pentru date deschise.
Foi de Calcul
Multe autorități au informații rămase în foi de calcul, spre exemplu Microsoft Excel. Aceste date pot fi adeseori utilizate imediat cu descrierea corectă a ceea ce înseamnă fiecare coloană.
Cu toate acestea, în unele cazuri pot exista formule în foile de calcul, care pot fi mai dificile în manevrare. Este recomandată documentarea acestor formule alături de foile de calcul, pentru a fi în general mai accesibile utilizatorilor.
Fișiere separate prin virgulă
CSV poate fi un format foarte folositor pentru că este compact și deci potrivit pentru transferul de seturi mari de date cu aceeași structură. Totuși, formatul este așa de spartan încât datele sunt deseori nefolosibile fără documentație pentur că este aproape imposibil de ghicit semnificația diferitelor coloane. Este deci important pentru fișierele separate prin virgulă ca documentația pentru câmpurile individuale să fie precise.
Mai mult este esențial ca structura fișierului să fie respectată, pentru că o singură omisiune a unui câmp poate îngreuna citirea datelor rămase în fișier fără vreo posibilitate de a rectifica eroarea, pentru că nu se paote determina cum trebuies interpretate datele rămase.
Documente text
Documentele în formate clasice precum Word, ODF, OOXML sau PDF pot fi suficiente pentru a expune anumite tipuri de date - spre exemplu, în liste de mesaje sau altele. Ar putea fi mai ușor să fie prezentate în aceste formate, pentru că sunt formatele în care datele au fost introduse ințial. Formatele nu oferă niciun suport pentru a păstra o structură consistentă, ceea ce de multe ori înseamnă că este dificilă introducerea de date în mod automat. Folosirea șabloanelor ca bază pentru documentele care vor expune date pentru refolosire, face posibilă cel puțin extragerea informației din documente.
De asemenea poate sprijini folosirea ulterioară a formatelor tipografice pe cât posibil pentru ca astfel să fie mai ușor distingerea antetelor (de orice tip) de către o mașină din orice conținut. În general este nu recomandată folosirea formatulelor Word, dacă datele există și în alte formate.
Text simplu
Documentele în format text simplu (.txt) sunt foarte ușor de citit de către calculatoarele. În general acestea exclud metadatele din interiorul documentuli, ceea ce înseamnă că dezvoltatorii vor fi nevoiți să creeze un program pentru analiză sintactică care poate interpreta fiecare document așa cum apare.
Unele probleme pot fi cauzate de schimbul de fișiere text între sistemele de operare. MS Windows, Mac OS X și alte variante Unix au fiecare propriul mod de a spune calculatoarelor că au ajuns la sfârșit de linie.
Imagini scanate
Probabil cel mai puțin potrivit format pentru cele mai multe date, dar ambele formate TIFF și JPEG-2000 pot cel puțin marca cu documentație ce anume este în imagine - până acolo încât să marcheze imaginea unui document cu tot textul acelui document. Poate fi relevantă expunerea datelor ca imagini pentru acele date care nu au fost create în format electronic, cum ar fi materialele din arhive, iar o imagine este mai bună decât nimic.
Formatele proprietar
Unele sisteme dedicate au propriile formate de date în care pot salva sau exporta date. Uneori poate fi suficientă expunerea datelor în astfel de formate - în special dacă se așteaptă ca utilizările ulterioare să aibă loc în sisteme similare celor din care provin. Ar trebui întotdeauna indicat unde anume se pot găsi informații ulterioare despre aceste formate, spre exemplu o legătură către situl web al distribuitorului. In general se recomandă expunerea datelor în formate neproprietărești acolo unde este posibil.
HTML
În zile noastre majoritatea datelor sunt disponibile în HTML pe diverse situri. Aceasta poate fi suficient dacă datele sunt stabile și limitate în scop. În unele cazuri, este de preferat obținerea într-o formă simplă de descărcat și manevrat, dar este simplu să se ofere o legătură către o pagină web, ar putea fi un bun punct de plecare în expunerea datelor.
În mod normal, ar fi mai potrivită folosirea tabelelor în documente HTML pentru a păstra datele, și apoi este important ca diversele câmpuri de date să fie afișate și să li se dea identificatori care fac ușoară manevrarea datelor. Yahoo a dezvoltat o unealtă (http://developer.yahoo.com/yql/) care poate extrage informații structurate dintr-un sit web și astfel de unelte pot face mai multe cu datele care sunt etichetate cu atenție.
Formate de fișier deshise
Chiar dacă informația este oferită în format electronic, în formate ce pot fi citite automat și în detaliu, pot exista probleme legate de formatul fișierului.
Formatele în care informația este publicată - cu alte cuvinte formatul digital în care informația este stocată - pot fi „deschise” sau „închise”. Un format deschis este unul în care specificațiile pentru programe sunt standardizate, disponibile oricui, astfel încât oricine poate folosi aceste specificații în propriile programe fără alte limitări in refolosire impuse de drepturile de proprietate intelectuală.
Dacă un format de fișier este „închis”, aceasta poate fi pentru că formatul este proprietăresc și specificațiile nu sunt public accesibile sau pentru că formatul este proprietăresc și deși specificațiile au fost făcute publice, reutilizarea este limitată. Dacă informația este eliberată într-un fișier în format închis, aceasta poate produce obstacole semnificative în reutilizarea informației codificată în fișier, forțându-i pe cei care doresc să folosească informația să cumpere programele necesare.
Beneficiul formatelor de fișiere deschise este că ele permit dezvoltatorilor să producă pachete de programe și servicii folosind aceste formate. Aceasta minimizează obstacolele refolosirii informației pe care o conțin.
Folosirea formatelor de fișier proprietăresc pentru care specificațiile nu sunt accesibile pot crea dependențe de terțe programe sau terți deținători de drepturi asupra formatelor de fișiere. În cel mai rau caz, aceasta înseamnă că informația poate fi citită doar folosind anumite pachete de programe, la prețuri neaccesibile, sau care pot deveni depășite.
Din perspectiva open government data este preferată publicarea informației în formate de fișier deschise care pot fi citite automat.
Exemplu: date despre trafic în Regatul Unit
Andrew Nicolson este un dezvoltator de programe care a fost implicat într-o campanie (în cele din urmă de succes) împotriva construirii unei noi străzi, Westbury Eastern, în Regatul unit. Andrew a fost interesat de accesarea și folosirea datelor despre trafic ce erau folosite pentru a justifica propunerile. A reușit să obțină câteva dintre cele mai relevante date prin cereri bazate pe legislația privind liberul acces la informație, dar autoritățile locale au oferit datele într-un format proprietar ce poate fi citit doar folosind programe produse de o companie numită Saturn, specializată în modelarea și anticiparea traficului. Nu era oferită o versiune „read only” a programului, așa că grupul lui Andrew nu avut nicio alternativă, decât să cumpere o licență pentru programe, plătind în final £500 (€600) utilizând o reducere educațională. Pachete principale de programe de pe lista de prețuri ale comaniei Saturn, din aprilie 2010, pornesc de la £13,000 (peste €15,000), un preț care nu este accesibil cetățenilor obișnuiți.
Deși nicio lege pentru accesul la informație nu dă dreptul la accesul în formate deschise, inițiativele guvernamentale de deschidere a datelor încep să fie însoțite de documente de politici care stipulează că informațiile oficiale trebuie să fie disponibile în formate deschise. Standardul înalt a fost stabilit de administrația Obama, prin Directiva pentru o duvernare deschisă, din decembrie 2009, care spune:
Pe cât posibil și în concordanță cu restricțiile valabile, agențiile ar trebui să publice informația pe internet într-un format deschis care poate fi găsit, descărcat, indexat și în care se poate căuta folosind aplicații de căutare web. Un format deschis este unul care este independent de platformă, se poate citi automat și poate fi disponibil publicului fără restricții care ar împiedica refolosirea acelei informații.

Cum folosesc un anumit format?
Când o autoritate trebuie să expună noi date - date care nu au fost expuse înainte - ar trebui să alegi formatul care oferă cel mai bun balans între cost și potrivirea cu scopul. Pentru fiecare format există anumite lucruri de care trebuie să fii conștient și această secțiune încearcă să le explice.
Această secțiune se focalizează doar pe modul în care elementele sunt îmbinate astfel încât să poată fi accesate automat. Sfaturi și ghiduri despre cum ar trebui proiectate siturile și serviciile web pot fi găsite în altă parte.
Servicii Web
Pentru date care se schimbă frecvent și acolo unde fiecare cerere este limitată în dimensiune, este relevantă expunerea datelor prin servicii web. Există mai multe moduri de a crea servicii web, dar unele dintre cele mai folosite sunt SOAP și REST. În general, SOAP mai mult decât REST sau servicii REST, dar sunt foarte ușor de dezvoltat și folosit, așa că sunt standarde folosite pe scară largă.
Baze de date
La fel ca serviciile web, bazele de date oferă acces direct la date în mod dinamic. Bazele de date au avantajul ca pot îngădui utilizatorilor să pună la un loc doar extragerile care îi interesează.
Există unele îngrijorări cu privire la securitate atunci când se îngăduie acces de la distanță pentru extragerea din bazele de date și accesul la bazele de date este folositor doar dacă structura bazei de date și importanța tabelelor individuale și a câmpurilor sunt bine documentate. Adesea, este relativ simplu și ieftin să se creeze servicii web care expun date dintr-o bază de date, care poate fi o metodă ușoară de a aborda îngrijorările cu privire la securitate.

Ce drepturi (de proprietate intelectuală) există în bazele de date?

{xtypo_dropcap}C{/xtypo_dropcap}e drepturi (de proprietate intelectuală) există în bazele de date?


Când vorbim despre bazele de date, prima oară trebuie să distingem între structura și conținutul unei baze de date (când folosim termenul de „date” ne vom referi la conținutul bazei de date însăși). Elementele de structură includ lucruri cum ar fi câmpurile și un model pentru date – organizarea acestor câmpuri și inter-relaționarea lor.
În multe jurisdicții, este posibil ca elementele structurale ale unei baze de date să fie protejate de drepturi de autor (copyright) (depinde însă și de nivelul de „creativitate” în crearea unei structuri).
Totuși în cazul nostru suntem în mod particular interesați de date în sine. Când vorbim de „date”, trebuie să fim atenți pentru că acest cuvânt nu este foarte precis: „date” poate să însemne 2 elemente din baza de date (de exemplu două date bibliografice) sau „date” pot să însemne o colecție întreagă (de ex. Tot materialul din baza de date).
Sper deosebire de alt conținut cum ar fi text, muzică sau film, situația juridică a datelor depinde mult de la țară la țară. Cu toate acestea, cele mai multe jurisdicții acordă unele drepturi asupra datelor (ca o colecție).
Distincția între „conținutul” unei baze de date și colecție este în mod special crucial pentru bazele de date cu informații factuale, pentru că nicio jurisdicție nu acordă un drept monopolistic pe faptele în sine („conținutul”), chiar dacă ar putea acorda drept(uri) asupra lor ca o colecție. Pentru a exemplifica, să luăm exemplul simplu al unei baze de date care conține punctele de topire ale diverselor substanțe. Câte vreme baza de date, ca totalitate, ar putea fi protejată de lege astfel încât o altă persoană nu are dreptul de a o accesa, reutiliza sau redistrbui fără permisiune, aceasta nu ar trebui să te împiedice să scrii faptul că substanța Y se topește la temperatura Z.
Formele de protecție se încadrează în mod larg în două categorii:
Dreptul de autor pentru compilații
Un drept sui generis pentru colecțiile de date
După cum am subliniat deja, nu există reguli generale și situația depinde în funcție de jurisdicție. Astfel, vom putea doar detalia de la țară la țară dacă aceste forme de protecție (sau niciuna din ele) este folosită într-o jurisdicție anume.
În fine, ar trebui să punctăm faptul că în absența oricărei norme legale, mulți furnizori de baze de date (închise) au posibilitatea de a folosi un simplu contract combinat cu o dispozițiile legale care împiedică încălcarea mecanismelor de control a accesului, pentru a obține rezultate similare cu un drept formal de proprietate intelectuală. De exemplu, dacă X este un furnizori de o baza de date de citate, poate obține un contract (termeni și condiții) pe care îl dorește prin:
Cerința ca utilizatorii să se logheze cu o parolă
Punerea la dispoziție a numelui de utilizator și parola unui noi utilizator doar cu condiția ca acel utilizator să fie de acord cu termenii și condițiile.
Poți să citești mai multe despre situația în funcție de jurisdicție în ghidul pentru licențierea datelor deschise (Guide to Open Data Licensing).