reprezentare logo Kosson

Date Deschise

Informație care adresează problematica Datelor Deschise și a Informațiilor din Sectorul Public așa cum aceste subiecte apar în centrul atenției și a preocupărilor breslei. Aceste domenii nu sunt separate de activitatea instituțiilor noastre și e bine să avem un punct de sprijin în aplicare.

Principiile FAIR (traducere după https://www.force11.org/node/6062)

Introducere:

În ecosistemul eScience, provocarea de a oferi o utilizare optimă a datelor și a metodelor de cercetare este una complexă având actori multipli: cercetători care doresc să-și distribuie datele și interpretările; edituri specializate pe date care își oferă serviciile, software-ul, dar și creatorii de instrumente care oferă posibilitatea de a analiza datele și servicii de procesare; organismele de finanțare (public și private), care sunt din ce în ce mai interesate de o Gestionare a Datelor corespunzătoare, dar și o comunitate a datelor științifice care exploatează, integrează și analizează rezultatele pentru a face pași spre noi descoperiri. Analiza computațională pentru a descoperi structuri inteligibile în seturi de date masive interconectate devine o rutină în activitatea de cercetare. A pune la dispoziție date interpretabile de mașini ca principal substrat pentru Descoperirea Cunoașterii și pentru ca aceste procese de eScience să meargă fără impedimente și sustenabil este una din Cele mai Mari Provocări pentru eScience.

geoidealogoadnotat

Acum o săptămână (5 -6 decembrie, 2015) am participat la evenimentul de încheiere a proiectului Geoidea.ro - http://geoidea.ro/ro/ro_workshop_final.html

O parte a fost dedicată unui hackathon privind valorificarea datelor din portalul național de date http://data.gov.ro. Datele sunt puse la dispoziție de Institutul Național al Patrimoniului.

Ideea pentru care am atras eforturile câtorva participanți constă în punerea tuturor reperelor de interes cultural de pe malul românesc al Dunării.

Ceea ce a ieșit prin eforturile echipei din care au făcut parte Ionuț Iosifescu Enescu și Nadia Panchaud, ambii de la ETH Zurich poate fi văzut la http://djana.github.io/ accesând grupul de straturi intitulat Data.gov.ro și mai apoi selectând straturile National Archeological Registry - Along the Danube și Museums - Along the Danube. Acesta este rezultatul primei zile de hackathon.


Nadia Panchaud, Ionut Iosifescu, Nicolaie Constantinescu @ Geoidea Hackathon2015În a doua zi am optat pentru completarea cu un set nou oferit prin eforturile wikipedistului român Andrei Cipu: setul de date provenind de la concursul Wiki Loves Monuments. Harta rezultată este încă în lucru pentru că s-a optat pentru utilizarea tehnologiei oferită de OpenLayers, dar implicând și posibile instrumente de clusterizare. De îndată ce va fi gata, va fi publicată și pe Kosson.ro.

Viziune

Noi credem că această Declarație are puterea să transforme practica cercetării etice, reforma legislativă și dezvoltarea politicilor de acces deschis și a infrastructurii. Vă invităm să oferiți sprijinul adăugând propriul nume pe lista în creștere a semnatarilor.

Noile tehnologii revoluționează modul în care oamenii pot învăța despre lume și despre ei înșiși. Aceste tehnologii nu sunt decât un mijloc de a gestiona Datele Masive (Big Data) 1, fiind și o cheie către descoperirea cunoașterii în era digitală iar puterea lor este dezvăluită pe măsură ce datele însele devin din ce în ce mai mult disponibile. Factori precum putere computațională crescută, creșterea rețelei, angajamentele guvernelor pentru accesul deschis 2 la cercetarea plătită din fonduri publice conduc la apariția mai multor fapte, date și idei.

HagueDeclarationLogoTotuși, cadrele legale existente în diferitele jurisdicții ar putea să nu fie înțelese într-un mod care să sprijine introducerea unor noi abordări în ceea ce privește cercetarea și în particular exploatarea conținutului (content mining - vezi nota de traducere mai jos). Exploatarea conținutului este procesul de extragere a informației dintr-un material citibil de mașină. Funcționează prin copierea unor mari cantități de lucrări, extragerea de date și recombinarea acestora pentru a identifica modele repetitive și trenduri.

În același timp, legile proprietății intelectuale dintr-o vreme mult dinaintea apariției rețelei, limitează puterea tehnicilor de analiză a conținutului digital așa cum este exploatarea textului și a datelor (pentru text și date) sau exploatarea conținutului (pentru analiza computațională în toate formatele) 3. În același timp, acești factori creează inegalități privind accesul la descoperirea cunoașterii în era digitală. Legislația în cauză poate fi legea drepturilor de autor, legea care guvernează patentele sau legea bazelor de date; toate acestea putând restricționa abilitatea utilizatorului de a performa analize detaliate asupra conținutului.

Cercetătorii ar trebui să aibă libertatea să analizeze și să-și urmeze curiozitatea intelectuală fără frica monitorizării sau a repercusiunilor. Aceste libertăți nu ar trebui erodate în mediul digital. În aceeași măsură, etica din jurul utilizării datelor și a exploatării conținutului continuă să evolueze ca răspuns la schimbările tehnologice.

Analiza computațională a conținutului în toate formatele, înțelegându-se exploatarea sa, permite accesul la cunoaștere publică nedescoperită, oferind perspective importante asupra fiecărui aspect al economiei, al vieții sociale și culturale. Exploatarea conținutului va avea și un impact profund  privind înțelegerea societății și a mișcărilor sociale (de exemplu, previzionarea schimbărilor politice, analiza modificărilor demografice). Utilizarea unor astfel de tehnici are potențialul să revoluționeze modul în care cercetarea este făcută, fie în zona academică sau cea comercială.

Motto: Resursele doresc să fie deschise și libere.

Pentru că este mai ușor de mers pe fir voi aminti de un prim eveniment [1] dedicat valorificării datelor deschise în domeniul culturii. Acesta s-a desfășurat [2] la Timișoara fiind găzduit de Biblioteca Centrală Universitară „Eugen Todoran” între 18 și 19 aprilie, 2015.
Multe amănunte despre acest fericit început mai pot fi completate și de ceea ce au relatat colegii din Coaliția pentru Date Deschise [3] și reacțiile din media [4] [5] [6] [7] [8]. Este notabil că s-a întâmplat și că astfel au fost puse în valoare datele existente, fie în portalul național de date de la data.gov.ro, fie de la Arhivele Naționale sau de la Europeana ori faimoasa deja colecție Costică Acsinte. Acest eveniment trebuie văzut ca pe o continuare a eforturilor Coaliției pentru Date Deschise concretizate prin evenimentele de tip hackathon pe care le-a organizat, dar mai ales ca o nevoie de „a pune în operă”, ceea ce există și pentru a face cazul următoarelor inițiative. Astfel de zile dedicate valorificării resurselor deschise și reutilizabile din cultură răspund multor nedumeriri și dau perspective asupra valorificării concrete.