reprezentare logo Kosson
Introducere

Cercetătorii pot găsi și pot citi articole online mai avantajos decât ar face căutări manual după copii tipărite. Mașinile (computerele) pot indexa articolele și pot extrage detalii (titluri, cuvinte cheie, etc.) pentru a atenționa cercetătorii cu privire la materialele cu relevanță. mai mult, computerele pot extrage date factuale și înțelesuri prin „exploatarea” conținutului, deschiderea posibilitiților pentru care mașinile să fie utilizate pentru a face conexiuni (și chiar descoperiri științifice), care, altfel ar rămâne invizibile pentru cercetători.

Totuși în acest moment computerele nu pot exploata conținutul articolelor datorită limitărilor împuse de edituri. În timp ce Accesul Deschis (AD) îmbunătățește șansele cercetătorilor de a citi articolele (prin eliminarea barierelor de acces), totuși doar un procent de 20% dintre articole sunt deschise accesului. Restul stau închise după zidurile taxărilor. În ceea ce privește marea majoritate a contractelor făcute pentru abonamente, beneficiarii pot citi articolele de dincolo de zidul taxelor, dar nu pot să le exploateze.

Exploatarea conținutului este calea prin care tehnologia modernă localizează informația digitală. Deoarece informația științifică provine din sute de mii de surse diferite ale comunității [1] științifice actuale și pentru că seturile de date existente se măsoară în terabytes [2] , de cele mai multe ori nu mai este posibilă simpla citire a unui sumar de cercetare pentru a realiza un beneficiu semnificativ din utilizarea acestuia [3]. Un cercetător trebuie să fie capabil să copieze informația, să o recombine cu alte date, altfel spus să poată să o „reutilizeze” pentru a produce rezultate cu adevărat utile. Nu numai că se constituie ca un instrument deductiv necesar analizei datelor de cercetare, dar mai trebuie luat în calcul și modul în care motoarele de căutare operează pentru a permite descoperirea conținutului. Înterzicerea exploatării este similar cu împingerea cercetătorilor pe alei întunecate și silozuri în care doar o cunoaștere parțială este accesibilă. Știința nu progresează dacă nu poate incorpora cele mai recente descoperiri și nu poate păși mai departe din acel punct.

Definiție

„Exploatarea deschisă a conținutului” înseamnă dreptul nelimitat al abonaților de a extrage, procesa și republica conținutul manual sau cu ajutorul mașinilor în oricare formă (text, diagrame, imagini, date, audio, video, etc) fără a obține în prealabil o permisiune anume și care se supune unor norme comunitare de comportament responsabil în era digitală.
 • Text
 • Numere
 • Tablele: reprezentări numerice ale faptelor
 • Diagrame (grafice liniare, grafuri, spectrograme, rețele, etc.): Reprezentări grafice ale relațiilor dintre variabile sunt imagini și astfel ar putea să nu fie considerate a fi date atunci când sunt considerate a fi o entitate colectivă. Totuți, punctele de date luate la nivel individual care stau la baza graficului ce sunt similare unui tabel, ar trebui să fie considerate date.
 • Imagini și video (de cele mai multe ori fotografii) acolo unde acestea constituie mijloace pentru reprezentarea factuală a cercetării?
 • Audio: la fel ca în cazul imaginilor, acolo unde exprimă reprezentarea factuală a cercetării?
 • XML: Extensible Markup Language (XML), definește regulile de codare a unui document într-un format care este deopotrivă accesibil oamenilor cât și mașinilor.
 • Date bibliografice nucleu: descrise ca fiind „date care sunt necesare identificării și/sau descoperirii unei publicații” și care sunt definite de Principiile Bibliografice Deschise.
 • Resource Description Framework (RDF): informații despre conținut, cum ar fi autorii, informații de licențiere și un identificator unic pentru articol
Principii

Principiul 1: Dreptul de a exploata a celor care accesează
Afirmăm că nu există niciun temei legal, etic sau moral pentru a refuza celor care accesează legitim conținutul de cercetare (cu acces deschis sau sub alte regimuri) de a se folosi de mașini pentru a analiza rezultatele publicate ale comunității de cercetare. Cercetătorii așteaptă să acceseze și să proceseze întregul conținut al literaturii de cercetare prin intermediul programelor de computer și ar trebui să poată să-și folosească mașinile precum își folosesc ochii.

{xtypo_dropcap}D{/xtypo_dropcap}reptul de a citi este dreptul de a exploata.

Principiul 2: Termeni și condiții privind procesarea ușoară
Exploatarea de către abonații legitimi nu ar trebui să fie interzisă prin bariere de natură legală sau contractuală. Editurile ar trebui să adauge un limbaj clarificator în acordurile de abonament prin care conținutul este disponibil pentru a fi exploatat informațional prin descărcare dau prin acces la distanță. Acolo unde accesul este prin intermediul instrumentelor oferite de cercetători, nu ar mai trebui să fie percepute alte costuri.

{xtypo_dropcap}U{/xtypo_dropcap}tilizatorii și furnizorii ar trebui să încurajeze procesarea de către mașini.

Principiul 3: Utilizarea

Cercetătorii pot și vor publica fapte și fragmente pe care le descoperă prin citirea și procesarea documentelor. Aceștia așteaptă să disemineze și să agrege rezultatele statistice ca fapte și ca text care să stabilească un context ca fiind fragmente ce ar trebui văzute ca utilizare leală, deschise care să fie lipsite de restricții altele decât cele legate de atribuire. Eforturile editurii pentru a cere beneficii mai departe de pe urma exploatării întârzie mai mult dezvoltarea științei prin împuținarea accesului la comunitatea de cercetarea; astfel de cereri pentru beneficii ar trebui interzise.

{xtypo_dropcap}F{/xtypo_dropcap}aptele nu aparțin cuiva.

Strategii

Plănuim să afirmăm drepturile de mai sus prin;
 • Educarea cercetătorilor și a bibliotecarilor privind potențialul exploatării conținutului și a actualelor impedimente în acest demers, incluzând alertarea bibliotecarilor privind necedarea de la niciunul din drepturile de mai sus atunci când semnează contractele cu editurile
 • Compilarea unei liste de edituri și indicarea căror drepturi acestea sunt permisive pentru a evidenția diferența între drepturile care au fost menționate aici și ceea ce este posibil în acest moment
 • Solicitarea către guverne și organismele de finanțare de a promova și sprijini drepturile mai sus menționate
[1] Panzer-Steindel, Bernd, Sizing and Costing of the CERN T0 center, CERN-LCG-PEB-2004-21, 09 June 2004, at http://lcg.web.cern.ch/lcg/planning/phase2_resources/SizingandcostingoftheCERNT0center.pdf.

[2] The Value and Benefits of Text Mining, JISC, Report Doc #811, March 2012, Section 3.3.8 at http://www.jisc.ac.uk/publications/reports/2012/value-and-benefits-of-text-mining.aspx, citing P.J.Herron, “Text Mining Adoption for Pharmacogenomics-based Drug Discovery in a Large Pharmaceutical Company: a Case STudy,” Library, 2006, claiming that text mining tools evaluated 50,000 patents in 18 months, a task that would have taken 50 person years to manually.

[3] See MEDLINE® Citation Counts by Year of Publication, at http://www.nlm.nih.gov/bsd/medline_cit_counts_yr_pub.html and National Science Foundation, Science and Engineering Indicators: 2010, Chapter 5 at http://www.nsf.gov/statistics/seind10/c5/c5h.htm asserting the annual volume of scientific journal articles published is on the order of 2.5%.

Traducere Nicolaie Constantinescu;
Text original: The Right to Read Is the Right to Mine