Vive l’Open Access libre !

©Wikimedia commons

©Wikimedia commons

 

Le Digital Repository of Ireland est, comme son nom l’indique, la bibliothèque numérique d’Irlande. Le DRI travaille donc avec de nombreuses institutions irlandaises, principalement spécialisées dans les sciences humaines et sociales ainsi que l’héritage culturel, comme le Trinity College. Ces institutions permettent au DRI de gérer la préservation de leurs collections digitales et le DRI met, en parallèle, ces documents en accès public ou Open Access [1].

Toutefois, on peut se poser quelques questions sur la raison d’être de ce genre d’institution mais aussi plus générales. Que gagne une institution à passer par un organisme externe pour la préservation digitale de ses collections ? Quels avantages présente l’Open Access par rapport aux publications “classiques” ?

L’Open Access

À l’origine, les articles scientifiques étaient publiés dans de grandes revues scientifiques qui ne sont accessibles qu’avec des abonnements très chers. L’avantage principal que mettent en avant ces périodiques est le processus de “peer review”, c’est-à-dire que les articles sont lus et évalués par d’autres scientifiques pour leur donner plus de poids. Avec l’arrivée d’Internet, un modèle semblable s’est développé, des bases de données d’articles accessibles moyennant un abonnement. Toutefois, la majorité des articles étant publiée dans quelques grands périodiques, le prix des abonnements ne cesse d’augmenter. Il est alors de plus en plus difficile pour les institutions scientifiques de se procurer l’accès aux différentes sources d’articles à cause de leur prix, ce qui est un comble car ce sont elles qui produisent une partie des recherches scientifiques [2].

Cependant, face à cette problématique et grâce à Internet, un mouvement d’Open Access s’est développé, proposant un nouveau modèle de diffusion des articles scientifiques. Ce modèle propose de publier des articles dans des bases de données accessibles à tout le monde sans aucun abonnement. Une restriction existe tout de même, mais elle coule de source, il est obligatoire de citer les articles utilisés [2].

Ce mouvement en plein développement présente de nombreux avantages par rapport aux publications “classiques”, même si ceux-ci touchent principalement à la visibilité des articles. Ainsi, comme ces publications sont accessibles à tout le monde, plus de personnes les consultent à travers le monde entier. Ces travaux sont donc plus utilisés et cités dans d’autres recherches mais aussi dans la pratique. Ils ont de cette manière une diffusion bien plus importante [3]. Ces éléments sont très importants pour les chercheurs et scientifiques car, comme nous l’avons vu au cours de “Sources d’information en sciences et techniques”, la qualité de leurs écrits est évaluée d’après des critères comme le nombre de citations de ces articles, de vues, de partages… [4]

Il existe deux types de diffusion en Open Access : la Voie verte et la Voie dorée. La Voie verte, ou autoarchivage, est la possibilité pour un chercheur de déposer un article, déjà publié dans un périodique “traditionnel”, dans des archives électroniques en Open Access à partir du moment où celui-ci n’est plus sous embargo de l’éditeur. La Voie dorée concerne les articles directement publiés dans des périodiques en Open Access, qu’ils soient électroniques ou en format papier [5]. Mais dans ces cas-là, vu que les articles sont accessibles à tout le monde gratuitement, c’est l’auteur ou son institution qui doivent payer pour publier l’article [6].

Il y a des avantages et désavantages aux deux Voies. Ainsi, la Voie verte ne permet d’avoir accès aux articles qu’après une période d’embargo et ce ne sont généralement que les “brouillons” finaux de ces travaux car l’éditeur n’autorise pas la publication complète des articles. Par contre, cette Voie permet une publication en Open Access gratuite pour l’auteur et les lecteurs, mais aussi la diffusion d’une littérature “grise” qui n’est pas publiée autrement. La Voie dorée présente comme inconvénient d’être payante pour l’auteur, mais les articles sont disponibles immédiatement et dans leur version complète [7]. La Voie dorée est celle qui est privilégiée par les éditeurs car le modèle économique est plus stable. La taxe pour être publié remplace les abonnements que les institutions payaient pour avoir accès au périodique [8].

La préservation numérique

Rien ne se fait plus aujourd’hui sans l’implication constante de données et contenus numériques. Quelque soit la sphère dans laquelle l’on se trouve, les données digitales y sont essentielles : les contacts entre membres d’une famille, étudiants ou collègues passent par le numérique, la presse papier se digitalise, les sociétés, quelque soit leurs domaines d’expertises, créent et brassent en continu du format numérique, etc. Une étude menée à l’Université de Californie à Berkley en 2000 a montré que 93% de la production académique est uniquement digitale [9] .
À l’instar des documents physiques qui font l’objet depuis de très nombreux siècles d’un traitement a posteriori de leur création en vue de leur conservation, diffusion et accessibilité, le contenu digital fait aussi l’objet aujourd’hui d’un traitement en vue de sa conservation. C’est cette étape du cycle de vie des documents et contenus numériques que l’on abordera dans cette partie.

Il convient d’abord de différencier les deux types de contenus numériques que l’on peut trouver : le premier groupe comprend des documents physiques numérisés au contraire du second qui regroupe ce qu’on appelle du “born-digital content” [10]. On retrouve notamment, dans ce premier groupe, des scans d’articles ou encore des oeuvres d’art numérisées, alors que le second regroupe, comme son nom l’indique, du contenu qui n’a pas fait l’objet d’un traitement pour être digitalisé mais plutôt des documents ou données directement numériques et digitales. On retrouve dans ce groupe principalement des documents numériques (caractérisé par leur type de format PDF), de l’art numérique, des photographies, des métadonnées, etc. [11]. Une des caractéristiques principales de ce type de documents est donc son hétérogénéité, son caractère multiformat.

Cette hétérogénéité des supports a malheureusement condamné les contenus numériques à une certaine obsolescence. Depuis les années 90, les programmes et outils technologiques utilisés jusqu’alors pour lire et sauvegarder de tels contenus ont évolué. Certains ont petit à petit disparu alors que d’autres sont apparus (on peut notamment penser aux disquettes qui ne sont plus ni utilisées ni lues par les ordinateurs modernes). Cette obsolescence, crainte il y a quelques années [12], n’est plus aujourd’hui vue comme le principal risque de perte de données. David Rosenthal en parle aujourd’hui comme un processus très, trop, lent pour être tenu comme responsable de la perte de documents numériques [13]. Cette dépendance aux technologies amène néanmoins encore les professionnels de la préservation numériques à caractériser de tels contenus comme étant “fragiles” [14]. Cette logique de l’obsolescence basée sur l’évolution technique a donné un adage largement partagé dans le monde de la préservation numérique [9] [15] : la technologie, ou la source est vue comme partie du problème mais également comme partie de la solution : les avancées technologiques ont condamné certains formats de contenus mais ces avancées sont nécessaires pour la création et a conservation de nouveaux documents ainsi que pour, dépendant de la stratégie promue par l’institution, la migration ou l’émulation de contenu dit “perdu”.

Différentes stratégies sont mises en place par les institutions de préservation de contenus numériques. Deux des plus usitées par les systèmes de préservation de documents ont été mentionnées ci-dessus : la migration et l’émulation [16].

La migration (de format) n’est pas une simple migration de documents d’un endroit de conservation vers un autre mais plutôt la migration d’un format dit “obsolète” vers un format plus récent. C’est la solution classique à l’obsolescence technologique développée plus haut. Il faut néanmoins, avec cette méthode, toujours faire attention à l’altération du contenu des documents passés par cette migration.

L’émulation permet l’accessibilité au document ou à l’information sous sa forme, son format original via l’utilisation d’un émulateur. Cette technique a l’avantage de conserver, sans risque d’altération, le contenu du document.

Néanmoins, comme le montrent Anne Kenney et Nancy McGovern [9], développer une stratégie de conservation et s’équiper d’un système interne de préservation ne peut se faire sans une étude du contexte institutionnel dans lequel cette stratégie de préservation va prendre part. Elles ont développé une feuille de route en cinq étapes avec un focus porté prioritairement sur le “local”, le contexte institutionnel, en première étape et pour finir, en cinquième étape, avec le développement de partenariats.

Le Digital Repository of Ireland

Le DRI est l’acteur majeur, en Irlande, en Open Access et préservation numérique. Il travaille en étroite collaboration avec d’autres institutions [17] (Trinity College Dublin, National Archives of Ireland, National Museum of Ireland…) afin de développer ces deux thèmes en Irlande.

L’intégration au DRI peut se faire de deux manières soit en devenant membre à part entière, soit en s’y affiliant. Les deux types adhésions sont payants. Les différences entre les deux adhésions viennent surtout du fait que les affiliés ont un pouvoir décisionnel moindre sur les politiques futures du DRI [1].

Le DRI offre des ressources en Open Access (avec certaines limitations) sur son site via un catalogue dont les fonctionnalités diffèrent de ceux dont on a l’habitude, du fait que celui-ci fait partie intégrante du site. Ce catalogue est séparé en trois parties : “Collections”, “Sub-collections” et “Objects”. Il y a en tout 27345 documents dans ce catalogue dont la majorité sont des images (20084), mais il y a aussi des textes, de l’audio et des vidéos. Certains de ces documents ne sont accessibles que si l’on est connecté à leur site et que l’on demande à y avoir accès. Il n’a pas d’option de recherche, mais il y a des options d’affinage (ex : date de création, sujet, langage, type de média…). Pour avoir accès à un document dont l’accès est restreint, il faut demander l’accès en donnant son nom, si possible notre organisation et notre place dans celle-ci, et l’utilisation qui sera faite avec ce document.

En 2012 [18], le DRI a effectué une enquête auprès de quarante institutions irlandaises sur leurs pratiques en archivage digital et avec des données digitales. Il ressort de cette enquête que les défis viennent surtout de la préservation des données (espaces disponibles, compatibilités futures, formats…) et non pas du partage de celles-ci en Open Access.

Un service semblable en Belgique : Belgica

En Belgique, la KBR possède un département nommé Belgica qu’il est possible de comparer avec le DRI. En effet, Belgica est la bibliothèque numérique de la Bibliothèque royale de Belgique et a pour objectif de rendre accessibles à tout le monde ses collections numérisées mais aussi celles d’autres institutions comme BELSPO, RFN… À côté de la volonté d’Open Access, il y a aussi un désir de préservation des documents grâce à la numérisation des originaux [19]. Nous avions d’ailleurs assisté à une séance de digitalisation d’un manuscrit lors de notre visite de la KBR pour le cours de “Travaux pratiques, visites et séminaires” en 1re année.

La majorité des documents qui se retrouvent sur Belgica sont des documents anciens tels que des manuscrits, des journaux, des cartes, des dessins, des pièces de monnaie… Ceux-ci sont trouvables grâce au catalogue général de la KBR en limitant la recherche aux collections numérisées.

L’objectif de préservation est, toutefois, l’inverse de celui du DRI. Là où le DRI cherche à préserver les documents digitaux en fournissant des services payants à ses membres, Belgica a pour objectif de protéger les documents originaux en favorisant l’accès aux versions numériques.

Conclusion

Depuis quelques années, la viabilité et la pérennité des documents numériques sont fragilisées. Le développement rapide de la technologie a conduit à la disparition de certains logiciels ou systèmes spécifiques et, ainsi, à l’abandon de certains formats de documents. Mais certains de ces documents “obsolètes” restent pertinents ou intéressants. Il convient donc de mettre en oeuvre des politiques et des processus de conservation de tels documents et détendre ces politiques à toutes productions numériques actuelles.

Une fois que cette systématisation de la conservation de contenus numériques est pleinement intégrée dans la politique de gestion des ressources des institutions, il convient de mettre à disposition et de communiquer ces documents propres mais aussi autour de ces documents. En fonction du type de contenu et du propriétaire légal de ce contenu, plusieurs voies de communication sont empruntables. Certains décideront de passer par une voie dont l’accès est payant, ou restreint. On pense, par exemple, aux articles de périodiques accessibles monnayant un abonnement, aux bases de données payantes, etc. Alors que d’autres passent par la voie de l’Open Access.

C’est dans cette optique globale de la conservation mais également de communication et mise à disposition de contenu numérique que des institutions telles que le DRI ou des services tels que Belgica sont créés.

 

Sources

[1] : DIGITAL REPOSITORY OF IRELAND. « Members Benefits » [en ligne]. Mis à jour en février 2018 [consulté le 20 mars 2018]. Disponible sur le Web : <http://dri.ie/sites/default/files/DRI%20Members%20Benefits%202018.pdf>

[2] : LIÈGE UNIVERSITE LIBRARY. « Le mouvement de l’Open Access » [en ligne]. In Bibliothèques ULiège. [Consulté le 20 mars 2018]. Disponible sur le Web : <https://lib.uliege.be/fr/content/le-mouvement-de-l-open-access>

[3] : UCD LIBRARY. « Open Access for Research Impact: What is Open Access? » [en ligne]. In UCD Library. Mis à jour le 22 février 2018 [consulté le 9 mars 2018]. Disponible sur le Web : <http://libguides.ucd.ie/openaccess>

[4] ANDRE, Pascale et DURIEUX, Valérie. « Bibliothèque des Sciences de la Santé : les ressources documentaires en sciences biomédicales » [en ligne]. In Université Libre de Bruxelles. Publié en 2016 [consulté le 31 mars 2018]. Disponible sur le Web : <http://elearning.iessid.be/pluginfile.php/7289/mod_resource/content/1/pr%C3%A9sentation.pdf>

[5] : UCD LIBRARY. « Open Access for Research Impact: Green v. Gold » [en ligne]. In UCD Library. Mis à jour le 20 mars 2018 [consulté le 20 mars 2018]. Disponible sur le Web : <http://libguides.ucd.ie/openaccess/greengold>

[6] : LA TROBE UNIVERSITY LIBRARY. « Green v Gold Open Access » [en ligne]. In La Trobe University Library – College of SHE. Publié le 30 octobre 2013 [consulté le 1 avril 2018]. Disponible sur le Web : <https://fr.slideshare.net/healthsciences/green-versus-gold-open-access>

[7] : HALL, Martin. « Green or gold? Open access after Finch » [en ligne]. Insights. Novembre 2012 [consulté le 1 avril 2018], vol. 25, n°3, p. 235-240. Disponible sur le Web : <https://insights.uksg.org/articles/10.1629/2048-7754.25.3.235/galley/18/download/>

[8] : « Gold or green: which is the best shade of open access? » [en ligne]. In World University Rankings. Publié le 5 juillet 2012 [consulté le 1 avril 2018]. Disponible sur le Web : <https://www.timeshighereducation.com/news/gold-or-green-which-is-the-best-shade-of-open-access/420454.article>

[9] : KENNEY, Anne R. et MCGOVERN, Nancy Y. « The five organizational stages of digital preservation » [en ligne]. In Digital Libraries: A Vision for the 21st Century: A Festschrift in Honor of Wendy Lougee on the Occasion of her Departure from the University of Michigan. Ann Arbor : Michigan Publishing, 2003 [consulté le 15 mars 2018]. Disponible sur le Web : <https://quod.lib.umich.edu/s/spobooks/bbv9812.0001.001/1:11/–digital-libraries-a-vision-for-the-21st-century?rgn=div1;view=fulltext>

[10] : DIGITAL PRESERVATION COALITION. Introduction [en ligne]. Mis à jour en 2018 [consulté le 15 mars 2018]. Disponible sur le Web : <https://www.dpconline.org/handbook/introduction>

[11] : ERWAY, Ricky. « Defining “Born-Digital” » [en ligne]. In Oline Computer Library Center (OCLC). Demystifying Born Digital. Novembre 2010 [consulté le 29 mars 2018]. Disponible sur le Web : <https://www.oclc.org/content/dam/research/activities/hiddencollections/borndigital.pdf>

[12] : ROSENTHAL, David. « Format obsolescence : the prostate cancer of preservation » [en ligne]. In DSHR’s blog. Mis à jour le 7 mai 2007 [consulté le 5 avril 2018]. Disponible sur le Web : <https://blog.dshr.org/2007/05/format-obsolescence-prostate-cancer-of.html#>

[13] : ROSENTHAL, David. « “The prostate cancer of preservation” re-exained » [en ligne]. In DSHR’s blog. Mis à jour le 16 septembre 2015 [consulté le 5 avril 2018]. Disponible sur le Wen : <https://blog.dshr.org/2015/09/the-prostate-cancer-of-preservation-re.html>

[14] : DIGITAL PRESERVATION COALITION. Why digital preservation matters [en ligne]. Mis à jour en 2018 [consulté le 15 mars 2018]. Disponible sur le Web : <https://www.dpconline.org/handbook/digital-preservation/why-digital-preservation-matters>

[15] : WIJERS, Gaby, BOSMA, Hannah. « Born digital cultural heritage is endangered heritage ». In Cultural Coalition for Digital Preservation (CCDP). [consulté le 4 avril 2018]. Disponible sur le Web : <http://www.den.nl/art/uploads/files/Born_Digital_Heritage_summary_ENG_web.pdf>

[16] : DIGITAL PRESERVATION COALITION. Preservation action [en ligne]. Mis à jour en 2018 [consulté le 4 mars 2018]. Disponible sur le Web : <https://www.dpconline.org/handbook/organisational-activities/preservation-action>

[17] : DIGITAL REPOSITORY OF IRELAND (DRI). « Our members » [en ligne]. In Welcome to the DRI. Mise à jour 2018 [consulté le 24 mars 2018]. Disponible sur le Web : <http://www.dri.ie/our-members>

[18] : DIGITAL REPOSITORY OF IRELAND. « Digital Archiving in Ireland
National : Survey of the Humanities and Social Sciences » [en ligne]. Publié en octobre 2012 [consulté le 12 mars 2018]. Disponible sur le Web : <http://dri.ie/digital-archiving-in-ireland-2012.pdf>

[19] : BIBLIOTHÈQUE ROYALE DE BELGIQUE. Belgica – Bibliothèque numérique de la Bibliothèque royale de Belgique [en ligne]. [Consulté le 3 avril 2018]. Disponible sur le Web : <http://belgica.kbr.be/fr/accueil_fr.html>