![]() | |
URL | http://gallica.bnf.fr/ |
---|---|
Commercial | non |
Type de site | Bibliothèque numérique |
Langue(s) | Français, Anglais, Espagnol, Portugais |
Siège social | Paris, Île-de-France![]() |
Propriétaire | Bibliothèque nationale de France |
Lancement | 1997 |
modifier |
Gallica est la bibliothèque numérique de la Bibliothèque nationale de France. En libre accès, elle regroupe des livres numérisés, des cartulaires, des revues, des photos et une collection d'enluminures.
Le 10 février 2010, Gallica a franchi le cap du millionième document avec Scènes de la vie de Bohème, d’Henry Murger, 1913. Au 24 février 2010, Gallica proposait à la consultation en ligne 1 020 766 documents dont 408 190 en mode texte : 184 157 livres, 5 462 périodiques, revues et journaux (soit 698 446 fascicules), 120 102 images fixes, 4 722 manuscrits, 9 759 cartes et plans, 2 523 partitions et 1 057 documents sonores, soit un rythme de 1 500 documents numérisés par jour. Une partie a été océrisée et le texte peut faire l'objet de recherche sur Gallica.
À chaque document il est associé un identifiant numérique ARK.
Bien que les premières numérisations datent de 1992, Gallica a été lancée en 1997, avec comme programme d'être la « bibliothèque virtuelle de l'honnête homme ». Elle propose alors un accès aux œuvres ainsi que des dossiers documentaires. Une deuxième version a été mise en ligne en 2000. Les livres et périodiques étaient choisis titre par titre, tandis que les autres médias faisaient l'objet de numérisation par grands ensembles. Le mode image était alors le principal, le mode texte restant limité à des textes saisis pour certains par ailleurs, notamment dans le cadre d'Analyse et traitement informatique de la langue française.
S'y est ajouté par la suite un grand programme de numérisation de la presse quotidienne nationale française ainsi que de publications des sociétés savantes.
En 2005, en réponse à l'initiative de Google Recherche de livres, Jean-Noël Jeanneney publie Quand Google défie l'Europe, où il plaide pour une réaction européenne et notamment française. Suite à cet appel, la Bibliothèque nationale de France s'engage dans la « numérisation de masse » avec une augmentation de la quantité des documents mis à disposition et le basculement progressif vers le mode texte par reconnaissance optique de caractères.
En novembre 2007 est passé un nouveau marché avec Safig qui prévoit la numérisation de 100 000 ouvrages par an sur trois ans, en mode image et en mode texte. Le choix individuel des livres est abandonné au profit d'un système de « tranches de cotes ».
Gallica2, troisième version de Gallica, a été engagée en novembre 2007, l'ancienne version restant alors provisoirement disponible. S'appuyant sur le robot d'indexation Lucene, elle se veut la synthèse de Gallica et du prototype Europeana. Gallica2 cherche à développer la personnalisation de l'interface.
Toujours pour répondre à Google, est lancé un projet d'intégration dans Gallica d'œuvres sous droits, en partenariat entre la Bibliothèque nationale de France, la Direction du livre et de la lecture, le Centre national du Livre et le Syndicat national de l'édition. Le moteur de recherche donne accès à la fois aux documents libres et aux documents sous droits, les diffuseurs restant libres de décider des conditions de consultation du texte intégral. Gallica donne également accès à des bibliothèques virtuelles partenaires via le protocole OAI-PMH.
En mars 2009, l'interface qui avait été provisoirement maintenue est retirée de la consultation, conduisant à la réunification de Gallica et de Gallica2. L'interface change à nouveau le 19 février 2010.
Par ailleurs, le rapport de la mission Tessier, remis le 12 janvier 2010, prévoit des évolutions de Gallica, qui pourrait se détacher de la BnF et devenir une interface de consultation de divers documents numérisés.