Projet Gutenberg
Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Le projet Gutenberg fut lancé par Michael Hart en 1971 afin d'assurer, à ce qui deviendra plus tard Internet, une bibliothèque de versions électroniques libres (parfois appelés e-texts) de livres physiquement existants. Les textes fournis sont essentiellement du domaine public, soit parce qu'ils n'ont jamais été sous copyright, soit parce que leur copyright a expiré. Il y a également quelques textes sous copyright rendus disponibles par le projet (Un projet est un engagement irréversible de résultat incertain, non reproductible a priori à l’identique, nécessitant le concours et...) avec la permission de l'auteur. Le projet fut nommé en hommage à l'imprimeur allemand du XVe siècle Johannes Gutenberg. En février 2006, le projet Gutenberg (Le projet Gutenberg fut lancé par Michael Hart en 1971 afin d'assurer, à ce qui deviendra plus tard Internet, une bibliothèque de versions électroniques libres (parfois appelés e-texts) de livres physiquement existants. Les textes fournis...) annonce proposer plus de 18 000 livres dans sa collection.

Information générale

Le slogan (Un slogan est une phrase facilement énoncée et retenue, qui exprime bien une idée qu'on veut diffuser (fonction de recrutement) ou autour de laquelle on veut rassembler (fonction de...) du projet, " brisons les barrières de l'ignorance et de l'illettrisme ", a été choisi parce que le projet espère continuer l'œuvre de répandre le lettrisme et le goût (Pour la faculté de juger les belles choses, voir Goût (esthétique)) pour l'héritage littéraire, ce que commença à faire la bibliothèque publique au début du XXe siècle.

La plupart des parutions du projet Gutenberg sont en anglais. Mais il y en a maintenant un nombre (La notion de nombre en linguistique est traitée à l’article « Nombre grammatical ».) significatif en allemand, français, italien, espagnol, néerlandais, finnois, chinois, et plus de 40 autres langues.

Tous les textes du projet Gutenberg peuvent être acquis et redistribués par les lecteurs sans aucun frais. Le Projet possède la marque déposée du Projet Gutenberg, et l'utilisation commerciale des e-texts sous marque déposée requiert un droit payable au Projet. L'entête ôté et la marque non utilisée, le texte peut être utilisé sans restrictions (il y a quelques textes sous droit d'auteur dans le Projet, qui ont d'autres restrictions.)

Le projet a fait paraître plus de 18 000 livres électroniques, produits presque entièrement par des volontaires, et demeure en activité (Le terme d'activité peut désigner une profession.). Tout (Le tout compris comme ensemble de ce qui existe est souvent interprété comme le monde ou l'univers.) le monde (Le mot monde peut désigner :) peut devenir correcteur en s'inscrivant sur l'un ou l'autre des sites de " distributed proofreaders ", et en se portant volontaire pour la correction page par page.

Des critiques ont été adressées envers quelques e-texts du Projet Gutenberg concernant leur manque d'érudition, par exemple, le détail insuffisant des éditions utilisées et l'omission des préfaces originelles publiées ainsi que de l'appareil critique. À cause de ces défauts, l'édition électronique n'est pas une copie fidèle d'une édition papier (Le papier (du latin papyrus) est une matière fabriquée à partir de fibres cellulosiques végétales et animales. Il se présente sous forme de feuilles minces et...), et elle est inutilisable dans le cadre d'un travail universitaire. La confrontation des premiers e-texts aux nouveaux permet de constater une tendance à la meilleure préservation de tels textes ; la plupart des nouveaux textes conservent l'information et les préfaces de l'édition originale.

Histoire

Le projet a été initié en 1971 par Michael Hart, à l'université (Une université est un établissement d'enseignement supérieur dont l'objectif est la production du savoir (recherche), sa conservation et sa transmission (études...) de l'Illinois aux États-Unis. Ayant eu à sa disposition, grâce à des amis administrateurs, du temps (Le temps est un concept développé par l'être humain pour appréhender le changement dans le monde.) de calcul sur un ordinateur (Un ordinateur est une machine dotée d'une unité de traitement lui permettant d'exécuter des programmes enregistrés. C'est un ensemble de circuits électroniques permettant de...) mainframe estimé à l'époque valoir 100 000 000 dollars, il chercha un moyen de retourner ce qui lui avait été donné. Il estima alors que la plus grande valeur créée par les ordinateurs n'était pas le calcul, mais le stockage, la mise à disposition et la recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue de produire et de développer les connaissances scientifiques. Par extension métonymique, la recherche scientifique...) de ce qui était entreposé dans les bibliothèques. En guise de preuve de concept, il saisit une copie de la déclaration de l'indépendance des États-Unis et l'envoya à tous les utilisateurs du réseau informatique (Un réseau informatique est un ensemble d'équipements reliés entre eux pour échanger des informations. Par analogie avec un filet (un réseau est un « petit rets », c'est-à-dire un petit filet), on appelle...) de l'université (ancêtre de l'internet (Internet est le réseau informatique mondial qui rend accessibles au public des services variés comme le courrier électronique, la messagerie instantanée et le World Wide Web, en utilisant le protocole de communication IP...) moderne). Selon lui, la mise à disposition de ce document (Dans son acception courante un document est généralement défini comme le support physique d'une information.) pour les utilisateurs présents et futurs (Futurs est une collection de science-fiction des Éditions de l'Aurore.) des ordinateurs remboursait sa dette morale. Ce document fut le premier document électronique du projet Gutenberg.

Ensuite, le projet se concentra sur des ouvrages en langue anglaise, en particulier des ouvrages de référence. Le projet s'est ensuite diversifié. Diverses langues sont maintenant représentées, et tous les genres sont couverts, du traité scientifique (Un scientifique est une personne qui se consacre à l'étude d'une science ou des sciences et qui se consacre à l'étude d'un domaine avec la rigueur et les méthodes...) à la littérature de divertissement. Des périodiques sont également mis en ligne.

Un des atouts du projet Gutenberg, qui explique son exceptionnelle longévité (La longévité d'un être vivant est la durée de vie pour laquelle il est biologiquement programmé, dans des conditions idéales et en...), est l'utilisation de textes ASCII, et plus particulièrement de l'ASCII 7 bits. Bien que moins agréables à utiliser, les ouvrages ainsi codés restent lisibles très longtemps et sur toutes les machines. Le projet Gutenberg est ainsi à l'abri de la disparition d'un format, car il est peu probable que l'ASCII disparaisse ou soit radicalement modifié, la base de textes restera donc visible très longtemps. Mais une diversification était indispensable : l'ASCII à 7 bits, en particulier, ne permet pas de noter les caractères accentués, indispensables pour les textes en français, par exemple. On obtient de plus une bien meilleure mise en forme avec un fichier ( Un fichier est un endroit où sont rangées des fiches. Cela peut-être un meuble, une pièce, un bâtiment, une base de données informatique. Par exemple : fichier des patients d'un médecin, fichier des...) au format HTML. Le projet Gutenberg s'est adapté, et on peut aujourd'hui télécharger la plupart des livres en choisissant son format : ASCII 7 bits, Latin-1, HTML (contenant d'éventuelles illustrations), LaTeX (LaTeX est un système logiciel de composition de documents créé par Leslie Lamport. Plus exactement, il s'agit d'une collection de macro-commandes destinées...) pour les ouvrages scientifiques, etc.

Depuis plusieurs années, on discute sur l'utilisation d'un format XML, mais les progrès sur ce point (Graphie) sont lents. Les formats qui ne sont pas facilement éditables, tels que PDF, sont généralement jugés comme ne correspondant pas aux buts du Projet Gutenberg ; certains cependant ont été utilisés par la collection.

Le projet a été hébergé par plusieurs universités, jusqu'en 2000, où le projet Gutenberg a été officiellement organisé sous la forme d'une entité juridique sans but lucratif (non-profit organization en droit américain), dont le statut correspond à peu près à celui des associations loi de 1901 de droit français. En particulier, les dons fait par les citoyens américains à cette organisation (Une organisation est) sont déductibles des impôts.

Distributed Proofreaders

Au début, une personne seule soumettait son texte au site ce qui demandait un important travail, mais un système plus perfectionné a été mis en place. Fondé en 2000, Distributed Proofreaders est maintenant la source principale de livres du projet Gutenberg. Certaines personnes s'occupent de scanner (Un scanneur, ou numériseur à balayage est l'équivalent du terme anglais scanner, qui vient du verbe anglais to scan, signifiant « balayer » dans le sens de « parcourir une certaine étendue ».) les pages et de faire tourner un logiciel (En informatique, un logiciel est un ensemble d'informations relatives à des traitements effectués automatiquement par un appareil informatique. Y sont inclus les instructions de traitement, regroupées...) de reconnaissance optique (L'optique est la branche de la physique qui traite de la lumière, du rayonnement électromagnétique et de ses relations avec la vision.) de caractères. Puis les textes obtenus sont mis à disposition des autres volontaires qui relisent page par page afin de corriger les différentes erreurs laissées par le logiciel de reconnaissance optique. Chaque page est relue au moins deux fois. Enfin, quelqu'un s'occupe de la mise en page en fichier texte, et de l'éventuelle production d'un fichier HTML.

Page générée en 0.088 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique