Google intègre la reconnaissance optique de caractère dans Google Docs
Publié par Publication le 25/06/2010 à 00:00
Après avoir utilisé la technologie OCR (Optical Character Recognition) pour permettre aux internautes de rechercher du texte dans un livre numérisé, Google intègre désormais cet outil dans Google Docs. Cette option, qui était en test depuis Septembre 2009, permet aux utilisateurs d'extraire le texte présent sur une image (JPG, GIF ou PNG) ou sur un fichier ( Un fichier est un endroit où sont rangées des fiches. Cela peut-être un meuble, une pièce, un bâtiment, une base de données informatique. Par exemple : fichier des patients d'un...) PDF.


Google intègre la reconnaissance optique (L'optique est la branche de la physique qui traite de la lumière, du rayonnement électromagnétique et de ses relations avec la vision.) de caractère dans Google Docs
Illustration: Extrait Google Documents

Pour le moment, les langues reconnues sont l'anglais, espagnol, italien, français et allemand. Son utilisation est simple: lors de l'importation d'un fichier, cette nouvelle option apparaît: "Convertir le texte de fichiers image ou PDF au format Google Documents". En la cochant, ce n'est pas le document (Dans son acception courante un document est généralement défini comme le support physique d'une information.) lui-même qui sera importé, mais le texte qu'il contient. Ce document aura les mêmes options qu'un document texte classique, il pourra par exemple être traduit.

Google l'admet, le résultat n'est pas parfait. De nombreuses erreurs peuvent être rencontrées, le formatage initial est rarement conservé. L'OCR fonctionne apparemment mieux avec des images en haute résolution.

Auteur de l'article: Cédric DEPOND
Page générée en 0.543 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique