Brioude Internet Référencement Notre expertise au service de vos projets
Accueil » Actualités » Google » Google et l’interprétation des textes scannés
L'expert de votre visibilité
sur Internet depuis 1998
Google et l’interprétation des textes scannés
Dans son blog officiel, Google annonce aujourd'hui être capable d'interpréter et indexer toute page de texte scannée, grâce à la technologie OCR (Optical Character Recognition). Une image de texte dans un PDF est ainsi convertie en texte, ce qui facilite l'archivage et la recherche d'information. C'est sans doute ce type de procéd
A titre d'exemple, Google propose d'essayer la requête « repairing aluminum wiring », dont le premier résultat est un texte scanné par la CPSP (Consumer Product Safety Commission).

Le résultat est impressionnant comme le prouve la comparaison entre le PDF et la page HTML générée par Google à partir de ce document.


Quel est l'intérêt de tout ceci pour le référencement ? Les documents scannés sont généralement assez peu proposés sur les sites web, et la démonstration de Google n'intéressera que quelques spécialistes en documentation.
Cependant cette information révèle que Google est maintenant parfaitement capable d'interpréter le texte dans les images, ce qui offre de nouvelles possibilités pour la création de site web.
Il était par exemple fortement déconseillé d'utiliser des menus de navigation basés sur des images de texte. Maintenant cela sera possible et on pourra utiliser des styles de police non normalisés et les placer dans des images (évidemment il faudra éviter les polices trop complexes à interpréter).
Ceci étant dit, il faut quand même rappeler qu'un site basé sur des images posera toujours des problèmes d'accessibilité pour certains internautes (personnes malvoyantes par exemple), et que l'utilisation de texte sous forme d'image doit être utilisée avec parcimonie.
