Ouvrir le menu principal

MacGeneration

Recherche

Google Docs passe les fichiers à l'OCR

Florian Innocente

mercredi 23 juin 2010 à 15:24 • 15

Ailleurs

L'OCR figure désormais parmi les services de Google Documents. En envoyant sur son compte un fichier PDF ou une image contenant du texte, Google Docs va tenter de le retranscrire sous une forme exploitable dans son module de traitement de texte. Cette reconnaissance de caractères fonctionne avec le Français, l'Anglais, l'Allemand, l'Italien et l'Espagnol (d'autres langues vont suivre). L'ingénieur en charge de ce projet dit avoir utilisé des technologies développées par l'équipe de Google affectée à la numérisation d'ouvrages (Google Books).

googledococr


Pour le faire fonctionner, il faut cocher l'option "Convertir le texte de fichiers" dans la page d'importation de Google Docs et ne pas dépasser les 1 Mo pour le document à traiter. Aussitôt importé, aussitôt traduit, il est prêt à être édité en ligne ou exporté vers le bureau.

Nous lui avons soumis une capture d'écran (jpeg) de bonne qualité d'un extrait article.

ocrgoogle2

Il faudra repasser derrière… Le nom iPhone par exemple est écorché de différentes manières quand il n'est pas, à un endroit, proprement escamoté. Autre exemple "l'avis" devient "lävis" ; "Apple" parfois est écrit "App|e", etc. Les i et les l semblent en particulier lui donner du fil à retordre.

Cette fonction gratuite peut néanmoins rendre service (le cas échéant, en fonction du résultat), en dégrossissant l'essentiel du texte et évitant ainsi une saisie intégrale.

Soutenez MacGeneration sur Tipeee

MacGeneration a besoin de vous

Vous pouvez nous aider en vous abonnant ou en nous laissant un pourboire

Soutenez MacGeneration sur Tipeee

Canal+ : bientôt la fin du partage de compte ?

09:54

• 27


Transformez votre Mac avec Microsoft Office 2021 à vie pour moins de 45 € 📍

09:32

• 0


Bug Bounty : Apple double la mise pour le noyau, mais met le Mac au régime sec

08:30

• 11


Google aussi reformule les titres d’articles, et ça se passe mal

08:00

• 14


Le Royaume-Uni va mettre en place une taxe kilométrique sur les voitures électriques

07:00

• 115


C'est déjà Noël chez Cultura : le petit guide pour trouver LE cadeau qui fera mouche 📍

02/12/2025 à 23:59

• 0


Mistral Large 3 et Ministral 3 apportent un vent de fraicheur aux modèles d’IA ouverts

02/12/2025 à 23:54

• 12


Séries Apple TV : quand la politique dicte les annulations ou reports

02/12/2025 à 22:17

• 37


Windows 10 (oui oui), bilan Apple Silicon, tests… Les articles du Club iGen publiés en novembre

02/12/2025 à 18:00

• 13


Samsung annonce un SSD externe qui contient un peu d'un smartphone Galaxy

02/12/2025 à 17:15

• 7


Un nouvel adaptateur CR2032 pour empêcher les piles d'exploser dans les Macintosh

02/12/2025 à 15:15

• 10


Linus monte le PC de Linus en vidéo

02/12/2025 à 13:00

• 22


Alan améliore l’accessibilité de macOS en encadrant l’application active

02/12/2025 à 11:15

• 6


Les cours de programmation de Purple Giraffe sont en promotion

02/12/2025 à 11:00

• 0


Matter, Thread et prix serrés : IKEA dévoile sa nouvelle gamme de produits connectés 🆕

02/12/2025 à 10:52

• 87


Le MacBook Air M2 plonge à 748 € sur Amazon (avec 16 Go de RAM) 🆕

02/12/2025 à 09:10

• 84