Over Optical Character Recognition voor Google Documenten


Optical Character Recognition in het kort

Met Optical Character Recognition (OCR, optische tekenherkenning) kunt u beelden met tekst met behulp van geautomatiseerde computeralgoritmen converteren in tekstdocumenten. Afbeeldingen kunnen afzonderlijk worden verwerkt (JPG-, PNG- en GIF-bestanden) of in pdf-documenten (.pdf) met meerdere pagina's. Bestanden die geschikt zijn voor OCR:

  • Afbeeldings- of pdf-bestanden die via flatbedscanners zijn verkregen
  • Foto's die zijn gemaakt met digitale camera's of mobiele telefoons

OCR in Google Drive gebruiken

In Google Documenten worden de door u geüploade afbeeldingen of pdf-bestanden gescand en worden computeralgoritmes gebruikt om het bestand te converteren naar een Google-document.

Voor optimale resultaten moeten de afbeeldings- of pdf-bestanden aan bepaalde vereisten voldoen:

  • Resolutie: bestanden met een hoge resolutie werken het best. We raden als vuistregel voor elke tekstregel in de documenten een hoogte van minstens 10 pixels aan.
  • Afdrukstand: alleen documenten met horizontale tekst van links naar rechts worden herkend. Als u per ongeluk een document in een andere afdrukstand heeft gescand of vastgelegd, kunt u een programma voor afbeeldingsbewerking gebruiken om de afbeeldingen te draaien voordat u ze uploadt naar Google Drive.
  • Talen, lettertypen en tekensets: onze OCR-engine ondersteunt een aantal tekensets, maar de ondersteuning voor niet-Latijnse tekensets is nog in ontwikkeling. U kunt de taal van uw document selecteren in een vervolgkeuzelijst. Veelgebruikte lettertypen zoals Arial en Times New Roman leveren de beste resultaten op.
  • Afbeeldingskwaliteit: scherpe afbeeldingen met gelijkmatige belichting en scherpe contrasten werken het beste. Bewegingsvervaging of onscherp beeld hebben een negatieve invloed op de kwaliteit van de detecteerde tekst.

Beperkingen bestandsgrootte

De maximale grootte voor afbeeldingen (.jpg, .gif, .png) en pdf-bestanden (.pdf) is 2 MB. Bij pdf-bestanden wordt alleen naar de eerste 10 pagina's gekeken bij het zoeken naar tekst om te extraheren.

Tekstopmaak behouden

Bij het verwerken van documenten proberen we de basistekstopmaak te behouden, zoals vet en cursief, lettertype, tekengrootte en regeleinden. Het detecteren van deze elementen is echter lastig en het resultaat is mogelijk niet altijd juist. Andere elementen voor tekstopmaak en structuur, zoals lijsten met opsommingstekens, tabellen, tekstkolommen en voetnoten of eindnoten gaan waarschijnlijk verloren.

OCR kan langer duren dan andere uploads in Google Documenten. Afbeeldingsbestanden (.jpg, .gif, .png) duren maximaal 30 seconden; pdf-bestanden (.pdf) duren maximaal een minuut.