Die mobile App von OneDrive erhält endlich die OCR (Optical Character Recognition)-Funktion für bestehende PDF-Dateien.
Damit lässt sich der Text kopieren, hervorheben, unterstreichen und in andere Dokumente oder Apps einfügen. Außerdem sorgt die Texterkennung dafür, dass sich Inhalte noch schneller und genauer durchsuchen lassen.
Bis Ende Januar 2026 soll die Funktion fertig ausgerollt sein.
Die neue Texterkennung per OCR in der OneDrive-App ermöglicht es unter anderem, Inhalte aus PDF-Dateien zu kopieren und in andere Dokumente einzufügen.
Ich verwende die neue Funktion in der OneDrive-App zum direkten Neuerstellen von OCR-PDF über die Scan-Funktion, seitdem ich davon erfahren habe. Soweit ich es feststellen konnte, hat die OCR-Funktion auch eine sehr hohe Erkennungsrate.
Ich habe allerdings bislang in der OneDrive-App noch keine Möglichkeit gefunden, wie hier im Artikel beschrieben, die OCR-Funktion nachträglich auf bereits bestehende PDF anzuwenden. Könnte jemand einmal detailliert erläutern, wie genau man dazu in der App vorgeht?
Zusatzfrage: Vor der Nutzung der OneDrive-Scan-Funktion habe ich, sofern mir Zeit oder Möglichkeit zum professionellen Einscannen fehlten, interessante Texte einfach mit der Kamera-App fotografiert und als JPG abgelegt. Ist jemandem eine Möglichkeit bekannt, diese JPG erst einmal alle schnell (also als Massenfunktion) in PDF umzuwandeln? (Egal, ob per App auf dem Telefon oder per Programm auf dem PC.)
Ich habe die Funktion jetzt gefunden. Sie ist tatsächlich auch nur bei solchen PDF auswählbar, die nicht bereits einen OCR-Layer eingebettet haben.
Mein Eindruck ist derzeit noch sehr gemischt:
Die Texterkennung ging unglaublich schnell, ein dreiseitiger Brief war in knapp drei Sekunden fertig.
2. Die Texterkennungsrate reichte in meinem Test von nahezu perfekt erkannt bis über mehrere Zeilen lang gar nichts erkannt, bei einer sauber gescannten Briefseite in einheitlicher Schrift.
3. Beim Kopieren des erkannten Textes der gesamten Seite zeigte sich, dass die erkannten Texte nicht in der richtigen Reihenfolge waren, es war eher eine zufällige Verteilung von Textabschnitten, Briefkopf und Fußzeile.
4. Es scheint nicht möglich zu sein, die Datei mit dem erkannten Text abzuspeichern.
Fazit: Um schnell einmal einzelne Textzeilen aus einem Dokument zu kopieren, kann man (mit Glück) diese Funktion nutzen. Für die grundsätzliche PDF-Aufbereitung mit OCR-Layer ist sie (noch) nicht geeignet.
Ich freue mich auf Rückmeldungen, ob jemand andere Erfahrungen gemacht hat.
zu deiner Zusatzfrage: Ich nutze öfter den Anbieter „PDF24“ und fand die Ergebnisse immer ganz gut. ( Bilder in PDF umwandeln - 100% kostenlos & online - PDF24 )
Da muss man sich auch keinen extra Account anlegen und man kann mehrere Bilder auswählen.
Vielen Dank für den Tipp! Ich habe es gleich einmal ausprobiert. PDF24 liefert in der Tat gute Ergebnisse und bietet dazu auch noch viele Einstellmöglichkeiten zur Einstellung von Größe bzw. Auflösung des PDFs. Man sollte im Anschluss auf jeden Fall noch die dort ebenfalls angebotene Funktion „PDF komprimieren“ nutzen, da die Bilder erst einmal in Originalgröße in das PDF eingebettet werden, wodurch eine Datei mit mehreren Seite sehr schnell sehr groß wird.
Besonders interessant ist übrigens auch, den gesamten Funktionsumfang der Seite als Desktop-App herunterzuladen. Auch dort wird eine OCR-Funktion angeboten. Bei einem ersten Vergleich mit 20 gescannten Buchseiten konnte ich damit eine Erkennungsqualität erreichen, die der von OneDrive-Scan vergleichbar ist. Nicht perfekt, aber durchaus gut. Zudem ist eine Batch-Verarbeitung von mehreren Dokumenten möglich. Es können dabei sogar verschiedene Ausgangsformate geladen werden, die dann vorher in PDF gewandelt und dann nach Text durchsucht werden.
Das Layout der PDF24-Toolbox kann zwar durchaus als „archaisch“ bezeichnet werden, dies wird durch die umfangreichen Funktionen und Einstellmöglichkeiten aber allemal wettgemacht.