OCR-Funktion für PDF-Dateien in der OneDrive-App

Originally published at: OCR-Funktion für PDF-Dateien in der OneDrive-App | Büro-Kaizen

Die mobile App von OneDrive erhält endlich die OCR (Optical Character Recognition)-Funktion für bestehende PDF-Dateien.

Damit lässt sich der Text kopieren, hervorheben, unterstreichen und in andere Dokumente oder Apps einfügen. Außerdem sorgt die Texterkennung dafür, dass sich Inhalte noch schneller und genauer durchsuchen lassen.

Bis Ende Januar 2026 soll die Funktion fertig ausgerollt sein.

Die neue Texterkennung per OCR in der OneDrive-App ermöglicht es unter anderem, Inhalte aus PDF-Dateien zu kopieren und in andere Dokumente einzufügen.

Ich verwende die neue Funktion in der OneDrive-App zum direkten Neuerstellen von OCR-PDF über die Scan-Funktion, seitdem ich davon erfahren habe. Soweit ich es feststellen konnte, hat die OCR-Funktion auch eine sehr hohe Erkennungsrate.

Ich habe allerdings bislang in der OneDrive-App noch keine Möglichkeit gefunden, wie hier im Artikel beschrieben, die OCR-Funktion nachträglich auf bereits bestehende PDF anzuwenden. Könnte jemand einmal detailliert erläutern, wie genau man dazu in der App vorgeht?

Zusatzfrage: Vor der Nutzung der OneDrive-Scan-Funktion habe ich, sofern mir Zeit oder Möglichkeit zum professionellen Einscannen fehlten, interessante Texte einfach mit der Kamera-App fotografiert und als JPG abgelegt. Ist jemandem eine Möglichkeit bekannt, diese JPG erst einmal alle schnell (also als Massenfunktion) in PDF umzuwandeln? (Egal, ob per App auf dem Telefon oder per Programm auf dem PC.)

1 „Gefällt mir“

Hallo Michael,

erstmal herzlich willkommen im Forum :slight_smile:

Wenn du bei bestehenden PDFs die OCR Texterkennung nutzen willst, kannst du so vorgehen:

  • PDF in der OneDrive App öffnen
  • länger auf die Grafik mit Text tippen
  • im Kontextmenü „Texterkennung“ auswählen
  • Danach ist der Text auswählbar. Man kann ihn markieren und z.B. in eine E-Mail kopieren.

Ich hoffe das hilft dir.

Lieber Gruß

Marcel

1 „Gefällt mir“

Vielen Dank für die Info!

Ich habe die Funktion jetzt gefunden. Sie ist tatsächlich auch nur bei solchen PDF auswählbar, die nicht bereits einen OCR-Layer eingebettet haben.

Mein Eindruck ist derzeit noch sehr gemischt:

  1. Die Texterkennung ging unglaublich schnell, ein dreiseitiger Brief war in knapp drei Sekunden fertig.

2. Die Texterkennungsrate reichte in meinem Test von nahezu perfekt erkannt bis über mehrere Zeilen lang gar nichts erkannt, bei einer sauber gescannten Briefseite in einheitlicher Schrift.

3. Beim Kopieren des erkannten Textes der gesamten Seite zeigte sich, dass die erkannten Texte nicht in der richtigen Reihenfolge waren, es war eher eine zufällige Verteilung von Textabschnitten, Briefkopf und Fußzeile.

4. Es scheint nicht möglich zu sein, die Datei mit dem erkannten Text abzuspeichern.

Fazit: Um schnell einmal einzelne Textzeilen aus einem Dokument zu kopieren, kann man (mit Glück) diese Funktion nutzen. Für die grundsätzliche PDF-Aufbereitung mit OCR-Layer ist sie (noch) nicht geeignet.

Ich freue mich auf Rückmeldungen, ob jemand andere Erfahrungen gemacht hat.

3 „Gefällt mir“

Vielen Dank für deinen ausführlichen Test-Bericht lieber Michael :folded_hands::+1:

@michael-broda Hallo, :slight_smile:

zu deiner Zusatzfrage: Ich nutze öfter den Anbieter „PDF24“ und fand die Ergebnisse immer ganz gut. ( Bilder in PDF umwandeln - 100% kostenlos & online - PDF24 )
Da muss man sich auch keinen extra Account anlegen und man kann mehrere Bilder auswählen.

Ich hoffe, dass die Lösung für dich funktioniert.

Liebe Grüße
Jacqueline

2 „Gefällt mir“

Vielen Dank für den Tipp! Ich habe es gleich einmal ausprobiert. PDF24 liefert in der Tat gute Ergebnisse und bietet dazu auch noch viele Einstellmöglichkeiten zur Einstellung von Größe bzw. Auflösung des PDFs. Man sollte im Anschluss auf jeden Fall noch die dort ebenfalls angebotene Funktion „PDF komprimieren“ nutzen, da die Bilder erst einmal in Originalgröße in das PDF eingebettet werden, wodurch eine Datei mit mehreren Seite sehr schnell sehr groß wird.

Besonders interessant ist übrigens auch, den gesamten Funktionsumfang der Seite als Desktop-App herunterzuladen. Auch dort wird eine OCR-Funktion angeboten. Bei einem ersten Vergleich mit 20 gescannten Buchseiten konnte ich damit eine Erkennungsqualität erreichen, die der von OneDrive-Scan vergleichbar ist. Nicht perfekt, aber durchaus gut. Zudem ist eine Batch-Verarbeitung von mehreren Dokumenten möglich. Es können dabei sogar verschiedene Ausgangsformate geladen werden, die dann vorher in PDF gewandelt und dann nach Text durchsucht werden.

Das Layout der PDF24-Toolbox kann zwar durchaus als „archaisch“ bezeichnet werden, dies wird durch die umfangreichen Funktionen und Einstellmöglichkeiten aber allemal wettgemacht.

Viele Grüße

Michael

2 „Gefällt mir“

Vielen lieben Dank für deinen Tipp und Erfahrungsbereicht! Das ist gut zu wissen. :slight_smile:

2 „Gefällt mir“