Autor |
Nachricht |
MrZitrone
Threadersteller
Dabei seit: 14.11.2010
Ort: -
Alter: -
Geschlecht: -
|
Verfasst So 14.11.2010 16:14
Titel Schrift in gescannten PDFs verbessern |
|
|
Hallo,
ich bin nicht aus der Medienbranche,
bei meiner Recherche aber auf dieses Forum gestossen.
Ich habe folgendes Problem:
Ich habe einige eingescannte PDFs, die eine schlechte Qualität der Schrift aufweisen.
Sie sind als Bilder abgespeichert. OCR Texterkennung mit Acrobat Prof. habe ich gemacht.
Nun kann ich den Text bearbeiten (unterstreichen etc.). Aber die Qualität des Textes ist immer noch schlecht.
Das nervt mich beim Lesen immer.
Mit der Optimierung von Acrobat konnte ich es nicht wirklich verbessern.
Gibt es eine Möglichkeit, das Schriftbild signifikant zu verbessern? Ggf auch mit Fremdsoftware?
Danke!
|
|
|
|
|
radschlaeger
Moderator
Dabei seit: 10.12.2004
Ort: Neuss
Alter: 57
Geschlecht:
|
Verfasst So 14.11.2010 17:25
Titel
|
|
|
Acrobat ist dazu nicht wirklich geeignet. I.d.R. nutzt man dafür Bildbearbeitungsprogramme wie Photoshop oder Gimp.
Sollte aber die OCR-Funktion von Acrobat gut funktioniert haben, wäre es auch möglich, den Text zu kopieren und in ein Textverarbeitungsprogramm einzusetzen - und dann am Bildschirm oder im Ausdruck zu lesen!
|
|
|
|
|
Anzeige
|
|
|
MrZitrone
Threadersteller
Dabei seit: 14.11.2010
Ort: -
Alter: -
Geschlecht: -
|
Verfasst So 14.11.2010 17:58
Titel
|
|
|
Aber ich wollte keine 500 Seiten einzeln in Photoshop bearbeiten.
Ich dachte, wenn Acrobat die Schrift und die Buchstaben erkannt hat,
könnte man sie durch "saubere" Schriftzeichen ersetzen.
Das mit dem Kopieren hatte ich auch schon probiert, hatte zu viele Fehler drin.
Weiß jetzt nicht, ob es wirklich an der Erkennung liegt, oder an dem Kopieren...
Wie ist es mit Abbyy fine reader? oder Pit Stop?
|
|
|
|
|
Frank Münschke
Forums-Papa
Dabei seit: 08.06.2006
Ort: Essen
Alter: 69
Geschlecht:
|
Verfasst So 14.11.2010 19:44
Titel
|
|
|
weder - noch!
Eine Bearbeitung in Photoshop ist in einem solchen Fall (gleichartige, gleichwertige Vorlagen) sehr gut automatisierbar, und ohne auf die Qualität der Bilddaten Einfluss zu nehmen, werden diese Bilddaten in den PDFs nicht besser ...
|
|
|
|
|
bacon
Dabei seit: 24.10.2007
Ort: -
Alter: -
Geschlecht: -
|
Verfasst So 14.11.2010 20:00
Titel
|
|
|
Der TE hat nix von Bildern gesagt, sondern von Text, wenn ich das richtig verstehe.
Zitat: | Ich dachte, wenn Acrobat die Schrift und die Buchstaben erkannt hat,
könnte man sie durch "saubere" Schriftzeichen ersetzen.
|
Das ist der Sinn von OCR-Software. Diese Programme erstellen bearbeitbare Textdateien. Wenn es Dir darum geht, Deine PDF-Dateien zur späteren Überarbeitung in ein editierbares Format wie bspw. .txt oder .doc zu überführen, ist OCR also das Werkzeug Deiner Wahl.
Möchtest Du nur die Qualität Deiner Druckdateien erhöhen, kannst Du natürlich in gewissen Grenzen mit den Werkzeugen und Filtern eines Bildbearbeitungsprogramms wie Photoshop arbeiten. - aber falls es sich um Nur-Text-Vorlagen handelt, halte ich das für mittleren Schwachsinn.
|
|
|
|
|
Frank Münschke
Forums-Papa
Dabei seit: 08.06.2006
Ort: Essen
Alter: 69
Geschlecht:
|
Verfasst So 14.11.2010 20:50
Titel Re: Schrift in gescannten PDFs verbessern |
|
|
Hallo Schinken
MrZitrone hat geschrieben: | Ich habe einige eingescannte PDFs, die eine schlechte Qualität der Schrift aufweisen. |
Was ist das Anderes als eine PDF in das Textseiten hineingescannt wurden???
Wenn es Text wäre, wäre es vektoriell (also Schrift oder zumindest Pfade), dann gäb es kein Problem der Qualität ...
MrZitrone hat geschrieben: | Das mit dem Kopieren hatte ich auch schon probiert, hatte zu viele Fehler drin. |
Er hat also schon versucht, per eingebauter Acrobat-OCR den Text zu entnehmen, der ist ihm - kein Wunder, wenn die Qualität schlecht ist - allerdings zu fehlerhaft ...
Zuletzt bearbeitet von Frank Münschke am So 14.11.2010 20:51, insgesamt 1-mal bearbeitet
|
|
|
|
|
safer-print
Dabei seit: 11.03.2010
Ort: -
Alter: -
Geschlecht:
|
Verfasst So 14.11.2010 21:12
Titel
|
|
|
Hi MrZitrone,
versuch mal die OCR-Einstellungen 'ClearScan' oder wie die Acrobat Hilfe sagt:
Zitat: | „Scan löschen“
Synthetisiert eine neue Typ 3-Schriften, die dem Original nahe kommt, und erhält den Seitenhintergrund mit geringer Auflösung. |
Wenn der Text richtig erkannt wurde kannst du den Text danach erheblich besser lesen, als vom miesen Scan.
|
|
|
|
|
MrZitrone
Threadersteller
Dabei seit: 14.11.2010
Ort: -
Alter: -
Geschlecht: -
|
Verfasst So 14.11.2010 22:10
Titel
|
|
|
Vielen Dank für die bisherigen Antworten!
Ich habe alles mal probiert.
Clear Scan hat schon etwas gebracht. Allerdings sind einige Artefakte im Text
aufgetaucht. Abbyy fine read hat die Qualität auch einen guten Teil verbessert.
Aber ist das Problem so selten, dass es dafür gar nicht die geniale Softwarelösung gibt?
Kann ich mir gar nicht vorstellen...
Was besagt eigentlich die Einstellung: Bilder neu berechnen auf... dpi?
Und mit welcher Einstellung hat man eine bessere Qualität?
|
|
|
|
|
|
|
|
Ähnliche Themen |
Ladezeiten verbessern - SVG
Usability, Workflow verbessern!
Wie Pagerank bei Google verbessern?
Windows-Soundqualität verbessern
Workflow verbessern: Quellcode & FTP
Bilder verbessern (USB Stick Kamera)
|
|