mediengestalter.info
FAQ :: Mitgliederliste :: MGi Team

Willkommen auf dem Portal für Mediengestalter

Aktuelles Datum und Uhrzeit: Do 28.03.2024 14:46 Benutzername: Passwort: Auto-Login

Thema: Schrift in gescannten PDFs verbessern vom 14.11.2010


Neues Thema eröffnen   Neue Antwort erstellen MGi Foren-Übersicht -> Software - Nonprint -> Schrift in gescannten PDFs verbessern
Seite: 1, 2  Weiter
Autor Nachricht
MrZitrone
Threadersteller

Dabei seit: 14.11.2010
Ort: -
Alter: -
Geschlecht: -
Verfasst So 14.11.2010 16:14
Titel

Schrift in gescannten PDFs verbessern

Antworten mit Zitat Zum Seitenanfang

Hallo,
ich bin nicht aus der Medienbranche,
bei meiner Recherche aber auf dieses Forum gestossen.
Ich habe folgendes Problem:

Ich habe einige eingescannte PDFs, die eine schlechte Qualität der Schrift aufweisen.
Sie sind als Bilder abgespeichert. OCR Texterkennung mit Acrobat Prof. habe ich gemacht.
Nun kann ich den Text bearbeiten (unterstreichen etc.). Aber die Qualität des Textes ist immer noch schlecht.
Das nervt mich beim Lesen immer.
Mit der Optimierung von Acrobat konnte ich es nicht wirklich verbessern.
Gibt es eine Möglichkeit, das Schriftbild signifikant zu verbessern? Ggf auch mit Fremdsoftware?

Danke!
  View user's profile Private Nachricht senden
radschlaeger
Moderator

Dabei seit: 10.12.2004
Ort: Neuss
Alter: 57
Geschlecht: Männlich
Verfasst So 14.11.2010 17:25
Titel

Antworten mit Zitat Zum Seitenanfang

Acrobat ist dazu nicht wirklich geeignet. I.d.R. nutzt man dafür Bildbearbeitungsprogramme wie Photoshop oder Gimp.

Sollte aber die OCR-Funktion von Acrobat gut funktioniert haben, wäre es auch möglich, den Text zu kopieren und in ein Textverarbeitungsprogramm einzusetzen - und dann am Bildschirm oder im Ausdruck zu lesen!
  View user's profile Private Nachricht senden
Anzeige
Anzeige
MrZitrone
Threadersteller

Dabei seit: 14.11.2010
Ort: -
Alter: -
Geschlecht: -
Verfasst So 14.11.2010 17:58
Titel

Antworten mit Zitat Zum Seitenanfang

Aber ich wollte keine 500 Seiten einzeln in Photoshop bearbeiten.
Ich dachte, wenn Acrobat die Schrift und die Buchstaben erkannt hat,
könnte man sie durch "saubere" Schriftzeichen ersetzen.
Das mit dem Kopieren hatte ich auch schon probiert, hatte zu viele Fehler drin.
Weiß jetzt nicht, ob es wirklich an der Erkennung liegt, oder an dem Kopieren...
Wie ist es mit Abbyy fine reader? oder Pit Stop?
  View user's profile Private Nachricht senden
Frank Münschke
Forums-Papa

Dabei seit: 08.06.2006
Ort: Essen
Alter: 69
Geschlecht: Männlich
Verfasst So 14.11.2010 19:44
Titel

Antworten mit Zitat Zum Seitenanfang

weder - noch!
Eine Bearbeitung in Photoshop ist in einem solchen Fall (gleichartige, gleichwertige Vorlagen) sehr gut automatisierbar, und ohne auf die Qualität der Bilddaten Einfluss zu nehmen, werden diese Bilddaten in den PDFs nicht besser ...
  View user's profile Private Nachricht senden Website dieses Benutzers besuchen
bacon

Dabei seit: 24.10.2007
Ort: -
Alter: -
Geschlecht: -
Verfasst So 14.11.2010 20:00
Titel

Antworten mit Zitat Zum Seitenanfang

Der TE hat nix von Bildern gesagt, sondern von Text, wenn ich das richtig verstehe.

Zitat:
Ich dachte, wenn Acrobat die Schrift und die Buchstaben erkannt hat,
könnte man sie durch "saubere" Schriftzeichen ersetzen.


Das ist der Sinn von OCR-Software. Diese Programme erstellen bearbeitbare Textdateien. Wenn es Dir darum geht, Deine PDF-Dateien zur späteren Überarbeitung in ein editierbares Format wie bspw. .txt oder .doc zu überführen, ist OCR also das Werkzeug Deiner Wahl.

Möchtest Du nur die Qualität Deiner Druckdateien erhöhen, kannst Du natürlich in gewissen Grenzen mit den Werkzeugen und Filtern eines Bildbearbeitungsprogramms wie Photoshop arbeiten. - aber falls es sich um Nur-Text-Vorlagen handelt, halte ich das für mittleren Schwachsinn.
  View user's profile Private Nachricht senden
Frank Münschke
Forums-Papa

Dabei seit: 08.06.2006
Ort: Essen
Alter: 69
Geschlecht: Männlich
Verfasst So 14.11.2010 20:50
Titel

Re: Schrift in gescannten PDFs verbessern

Antworten mit Zitat Zum Seitenanfang

Hallo Schinken
MrZitrone hat geschrieben:
Ich habe einige eingescannte PDFs, die eine schlechte Qualität der Schrift aufweisen.

Was ist das Anderes als eine PDF in das Textseiten hineingescannt wurden???
Wenn es Text wäre, wäre es vektoriell (also Schrift oder zumindest Pfade), dann gäb es kein Problem der Qualität ...
MrZitrone hat geschrieben:
Das mit dem Kopieren hatte ich auch schon probiert, hatte zu viele Fehler drin.

Er hat also schon versucht, per eingebauter Acrobat-OCR den Text zu entnehmen, der ist ihm - kein Wunder, wenn die Qualität schlecht ist - allerdings zu fehlerhaft ...


Zuletzt bearbeitet von Frank Münschke am So 14.11.2010 20:51, insgesamt 1-mal bearbeitet
  View user's profile Private Nachricht senden Website dieses Benutzers besuchen
safer-print

Dabei seit: 11.03.2010
Ort: -
Alter: -
Geschlecht: Männlich
Verfasst So 14.11.2010 21:12
Titel

Antworten mit Zitat Zum Seitenanfang

Hi MrZitrone,

versuch mal die OCR-Einstellungen 'ClearScan' oder wie die Acrobat Hilfe sagt:
Zitat:
„Scan löschen“
Synthetisiert eine neue Typ 3-Schriften, die dem Original nahe kommt, und erhält den Seitenhintergrund mit geringer Auflösung.




Wenn der Text richtig erkannt wurde kannst du den Text danach erheblich besser lesen, als vom miesen Scan.
  View user's profile Private Nachricht senden Website dieses Benutzers besuchen
MrZitrone
Threadersteller

Dabei seit: 14.11.2010
Ort: -
Alter: -
Geschlecht: -
Verfasst So 14.11.2010 22:10
Titel

Antworten mit Zitat Zum Seitenanfang

Vielen Dank für die bisherigen Antworten!
Ich habe alles mal probiert.
Clear Scan hat schon etwas gebracht. Allerdings sind einige Artefakte im Text
aufgetaucht. Abbyy fine read hat die Qualität auch einen guten Teil verbessert.
Aber ist das Problem so selten, dass es dafür gar nicht die geniale Softwarelösung gibt?
Kann ich mir gar nicht vorstellen...
Was besagt eigentlich die Einstellung: Bilder neu berechnen auf... dpi?
Und mit welcher Einstellung hat man eine bessere Qualität?
  View user's profile Private Nachricht senden
 
Ähnliche Themen Ladezeiten verbessern - SVG
Usability, Workflow verbessern!
Wie Pagerank bei Google verbessern?
Windows-Soundqualität verbessern
Workflow verbessern: Quellcode & FTP
Bilder verbessern (USB Stick Kamera)
Neues Thema eröffnen   Neue Antwort erstellen Seite: 1, 2  Weiter
MGi Foren-Übersicht -> Software - Nonprint


Du kannst keine Beiträge in dieses Forum schreiben.
Du kannst auf Beiträge in diesem Forum nicht antworten.
Du kannst an Umfragen in diesem Forum nicht mitmachen.