| Autor |
Nachricht |
Unterbezirksdada
Threadersteller
Dabei seit: 18.03.2004
Ort: -
Alter: -
Geschlecht: -
|
Verfasst Mi 16.06.2004 13:01
Titel Daten extrahieren aus PDF |
 |
|
Folgendes Problem,
ich habe 12 PDF Dokumente mit ca 220 Seiten Daten insgesamt. Es ist ein Katalog mit Daten, die wie in Tabellen gesetzt aussehen.
Meine Aufgabe besteht nun darin diese Daten zu extrahieren und in eine Exel Tabelle einzufügen. Dies ist wichtig da die Daten in einer Datenbank für eine Webseite weiter verarbeitet werden sollen.
Wenn ich nun den Text mit dem Textwerkzeug markiere, kopiere und in Exel einfüge erhalte ich immer nur unformatierte Daten, d.h. alle Zahlen und Worte werden hintereinander in eine Zelle eingefügt. Ich brauche sie aber schön nach Spalten und Zeilen sortiert.
Bisher habe ich keine Möglichkeit gefunden das Problem elegant zu lösen. Ich habe die PDF Dateien in Corel importiert, als JPG exportiert und dann durch ein OCR gejagt und im EXEL Format exportiert. Klappt - ist aber von hinten durch die Brust geschossen.
Wer hat eine gute Idee.
Unterbezirksdada
|
|
| |
|
 |
Achim M.
Dabei seit: 17.03.2003
Ort: Mönchengladbach
Alter: 38
Geschlecht:
|
Verfasst Mi 16.06.2004 13:17
Titel
|
 |
|
In Acrobat 6 gibt es ein Tabellenauswahlwerkzeug (steht unter dem Textbearbeitungswerkzeug), damit kann man Tabellentexte extrahieren und in Excel einsetzen. Man darf zwar bei komplexen Tabellen keine Wunder erwarten, aber es ist doch etwas einfacher als Deine Methode.
In der Windows-Version von Acrobat 5 gab es dieses Werkzeug meines Wissens auch schon.
Gruß
Achim
|
|
| |
|
 |
Unterbezirksdada
Threadersteller
Dabei seit: 18.03.2004
Ort: -
Alter: -
Geschlecht: -
|
Verfasst Mi 16.06.2004 13:24
Titel
|
 |
|
Das war der entscheidende Hinweis
Mein Acrobat Lehrer kannte die Funktion nicht
Unterbezirksdada
|
|
| |
|
 |
| |
|
 |
| Ähnliche Themen |
Bilder aus PDF extrahieren
Schrift aus PDF extrahieren??
Wie Schriften aus PDF extrahieren?
wie Fotos aus PDF extrahieren?
CMYK PDF in RGB und Seiten extrahieren? Bitte helfen.
Personalisieren von PDF-Daten
|
 |