mediengestalter.info
FAQ :: Mitgliederliste :: MGi Team

Willkommen auf dem Portal für Mediengestalter

Aktuelles Datum und Uhrzeit: Mo 01.12.2008 23:33 Benutzername: Passwort: Auto-Login

Thema: Daten extrahieren aus PDF vom 16.06.2004

Neues Thema eröffnen   Neue Antwort erstellen MGi Foren-Übersicht -> Software - Print -> Daten extrahieren aus PDF
Autor Nachricht
Unterbezirksdada
Threadersteller

Dabei seit: 18.03.2004
Ort: -
Alter: -
Geschlecht: -
Verfasst Mi 16.06.2004 13:01
Titel

Daten extrahieren aus PDF

Antworten mit Zitat Zum Seitenanfang

Folgendes Problem,

ich habe 12 PDF Dokumente mit ca 220 Seiten Daten insgesamt. Es ist ein Katalog mit Daten, die wie in Tabellen gesetzt aussehen.
Meine Aufgabe besteht nun darin diese Daten zu extrahieren und in eine Exel Tabelle einzufügen. Dies ist wichtig da die Daten in einer Datenbank für eine Webseite weiter verarbeitet werden sollen.

Wenn ich nun den Text mit dem Textwerkzeug markiere, kopiere und in Exel einfüge erhalte ich immer nur unformatierte Daten, d.h. alle Zahlen und Worte werden hintereinander in eine Zelle eingefügt. Ich brauche sie aber schön nach Spalten und Zeilen sortiert.

Bisher habe ich keine Möglichkeit gefunden das Problem elegant zu lösen. Ich habe die PDF Dateien in Corel importiert, als JPG exportiert und dann durch ein OCR gejagt und im EXEL Format exportiert. Klappt - ist aber von hinten durch die Brust geschossen.

Wer hat eine gute Idee.

Unterbezirksdada
  View user's profile Private Nachricht senden
Achim M.

Dabei seit: 17.03.2003
Ort: Mönchengladbach
Alter: 38
Geschlecht: Männlich
Verfasst Mi 16.06.2004 13:17
Titel

Antworten mit Zitat Zum Seitenanfang

In Acrobat 6 gibt es ein Tabellenauswahlwerkzeug (steht unter dem Textbearbeitungswerkzeug), damit kann man Tabellentexte extrahieren und in Excel einsetzen. Man darf zwar bei komplexen Tabellen keine Wunder erwarten, aber es ist doch etwas einfacher als Deine Methode.

In der Windows-Version von Acrobat 5 gab es dieses Werkzeug meines Wissens auch schon.

Gruß

Achim
  View user's profile Private Nachricht senden Website dieses Benutzers besuchen
Unterbezirksdada
Threadersteller

Dabei seit: 18.03.2004
Ort: -
Alter: -
Geschlecht: -
Verfasst Mi 16.06.2004 13:24
Titel

Antworten mit Zitat Zum Seitenanfang

Das war der entscheidende Hinweis * Applaus, Applaus *

Mein Acrobat Lehrer kannte die Funktion nicht * Ööhm... ja? *

Unterbezirksdada
  View user's profile Private Nachricht senden
 
Ähnliche Themen Bilder aus PDF extrahieren
Schrift aus PDF extrahieren??
Wie Schriften aus PDF extrahieren?
wie Fotos aus PDF extrahieren?
CMYK PDF in RGB und Seiten extrahieren? Bitte helfen.
Personalisieren von PDF-Daten
Neues Thema eröffnen   Neue Antwort erstellen
MGi Foren-Übersicht -> Software - Print


Du kannst keine Beiträge in dieses Forum schreiben.
Du kannst auf Beiträge in diesem Forum nicht antworten.
Du kannst deine Beiträge in diesem Forum nicht bearbeiten.
Du kannst deine Beiträge in diesem Forum nicht löschen.
Du kannst an Umfragen in diesem Forum nicht mitmachen.