mediengestalter.info
FAQ :: Mitgliederliste :: MGi Team

Willkommen auf dem Portal für Mediengestalter

Aktuelles Datum und Uhrzeit: So 04.12.2016 03:02 Benutzername: Passwort: Auto-Login

Thema: Daten extrahieren aus PDF vom 16.06.2004


Neues Thema eröffnen   Neue Antwort erstellen MGi Foren-Übersicht -> Software - Print -> Daten extrahieren aus PDF
Seite: 1, 2, 3  Weiter
Autor Nachricht
Unterbezirksdada
Threadersteller

Dabei seit: 18.03.2004
Ort: -
Alter: -
Geschlecht: -
Verfasst Mi 16.06.2004 13:01
Titel

Daten extrahieren aus PDF

Antworten mit Zitat Zum Seitenanfang

Folgendes Problem,

ich habe 12 PDF Dokumente mit ca 220 Seiten Daten insgesamt. Es ist ein Katalog mit Daten, die wie in Tabellen gesetzt aussehen.
Meine Aufgabe besteht nun darin diese Daten zu extrahieren und in eine Exel Tabelle einzufügen. Dies ist wichtig da die Daten in einer Datenbank für eine Webseite weiter verarbeitet werden sollen.

Wenn ich nun den Text mit dem Textwerkzeug markiere, kopiere und in Exel einfüge erhalte ich immer nur unformatierte Daten, d.h. alle Zahlen und Worte werden hintereinander in eine Zelle eingefügt. Ich brauche sie aber schön nach Spalten und Zeilen sortiert.

Bisher habe ich keine Möglichkeit gefunden das Problem elegant zu lösen. Ich habe die PDF Dateien in Corel importiert, als JPG exportiert und dann durch ein OCR gejagt und im EXEL Format exportiert. Klappt - ist aber von hinten durch die Brust geschossen.

Wer hat eine gute Idee.

Unterbezirksdada
  View user's profile Private Nachricht senden
Achim M.

Dabei seit: 17.03.2003
Ort: -
Alter: -
Geschlecht: Männlich
Verfasst Mi 16.06.2004 13:17
Titel

Antworten mit Zitat Zum Seitenanfang

In Acrobat 6 gibt es ein Tabellenauswahlwerkzeug (steht unter dem Textbearbeitungswerkzeug), damit kann man Tabellentexte extrahieren und in Excel einsetzen. Man darf zwar bei komplexen Tabellen keine Wunder erwarten, aber es ist doch etwas einfacher als Deine Methode.

In der Windows-Version von Acrobat 5 gab es dieses Werkzeug meines Wissens auch schon.

Gruß

Achim
  View user's profile Private Nachricht senden
Anzeige
Anzeige
Unterbezirksdada
Threadersteller

Dabei seit: 18.03.2004
Ort: -
Alter: -
Geschlecht: -
Verfasst Mi 16.06.2004 13:24
Titel

Antworten mit Zitat Zum Seitenanfang

Das war der entscheidende Hinweis * Applaus, Applaus *

Mein Acrobat Lehrer kannte die Funktion nicht * Ööhm... ja? *

Unterbezirksdada
  View user's profile Private Nachricht senden
idwerbung

Dabei seit: 13.05.2009
Ort: Thüringen
Alter: 32
Geschlecht: Männlich
Verfasst Mi 25.05.2011 15:25
Titel

Antworten mit Zitat Zum Seitenanfang

Ich erlaube mir mal den Thread für ein mich selbst neu zu erwecken:

Ich habe eine ca. 1GB Große PDF-Datei mit ca. 75 - 80 Fotos. Diese Versuche ich seit Stunden vergebens in Illustrator oder Corel zu öffnen (CS5.1 / X5). Auch das einzelne kopieren der Bilder aus der PDF funktioniert nicht. Hier wird mir immer weider nur ein schwarzes Bild eingefügt.

Beim Öffnen im Illustrator meckert er, dass er die einzelnen Bilder nicht finden kann. Sehe ich sie mir aber im Reader an ist alles ok.

Ich bin für jede Hilfe Dankbar. Der Kunde sitzt in New York und ist nicht wirklich oft zu erreichen. Mal davon abgesehen, dass die Daten immer über einen dritten kommen.

Grüße
Axel
  View user's profile Private Nachricht senden
Typografit

Dabei seit: 31.01.2006
Ort: München
Alter: 53
Geschlecht: Männlich
Verfasst Mi 25.05.2011 15:31
Titel

Antworten mit Zitat Zum Seitenanfang

idwerbung hat geschrieben:
Ich erlaube mir mal den Thread für ein mich selbst neu zu erwecken:

Ich habe eine ca. 1GB Große PDF-Datei mit ca. 75 - 80 Fotos. Diese Versuche ich seit Stunden vergebens in Illustrator oder Corel zu öffnen (CS5.1 / X5). Auch das einzelne kopieren der Bilder aus der PDF funktioniert nicht. Hier wird mir immer weider nur ein schwarzes Bild eingefügt.

Beim Öffnen im Illustrator meckert er, dass er die einzelnen Bilder nicht finden kann. Sehe ich sie mir aber im Reader an ist alles ok.

Ich bin für jede Hilfe Dankbar. Der Kunde sitzt in New York und ist nicht wirklich oft zu erreichen. Mal davon abgesehen, dass die Daten immer über einen dritten kommen.

Grüße
Axel

BItte lass die Leichen im Keller. Das ist ein 7 Jahre alter Beitrag. Das ist rekordverdächtig. So was wird Leichenschänderei genannt. Die damals berwendeten Programmversionen gibts nicht mehr. Dein Problem hat zudem mit dem hier geschilderten NICHTS zu tun.
Mach eine neue Frage auf, darauf kann sinnvoll geantwortet werden.
  View user's profile Private Nachricht senden
idwerbung

Dabei seit: 13.05.2009
Ort: Thüringen
Alter: 32
Geschlecht: Männlich
Verfasst Mi 25.05.2011 15:38
Titel

Antworten mit Zitat Zum Seitenanfang

Der Titel lautet: " Daten extrahieren aus PDF" ... darum geht es auch.
Wo ist das Problem? - Ok, der Beitrag ist alt ... passt aber dennoch zum angesprochenen Problem, denn ich will Daten aus einer PDF extrahieren um sie anschließend weiter zu verarbeiten.

Grüße
Axel
  View user's profile Private Nachricht senden
Typografit

Dabei seit: 31.01.2006
Ort: München
Alter: 53
Geschlecht: Männlich
Verfasst Mi 25.05.2011 15:41
Titel

Antworten mit Zitat Zum Seitenanfang

idwerbung hat geschrieben:
Der Titel lautet: " Daten extrahieren aus PDF" ... darum geht es auch.
Wo ist das Problem? - Ok, der Beitrag ist alt ... passt aber dennoch zum angesprochenen Problem, denn ich will Daten aus einer PDF extrahieren um sie anschließend weiter zu verarbeiten.

Grüße
Axel
Das hat mit dem Thema NICHTS zu tun. Oder siehst Du hier Illustrator? Frage in einem neuen Thread oder suche einen, der zum Thema passt. Aber nicht dieser.
  View user's profile Private Nachricht senden
Eifelyeti

Dabei seit: 11.03.2006
Ort: -
Alter: 34
Geschlecht: Männlich
Verfasst Mi 25.05.2011 15:42
Titel

Antworten mit Zitat Zum Seitenanfang

Sonst beschweren sich immer alle, dass man die Suche nicht benutzt...

Man muss halt was zum Meckern haben *ha ha*
  View user's profile Private Nachricht senden
 
Ähnliche Themen Bilder aus PDF extrahieren
Schrift aus PDF extrahieren??
Wie Schriften aus PDF extrahieren?
wie Fotos aus PDF extrahieren?
Graphiken als PDF extrahieren
Vektorgrafik aus pdf extrahieren
Neues Thema eröffnen   Neue Antwort erstellen Seite: 1, 2, 3  Weiter
MGi Foren-Übersicht -> Software - Print


Du kannst keine Beiträge in dieses Forum schreiben.
Du kannst auf Beiträge in diesem Forum nicht antworten.
Du kannst an Umfragen in diesem Forum nicht mitmachen.