Autor |
Nachricht |
Unterbezirksdada
Threadersteller
Dabei seit: 18.03.2004
Ort: -
Alter: -
Geschlecht: -
|
Verfasst Mi 16.06.2004 13:01
Titel Daten extrahieren aus PDF |
|
|
Folgendes Problem,
ich habe 12 PDF Dokumente mit ca 220 Seiten Daten insgesamt. Es ist ein Katalog mit Daten, die wie in Tabellen gesetzt aussehen.
Meine Aufgabe besteht nun darin diese Daten zu extrahieren und in eine Exel Tabelle einzufügen. Dies ist wichtig da die Daten in einer Datenbank für eine Webseite weiter verarbeitet werden sollen.
Wenn ich nun den Text mit dem Textwerkzeug markiere, kopiere und in Exel einfüge erhalte ich immer nur unformatierte Daten, d.h. alle Zahlen und Worte werden hintereinander in eine Zelle eingefügt. Ich brauche sie aber schön nach Spalten und Zeilen sortiert.
Bisher habe ich keine Möglichkeit gefunden das Problem elegant zu lösen. Ich habe die PDF Dateien in Corel importiert, als JPG exportiert und dann durch ein OCR gejagt und im EXEL Format exportiert. Klappt - ist aber von hinten durch die Brust geschossen.
Wer hat eine gute Idee.
Unterbezirksdada
|
|
|
|
|
Achim M.
Dabei seit: 17.03.2003
Ort: -
Alter: -
Geschlecht:
|
Verfasst Mi 16.06.2004 13:17
Titel
|
|
|
In Acrobat 6 gibt es ein Tabellenauswahlwerkzeug (steht unter dem Textbearbeitungswerkzeug), damit kann man Tabellentexte extrahieren und in Excel einsetzen. Man darf zwar bei komplexen Tabellen keine Wunder erwarten, aber es ist doch etwas einfacher als Deine Methode.
In der Windows-Version von Acrobat 5 gab es dieses Werkzeug meines Wissens auch schon.
Gruß
Achim
|
|
|
|
|
Anzeige
|
|
|
Unterbezirksdada
Threadersteller
Dabei seit: 18.03.2004
Ort: -
Alter: -
Geschlecht: -
|
Verfasst Mi 16.06.2004 13:24
Titel
|
|
|
Das war der entscheidende Hinweis
Mein Acrobat Lehrer kannte die Funktion nicht
Unterbezirksdada
|
|
|
|
|
idwerbung
Dabei seit: 13.05.2009
Ort: Thüringen
Alter: 39
Geschlecht:
|
Verfasst Mi 25.05.2011 15:25
Titel
|
|
|
Ich erlaube mir mal den Thread für ein mich selbst neu zu erwecken:
Ich habe eine ca. 1GB Große PDF-Datei mit ca. 75 - 80 Fotos. Diese Versuche ich seit Stunden vergebens in Illustrator oder Corel zu öffnen (CS5.1 / X5). Auch das einzelne kopieren der Bilder aus der PDF funktioniert nicht. Hier wird mir immer weider nur ein schwarzes Bild eingefügt.
Beim Öffnen im Illustrator meckert er, dass er die einzelnen Bilder nicht finden kann. Sehe ich sie mir aber im Reader an ist alles ok.
Ich bin für jede Hilfe Dankbar. Der Kunde sitzt in New York und ist nicht wirklich oft zu erreichen. Mal davon abgesehen, dass die Daten immer über einen dritten kommen.
Grüße
Axel
|
|
|
|
|
Typografit
Dabei seit: 31.01.2006
Ort: -
Alter: 61
Geschlecht:
|
Verfasst Mi 25.05.2011 15:31
Titel
|
|
|
idwerbung hat geschrieben: | Ich erlaube mir mal den Thread für ein mich selbst neu zu erwecken:
Ich habe eine ca. 1GB Große PDF-Datei mit ca. 75 - 80 Fotos. Diese Versuche ich seit Stunden vergebens in Illustrator oder Corel zu öffnen (CS5.1 / X5). Auch das einzelne kopieren der Bilder aus der PDF funktioniert nicht. Hier wird mir immer weider nur ein schwarzes Bild eingefügt.
Beim Öffnen im Illustrator meckert er, dass er die einzelnen Bilder nicht finden kann. Sehe ich sie mir aber im Reader an ist alles ok.
Ich bin für jede Hilfe Dankbar. Der Kunde sitzt in New York und ist nicht wirklich oft zu erreichen. Mal davon abgesehen, dass die Daten immer über einen dritten kommen.
Grüße
Axel |
BItte lass die Leichen im Keller. Das ist ein 7 Jahre alter Beitrag. Das ist rekordverdächtig. So was wird Leichenschänderei genannt. Die damals berwendeten Programmversionen gibts nicht mehr. Dein Problem hat zudem mit dem hier geschilderten NICHTS zu tun.
Mach eine neue Frage auf, darauf kann sinnvoll geantwortet werden.
|
|
|
|
|
idwerbung
Dabei seit: 13.05.2009
Ort: Thüringen
Alter: 39
Geschlecht:
|
Verfasst Mi 25.05.2011 15:38
Titel
|
|
|
Der Titel lautet: " Daten extrahieren aus PDF" ... darum geht es auch.
Wo ist das Problem? - Ok, der Beitrag ist alt ... passt aber dennoch zum angesprochenen Problem, denn ich will Daten aus einer PDF extrahieren um sie anschließend weiter zu verarbeiten.
Grüße
Axel
|
|
|
|
|
Typografit
Dabei seit: 31.01.2006
Ort: -
Alter: 61
Geschlecht:
|
Verfasst Mi 25.05.2011 15:41
Titel
|
|
|
idwerbung hat geschrieben: | Der Titel lautet: " Daten extrahieren aus PDF" ... darum geht es auch.
Wo ist das Problem? - Ok, der Beitrag ist alt ... passt aber dennoch zum angesprochenen Problem, denn ich will Daten aus einer PDF extrahieren um sie anschließend weiter zu verarbeiten.
Grüße
Axel | Das hat mit dem Thema NICHTS zu tun. Oder siehst Du hier Illustrator? Frage in einem neuen Thread oder suche einen, der zum Thema passt. Aber nicht dieser.
|
|
|
|
|
Eifelyeti
Dabei seit: 11.03.2006
Ort: -
Alter: 41
Geschlecht:
|
Verfasst Mi 25.05.2011 15:42
Titel
|
|
|
Sonst beschweren sich immer alle, dass man die Suche nicht benutzt...
Man muss halt was zum Meckern haben
|
|
|
|
|
|
|
|
Ähnliche Themen |
Illustrator CS2 - extrahieren
kanäle extrahieren
Vektorgrafik aus pdf extrahieren
wie Fotos aus PDF extrahieren?
Bilder aus PDF extrahieren
Profile extrahieren...
|
|