Dabei seit: 26.03.2003 Ort: - Alter: 28 Geschlecht:
Verfasst Do 01.09.2005 14:30 Titel
Spider programmieren
Hi Leute,
ich würde mich gerne ein wenig mit der Technik von Spidern und anderen Bots beschäftigen und würde durchaus auch mal gern einen programmieren.
Hat da jemand gute Quellen?
Bin für jeden Link und/ oder Buchtip dankbar.
Gruß,
die Wurst
Lazy-GoD
Co-Administrator
Dabei seit: 26.11.2001 Ort: Schönste Stadt der Welt Alter: 30 Geschlecht:
Verfasst Fr 02.09.2005 00:33 Titel
Kommt man da mit bisschen Nachdenken nicht selber drauf? Was willst du da mit nem Buch? Was soll da drinstehen?
gtz
Dabei seit: 15.04.2002 Ort: - Alter: 33 Geschlecht:
Verfasst Fr 02.09.2005 03:33 Titel
url -> dokument runterladen -> speichern -> parsen -> fork de sprozeses für jede im dokument enthaltene url und lustig von vorne.
wahlweise auch iterativ statt rekursiv. wobei depth-first durchmarschiererei mir unklug vorkommt. breadth first dürfte eher verwertbare ergebnisse liefern.
Mischpult
Dabei seit: 19.11.2003 Ort: - Alter: - Geschlecht:
Verfasst Fr 02.09.2005 08:28 Titel
Also Buecher wirds dazu wahrscheinlich nicht explizit geben.
Programmiersprachen - wie waers mit Perl PHP ASP .Net etc ?
Fuer mich stellt sich gerade die Frage was Du genau spidern willst
oder was deine Bots koennen sollen ...
Eistee
Administrator
Dabei seit: 31.10.2001 Ort: Augsburg Alter: 30 Geschlecht:
Verfasst Fr 02.09.2005 10:51 Titel
Ich glaube auch das das spidern an sich nicht so das Problem ist, als Anregung vielleicht: www.phpdig.net
Bloss wie man die gewonnen Daten speichert, aufbreitet und bewertet, dass dürfte das Problem sein
Mischpult
Dabei seit: 19.11.2003 Ort: - Alter: - Geschlecht:
Verfasst Fr 02.09.2005 11:01 Titel
Eistee hat geschrieben:
Bloss wie man die gewonnen Daten speichert, aufbreitet und bewertet, dass dürfte das Problem sein
Buchempfehlungen:
The Geometry of Information Retrieval von C. J. van Rijsbergen - ISBN: 0521838053
Information Retrieval. Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web
von Reginald Ferber - ISBN: 3898642135
Keywords sind hier Datamining und Information Retrieval
Zuletzt bearbeitet von Mischpult am Fr 02.09.2005 11:26, insgesamt 1-mal bearbeitet
Du kannst keine Beiträge in dieses Forum schreiben. Du kannst auf Beiträge in diesem Forum nicht antworten. Du kannst deine Beiträge in diesem Forum nicht bearbeiten. Du kannst deine Beiträge in diesem Forum nicht löschen. Du kannst an Umfragen in diesem Forum nicht mitmachen.