Apache Nutch

Apache Nutch 2.3 Aktualisiert

Apache Nutch-Projekt ist ein Open Source, skalierbar, sehr dehnbar und kostenlose Web-basierte Web-Crawler-Software, die auf Apache Lucene (Java-Version) Bibliothek baut.Es fügt Web Besonderheiten, wie ein Raupen, einen Link-Graph-Datenbank, Parser für...

Mehr lesen