speedparser ist eine Black-Box-Neuimplementierung der Allgemeinen Feed-Parser. Es verwendet lxml für Futtermittel-Parsing und für optionale HTML Reinigung. & Nbsp; speedparser die Kompatibilität mit feedparser ist sehr gut für eine strikte Untergruppe von Feldern, aber arm Bereichen außerhalb dieser Untergruppe. Siehe Tests / speedparsertests.py für weitere Informationen über die Felder sind mehr oder weniger kompatibel sind und welche nicht.
Auf einem Intel Core i5 750, läuft nur auf einem Kern, gelang feedparser 2.5 Feeds / s auf dem Testfutter-Set (etwa 4200 "füttert" in Tests / feeds.tar.bz2), während speedparser verwaltet rund 65 Feeds / sec mit HTML . Reinigung auf und 200 Feeds / sec mit Reinigungs off
Anforderungen :
- Python
- lxml
Kommentare nicht gefunden