Softwarebeschreibung:
Version: 1.0.3
Upload-Datum: 13 Apr 15
Lizenz: Frei
Popularität: 77
Konzipiert als Wrapper um lxml, nun erweitert lxml mit allen Funktionen, die normalerweise in HTML Data Mining erforderlich
Eigenschaften .
- Allgemeine Merkmale:
- Nizza jQuery-ähnliche CSS-Selektoren
- Einfacher Zugriff auf Elementattribute
- Einfache Möglichkeit zum Konvertieren von HTML in andere Formate (BBcode, Markdown, etc.)
- Ein paar nette Funktionen für die Arbeit mit dem Text
- Speichert alle ursprünglichen Merkmale lxml
- Funktionen, um mit reinem Text zu arbeiten:
- to_unicode - Konvertiert Zeichenketten in Unicode-String
- strip_accents - Streifen Akzente aus einer Zeichenfolge
- strip_symbols - Streifen hässlich Unicode-Zeichen aus einer Zeichenfolge
- strip_spaces - Isolieren Sie überschüssige Leerzeichen aus einem String
- strip_linebreaks - Isolieren Sie überschüssige Zeilenumbrüche aus einer Zeichenfolge
Anforderungen :
- lxml
Kommentare nicht gefunden