WordTabulator wird für Text-Analyse bestimmt. Mit Hilfe von wordTabulator Sie Index der Wortbestandteile von definierten Textsatz extrahiert erzeugen können. Word-Elemente können Wörter, N-Gramm (definierter Größe) oder Phrasen (syntagmes) sein. Das Programm kann Texte wie in gewöhnlichen 2-Byte Codierung (ANSI) zu verarbeiten, wie in Mehrbyte-UTF-8-Codierung. Quelltexte werden als eine Reihe von Textdateien oder HTML / XML / SGML-Dokumente definiert. Im letzten Fall kann das Programm zu filtern Inhalte von Markup. Darüber hinaus können Sie nur definierte Inhalte in ausgewählten gepaart Tags verarbeiten. Oder Sie können, dass der Inhalt von der Verarbeitung überspringen. Es umfasst Flexionsfunktion für Russisch, drei verschiedene Formate von Outputindex, drei verschiedene Arten von Wortbestandteilen (dh N-Grams und Phrasen), Browser der Rahmen, und wahre alphabetischer Ordnung.
Softwarebeschreibung:
Version: 3.5
Upload-Datum: 15 Apr 15
Lizenz: Frei
Popularität: 370
Größe: 2708 Kb
Kommentare nicht gefunden