DSTK - Data Science Toolkit 3 ist eine Reihe von Daten- und Text-Mining-Software, die dem CRISP DM-Modell folgt. DSTK bietet Datenverständnis durch statistische und Textanalyse, Datenaufbereitung mittels Normalisierung und Textverarbeitung, Modellierung und Auswertung für maschinelles Lernen und statistische Lernalgorithmen.
DSTK 3 bietet attraktive Funktionen wie Deep Neural Network (Deep Learning), Text Link Analysis mit Visualisierungen, KMeans Clustering. Einige dieser Funktionen werden möglicherweise in älteren Versionen präsentiert, aber da die Algorithmen neu geschrieben werden, um die Verwendung externer Bibliotheken wie Weka zu reduzieren, um die Dateigröße zu reduzieren, benötigen wir mehr Zeit, um sie zu entwickeln. DSTK Engine befindet sich noch im Beta-Stadium, daher kann es einige Bugs und Ungenauigkeiten geben.
DSTK 3 besteht aus DSTK Engine, DSTK ScriptWriter, DSTK Studio und DSTK Text Explorer. Die DSTK Engine ist R vereinfacht und konzentriert sich auf Data Mining. DSTK ScriptWriter bietet eine GUI zum Schreiben von Skripten für die DSTK Engine. DSTK Studio bietet SPSS Statistics wie GUI für Data Mining und DSTK Text Explorer bietet GUI für Text Mining.
Anforderungen :
Java-Laufzeitumgebung, Microsoft. Net Framework
Einschränkungen :
10-Nutzen-Test
Kommentare nicht gefunden