DKPro Core ist ein Open-Source-Software in der Programmiersprache Java geschrieben und als eine Sammlung von Anwendungen für die Verarbeitung natürlicher Sprache (NLP) entwickelt.
Unter Teil der Funktionalität von DKPro Core-Komponenten zur Verfügung gestellt, können wir erwähnen tokenization, Segmentierung, Verbindung Spaltung, ergeben, Lemmatisierung, Teil-of-speech tagging, morphologische Analyse, Syntaxcheck, Abhängigkeit Parsing, Koreferenz Auflösung, Sprachidentifikation, Rechtschreibkorrektur, und Grammatikprüfung.
Auf der Basis des Apache UIMA Rahmen wurde DKPro Kern das Projekt ursprünglich von Ubiquitous Wissensverarbeitung Lab (UKP) an der Technischen Universit & auml entwickelt; t Darmstadt, Deutschland.
DKPro Kern wird als separate Ausgaben, DKPro Kern GPL und DKPro Kern ASL unter GPLv3 und Apache Software-Lizenz vertrieben. Jede Ausgabe enthält eine andere Feature-Set
Was ist neu in dieser Pressemitteilung:.
- Neue API-Module
- api.phonetics - Annotation-Typen für die klanglichen Ebene
- api.semantics - Annotation-Typen für semantische Information (semantische Felder und semantische Rolle Kennzeichnung)
- Neue E / A-Module
- io.conll - Reader und Writer für das Format CONLL 2006
- io.tcf - Reader und Schriftsteller für die CLARIN TCF-Format
- io.tgrep - Schriftsteller für TGrep2 Corpus Dateien
- io.tiger - Reader für den Tiger-XML-Format
- Neue Analyse-Module
- commonscodec - Lautschrift auf der Basis der Apache Commons Codec-Bibliothek
- decompounding - Flexible Satz von Komponenten für decompounding, basierend auf unterschiedlichen Teilen und Ranking-Algorithmen
- Kumpel-tools - Wrapper für die Kumpel-Tools Suite
- morpha - Wrapper für die morpha stemmer / Lemmatizer
- mstparser - Wrapper für die mstparser
- sfst - Neues Modul für SFST basierten morphologischen Analyse
- umlautnormalizer - Normalizer für Umlaute in deutschen Texten (ASL)
- Weitere Highlights in diesem Release sind:
- Unterstützung für die Lösung Modelle von Remote-Repositorys zur Laufzeit
- HinzugefügtTypeCapabilities Anmerkungen erklärte die Annotationen sie konsumieren und produzieren
- Hinzugefügt automatisch generierte XML-Deskriptoren für UIMA Komponenten (über uimafit-maven-plugin)
- Unterstützung für ClearNLP Semantic Role Kennzeichnung
- Unterstützung für GATE Hepple POS-Tagger
- Unterstützung für OpenNLP Parser und Namen finder
- Upgrade auf Apache uimaFIT 2.0.0
- Upgrade auf Apache UIMA 2.4.2
- Aktualisiert um ArkTweet-NLP 0.3.2
- Upgrade auf ClearNLP 1.3.1
- Upgrade auf CoreNLP 3.2.0
- Upgrade auf GATE 7.1
- Upgrade auf jweb1t 1.3.0
- wird Languagetool 2.2 Aktualisieren
- Upgrade auf Maltparser 1.7.2
- Upgrade auf Kamerad-Werkzeuge anna 3.5
- Upgrade auf OpenNLP 1.5.3
- Einige Module werden nicht mehr gepflegt und wurden nicht von Nutzen für die Allgemeinheit, zB als die io.mmax2 Modul und das io.wsdl Moduls. Sie wurden im Ruhestand und werden in dieser Version nicht enthalten.
- Bei der Aktualisierung, beachten Sie bitte, dass Sie sollten nicht mischen verschiedene Versionen DKPro Kernkomponenten in Ihren Projekten. - Sie können nicht miteinander kompatibel sein
Anforderungen :
- Java 2 Standard Edition Runtime Environment
Kommentare nicht gefunden