LanguageTool

Screenshot der Software:
LanguageTool
Softwarebeschreibung:
Version: 2.9 Aktualisiert
Upload-Datum: 14 Apr 15
Entwickler: Daniel Naber
Lizenz: Frei
Popularität: 18

Rating: nan/5 (Total Votes: 0)

Languagetool ist ein Open Source-Programm entwickelt, Korrekturlesen, um Fehler, dass regelmäßige Rechtschreibprüfung Tools nicht erkennen kann, zu finden. Es ist eine regelbasierte Stil und Grammatikprüfung, die Fehler, für die eine Regel in seine XML-Konfigurationsdateien definiert sind, wie Mischen up & ldquo finden werden; ihre & rdquo; mit & ldquo;. es & rdquo;


Erkennt verschiedene Grammatik Probleme

Das Programm kann auch verschiedene Grammatik Probleme zu erkennen und kommt mit Unterstützung für mehr als 20 Sprachen, darunter Englisch, Deutsch, Polnisch, Französisch, Spanisch, Schwedisch, Griechisch, Chinesisch, Dänisch, Japanisch, Isländisch, Portugiesisch und brasilianisches Portugiesisch.
Darüber hinaus verfügt es über eine einfach zu bedienende, einfache und unkomplizierte grafische Benutzeroberfläche, mit dem jeder Text, der zu buchstabieren prüft werden muss einfügen können. Sie kann den Text in die Zwischenablage, text, Ausschneiden / Kopieren / Einfügen von Text zu überprüfen, und befinden sich in der System-Tray-Bereich.


Erkennt eine breite Palette von Problemen

Von den Optionen-Dialog können Sie ermöglichen, die Art von Problemen, die Anwendung erkennen können, einschließlich schlechter Stil, Grammatikfehler, Slang, Interpunktionsfehler, mögliche Tippfehler, redundante Sätze, häufig verwechselt Wörter, Wortverbindungen, Kapitalisierung, Semantik, sowie Nicht-Standard-Phrasen.


Languagetool für Libreoffice und Openoffice

Abgesehen davon, dass eine Standalone-Anwendung, ist Languagetool auch als Verlängerung für zwei der beliebtesten und leistungsstärksten Open-Source-Office-Suiten, Libreoffice und Apache OpenOffice.org zur Verfügung, so dass Anwender ihre Texte Korrektur gelesen Rechtsklick auf ausgewählte Sätze oder Absätze.


Languagetool für Mozilla Firefox

Darüber hinaus ist die Anwendung auch zum Download als Add-on für die Welt & rsquo verfügbar; s populärste Open-Source-Web-Browser in der Welt, Mozilla Firefox. Es erfordert keine Wiederanlauf und legt einen kleinen Knopf in der Werkzeugleiste, so dass Sie markierten Text aus Webseiten oder Formen Korrektur gelesen.


Unter der Haube und Verfügbarkeit
Sa Cross-Plattform-Software entwickelt, um mit jedem GNU / Linux-Distribution sowie den BSD, Solaris, Microsoft Windows und Mac OS X Betriebs arbeiten,

Die Anwendung ist komplett in der Programmiersprache Java, was bedeutet, dass es & rsquo geschrieben Systeme, bei denen das Java Runtime Environment installiert ist.

Was ist neu in dieser Pressemitteilung:

  • Katalanisch:
  • aktualisiert POS Tag Wörterbuch
  • hat neue Regeln
  • Fest Fehlalarme
  • Englisch:
  • noch ein paar Regeln und festen wenige Fehlalarme
  • Hinzugefügt viele neue Stilregeln von Heikki Lehväslaiho beigetragen. Da diese zu Fehlalarmen führen, werden sie standardmäßig nicht aktiviert. Sie können sie, indem Sie auf allen Regeln der neuen "Plain English" in der Kategorie zu aktivieren.
  • Esperanto:
  • noch ein paar neue Regeln
  • Französisch
  • aktualisiert POS-Tag-Wörterbuch und Hunspell Wörterbuch zu Dicollecte-5.3
  • German:
  • noch ein paar neue Regeln und festen Fehlalarme
  • Es wurde eine neue Regel, die zum Thema Verb Vereinbarung überprüft. Vorerst werden nur Fälle mit "ist", "Sind", "Krieg" und "Waren" unterstützt. Beispiel für Fehler, die erkannt werden: ". Der Hund Sind scha & para; n", "Die Autos ist schnell." Um diese Regel funktioniert, werden die Sätze jetzt in disambiguation.xml Unified: zum Beispiel, "Mann" in der Phrase "Ein Mann" nur seine Nominativ Lesung beibehalten (SUB: NOM: SIN: MAS), während sie verwendet werden, um auch Akkusativ und Dativ Lesungen (SUB: AKK: SIN: MAS, SUB: DAT: SIN: MAS). (Https://github.com/languagetool-org/languagetool/issues/233)
  • Italienisch:
  • verbessert ein paar Regeln
  • Polnisch:
  • einige neue Regeln
  • Portugiesisch:
  • hinzugefügt / verbesserte mehrere Regeln
  • 3695 zusammengesetzte Wörter (vor der Reform) - die größte freie Datenbank
  • Russisch:
  • aufgenommen und verbesserte Regeln
  • Ukrainisch:
  • big Wörterbuch Update
  • neue Grammatikregeln
  • neue einfache ersetzen Regel für weiche Vorschläge
  • disambiguator Verbesserungen
  • Verbindung Tagging und Rechtschreibung Verbesserungen
  • Initialen Tagging Verbesserungen
  • Satz- und Wort Tokenisierung Verbesserungen
  • eine verbesserte Verarbeitung der stres Symbol und weichen Trennstrich
  • Bitextes Regeln:
  • hinzugefügt eine einfache Regel zur Überprüfung, ob die Übersetzungen mit dem gleichen Satzzeichen als Erstkäufer (dies schließt nur.?! Zeichen).
  • Es ist jetzt möglich, Außen Bitextes Regeldateien in der Befehlszeile hinzufügen, indem Sie
  • -bitextrule Option. Der Dateipfad muss absolut sein. . Achtung: dies ermöglicht mit Bitextes Regeln auch für Sprachen, die keine Bitextes Regeln standardmäßig enthalten haben
  • Rechtschreibung:
  • Die neuen Dateien auf /hunspell/spelling.txt kann verwendet werden, um akzeptiert Worte an die Rechtschreibprüfung, die auch berücksichtigt werden bei der Erstellung von Vorschlägen für falsch geschriebene Wörter hinzuzufügen. Dies ist vergleichbar mit den /hunspell/ignore.txt Dateien, die Liste der zulässigen Worte, die * nicht * verwendet werden, bei der Erstellung von Vorschlägen für falsch geschriebene Wörter.
  • API:
  • JLanguageTool.activateDefaultPatternRules () und JLanguageTool.activateDefaultFalseFriendRules () wurden entfernt - alle Muster Regeln und falscher Freund Regeln (wenn eine zweite Sprache angegeben) werden nun automatisch aktiviert, wenn der Konstruktor JLanguageTool aufgerufen wird. Sollten Sie einen Stein ohne die XML-basierte Musterregeln benötigen, erweitern Sie Ihre Sprache Klasse (zB "Englisch") mit ein, dass die getPatternRules () Methode überschreibt und gibt eine leere Liste gibt.
  • ManualTagger.lookup () wurde von ManualTagger.tag (), nachdem sie seit der letzten Version nicht mehr ersetzt worden
  • Alle statische Methoden und Felder von der Klasse 'Sprache' wurden an die neue Klasse "Sprachen" verschoben. Denn jetzt, die Methoden / Felder in der Klasse Sprache noch existieren, aber sind veraltet.
  • LanguageIdentifierTools wurde entfernt. Verwenden LanguageIdentifier statt.
  • entfernt (Default) ResourceDataBroker.setResourceDir () und setRulesDir (), da diese mit dem Konstruktor gesetzt werden
  • up Aufgeräumt Klasse Profi, z.B. Entfernen getRemark ()
  • Category.setDefaultOff () entfernt worden ist, kann dies via Konstruktor jetzt eingestellt werden
  • Umbenannt Klassen: o.lt.rules.patterns.Element = & gt; o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher = & gt; o.lt.rules.patterns.PatternTokenMatcher
  • Andere kleine API Aufräumarbeiten, die sich nicht auf die gemeinsame Anwendungsfälle sollte, zB IncorrectExample.getCorrections () zurückkehrt und unveränderbare Liste jetzt, Beseitigung von veralteten Methoden.
  • Embedded-Server:
  • XML escaping wurde behoben, könnte dies dazu führen, ungültige XML-Dokumente zurückgegeben werden
  • neue Konfigurationsdatei Option 'maxWorkQueueSize ", dass Sie die maximale Größe der Anforderungswarteschlange festlegen können - wenn es größer als diese bekommt, werden Anträge abgelehnt (503 Service unavailable)
  • Der Server antwortet jetzt mit mehr spezifischen HTTP-Statuscodes zu diesen Fehlerbedingungen: 413 anfordern Wesen zu groß - wenn Text überschreitet die maximale Schriftgröße 503 Service Unavailable - wenn Check maximale Überwachungszeit überschreitet,
  • GUI:
  • Die Stand-alone-GUI kann nun eine einfache Textdatei als Argument, wird diese Datei dann beim Start (Github Ausgabe # 232) geladen werden.
  • Die Kommandozeilen:
  • ist es nun möglich, eine externe Regeldatei beim Aufruf Languagetool über die Befehlszeile hinzuzufügen. Verwenden --rulefile, um eine Datei hinzuzufügen. Wenn der Dateiname hat ein Format, das eine Sprachnamen enthält, wird es zusammen mit anderen Regeln verwendet werden; sonst wird es die Regeln ersetzen. Sie können auch eine externe Datei mit falschen Freunden zu laden, indem Sie die Option --falsefriends. Der Dateiname sollte ein absoluter Pfad sein und falscher Freund Dateien werden immer zu denen, die für die Sprache geladen werden hinzugefügt. (Github Ausgabe # 192)
  • Rule Syntax:
  • Eine Regel kann nun eine einzelne Beispielsätze haben, solange es hat eine "Korrektur" Attribut - das kann eine gewisse Redundanz zu speichern, wenn die einzig richtige Satz ist der gleiche wie der falsche Satz mit der Korrektur angewendet. Bevor eine Regel benötigt mindestens zwei Beispielsätzen.
  • "Beispiel" Element: type = "falsch" ist nun optional, wenn es eine "Korrektur" Attribut. Die "Korrektur" Attribut bedeutet, dass der Satz ist falsch.
  • "Beispiel" Element: type = "richtige" ist nun optional. Kein Attribut "Typ" und keine "Korrektur" Attribut bedeutet, dass der Satz korrekt ist.
  • Intern:
  • Wir haben von Apache Tika zur Sprachauswahl Detektor (https://github.com/optimaize/language-detector) zum automatischen Identifizieren der Textsprache umgeschaltet. Es sollte schneller und Ergebnisse sind zuverlässiger. Nachweis von Asturien und Galizisch musste gesperrt werden, weil die Erfassungsqualität zu niedrig und ebenfalls betroffen Nachweis von Spanisch.
  • Regression behoben, der es unmöglich macht, externe Regeldateien in der GUI zu laden werden.

Was ist neu in Version 2.8:

  • asturischen:
  • entfernt die Abhängigkeit von Hunspell, verwendet nun Morfologik für die Rechtschreibprüfung
  • Breton:
  • hinzugefügt und verbessert ein paar Regeln
  • Katalanisch:
  • aktualisiert Wörterbuch
  • aufgenommen und verbesserte Regeln
  • Fest Fehlalarme
  • Dutch:
  • hinzugefügt und verbessert viele Regeln
  • Englisch:
  • ein paar neue Regeln (Dank an Nick Hough)
  • aktualisiert die Tagger und Synthesizer-Wörterbücher, Festsetzung der Ausgabe # 202
  • neuen Filter zur Anpassung der partofspeech der Wortteile, beispielsweise verwendet werden:. In * Dies wird nur zu halten Termine der Wörter, die mit "in" und dem Start der Teil nach dem "in" ist ein Adjektiv (POS-Tag 'JJ'). Die "no: 1" ist das Zeichen Stellung, also hier die erste (und einzige) Anpassung bezeichnet
  • .
  • Französisch:
  • hinzugefügt und verbessert ein paar Regeln
  • German:
  • hinzugefügt und verbessert ein paar Regeln
  • Polnisch:
  • aufgenommen und verbesserte mehrere Regeln
  • hinzugefügt und verbessert falsche Freunde mit Englisch
  • Portugiesisch:
  • hinzugefügt / verbesserte mehrere Regeln
  • Spanisch:
  • entfernt die Abhängigkeit von Hunspell, verwendet nun Morfologik für die Rechtschreibprüfung
  • Neu formatierte Datei rules
  • Hinzugefügt mehr Regeln
  • Tagalog:
  • entfernt die Abhängigkeit von Hunspell, verwendet nun Morfologik für die Rechtschreibprüfung
  • der Bindestrich ("") ist ein Trennzeichen jetzt bei Tokenerstellung den Text
  • Russisch:
  • aufgenommen und verbesserte Regeln
  • noch ein paar falschen Freund Regeln (Russisch / Englisch)
  • Ukrainisch:
  • vielen neuen Regeln (einschließlich der Vereinbarung mit Substantiven, Zeitangaben usw.)
  • Regel Abdeckung Verbesserung
  • Wörterbuch update (große Verbesserungen für Eigennamen und Vokativ)
  • neuen Tag und herrschen über alternative Schreibweise zu warnen,
  • Mehrwortfrequenz Informationen zur Rechtschreibvorschläge zu verbessern
  • ein paar neue Regeln disambiguator
  • Rule Syntax:
  • ... können nun auf eine RuleGroup hinzugefügt werden, um alle Regeln dieser Gruppe beeinflussen
  • Wenn Sie Ihre eigenen Regeln, die nicht Teil des LT Sie können nun externe = "yes", um Ihre Kategorien, um die Regel-Link zu vermeiden, um von in unserem Standalone-GUI erscheinen community.languagetool.org entwickeln (der Link nicht funktionieren würde für Regeln, die nicht Teil der Hauptverteilung LT) sind. (Github Ausgabe # 223)
  • Wenn eine Regelgruppe gibt an, default = "off", die Regeln in der Regelgruppe kann auch nicht standardmäßig festlegen = "on" / "off".
  • API:
  • Entfernt Klassen und Methoden, die seit 2,7 oder mehr als veraltet war
  • Embedded-Server:
  • der Konfigurationsdatei-Optionen 'request "und" requestLimitPeriodInSeconds' können nun auch für den HTTP-Server (und nicht nur für den HTTPS-Server) verwendet werden
  • Neue Konfigurationsdatei Option 'trustXForwardForHeader': setzen Sie diese auf "true", wenn Sie die Server hinter einem Reverse-Proxy laufen und wollen, dass die Anfrage Grenze auf die ursprüngliche IP-Adressen von der 'Xforwardedfor "HTTP-Header zur Verfügung gestellt zu arbeiten, in der Regel festgelegt der Proxy. Wenn Sie hinter einem Proxy laufen, aber nicht diese Eigenschaft auf true gesetzt ist, kann ein Benutzer alle Anfragen verwenden, damit andere Benutzer erhalten auch eine Fehlermeldung wegen der Anfrage Grenze.
  • Fix Antwort nach Ablauf der Frist Modus: ... war manchmal leer, verwirrend die Textprüfung in Wordpress
  • Bitextes Regeln wurden nicht ordnungsgemäß deaktiviert, auch wenn sie mit einem geeigneten Parameter für den Server festgelegt wurden; jetzt ist es fixiert
  • Das Problem mit falschen Positionen für einige Bitextes Regeln (Ausgabe # 218)
  • GUI:
  • Eine neue Einstellung 'errorColors' wurde an die languagetool.cfg Konfigurationsdatei hinzugefügt. Es kann verwendet werden, um die Hintergrundfarbe von Fehlern eingestellt werden. Zum Beispiel errorColors = Tipp: # b8b8ff, style: # ffb8b8 wird "typographische" Fehler mit einem blauen Hintergrund und "Stil" Fehler mit einem roten Hintergrund im oberen Teil des LT-Fenster zeigen. "Typographische" und "Stil" sind die Arten, die in grammar.xml als "type = ..." eingestellt sind. Es gibt keine Benutzeroberfläche noch diese Farben konfigurieren. Beachten Sie, dass Sie nur die Datei, wenn languagetool.cfg LT läuft nicht bearbeitet werden.
  • Intern:
  • Bugfix: Regeln in einer Regelgruppe war nicht aktiviert, wenn eine vorherige Regel aus dem gleichen RuleGroup verwendet default = "off"
  • Die Wörter werden nicht mehr von der Rechtschreibprüfung, nur weil sie in Vorschlag einer Regel auftreten, ignoriert. Wenn Sie die Rechtschreibprüfung auf Wörter global ignoriert werden sollen, fügen Sie sie hunspell / ignore.txt. Zu ignorieren, je nach Kontext, fügen Sie ein 'ignore_spelling "-Regel zu disambiguation.xml.
  • Eine Datei 'hunspell / prohibit.txt' kann nun verwendet werden, um Wörter als Rechtschreibfehler zu kennzeichnen, auch wenn die Rechtschreibprüfung normalerweise akzeptiert. Dies ist sinnvoll, um den Languagerechtschreibprüfung, ohne auf die vorgelagerten checker aktualisiert werden, zu verbessern. Die Datei 'prohibit.txt "ist das Gegenteil von" ignore.txt ", die die Rechtschreibprüfung, um Wörter zu ignorieren verursacht.
  • Die partofspeech Tagger für die meisten Sprachen können jetzt durch Hinzufügen von Einträgen in der Datei org / Languagetool / Mittel / XX / added.txt (XX ist der Sprachcode) erweitert werden. Das Format ist "Fullform Grundform Post AG", drei Spalten durch Tabulatoren getrennt. Dies macht es einfacher für die Benutzer (und Entwickler), um die POS-Tagger zu verlängern, da sie nicht brauchen, um zu exportieren, zu ändern, und erstellen Sie die Binär-Wörterbuch für jede Änderung.

Was ist neu in Version 2.7:

  • Breton:
  • aufgenommen und verbesserte Regeln
  • Neue Regel, dass, wenn ein Tag ein Datum übereinstimmt überprüft, zB erkennt "Gwener 28 a viz EOST 2014", dieses Datum ist kein Sonntag.
  • Katalanisch:
  • aufgenommen und verbesserte Regeln
  • Fest Fehlalarme
  • Dutch:
  • hinzugefügt und verbessert viele Regeln
  • geschaltet Morfologik-basierte Rechtschreibprüfung
  • -Englisch:
  • Möchten Sie ein Teil des Teams, das zu den weltweit leistungsfähigsten Open Source Lektorat Tool entwickelt sein? Wir suchen nach einem Betreuer für die englischen Regeln in Languagetool suchen. Siehe http://wiki.languagetool.org/tasks-for-language-maintainers für Details.
  • Alle englischen Wörterbüchern wurden erweitert, um Worthäufigkeitsklassen enthalten, um die Rechtschreibprüfung Vorschläge zu verbessern (die Frequenzdaten aus https://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/js genommen / imes / Latin / Wörterbücher, wie für andere Sprachen, die bereits diese Funktion zu nutzen).
  • Bessere Vorschläge für Englisch Lernende: unregelmäßige Verben, Substantive und Adjektive jetzt haben in der Regel einen besseren Vorschlag. Beispielsweise 'thinked' schlägt ', dachte' schlägt 'frau' 'Frauen'.
  • Weitere Rechtschreibfehler enthalten Vorschläge nun, zB 'Garentee' (Garantie), "dankbar" (danke). Dies kann einen Leistungsabfall von ca. 10% (mehr für Texte mit viel unbekannter Wörter) führen.
  • Neue Regel, dass, wenn ein Tag ein Datum übereinstimmt überprüft, zB erkennt "Monday, 7. Oktober 2014", so dass Tag kein Freitag. Diese Regel wird nur funktionieren, wenn sie das Datumsformat im Einsatz erkennt. Bisher werden diese Formate unterstützt: * "Monday, 7. Oktober 2014" * "Montag, 7. Oktober 2014" * "Monday, 7. Oktober 2014" * "Monday, 7. Oktober 2014" * (dies funktioniert auch mit verkürzten Woche Tage wie Mo oder Mo für Montag)
  • Esperanto:
  • Neue Regel, dass, wenn ein Tag ein Datum übereinstimmt überprüft, zB erkennt "Vendredon la 28-eine de AAgusto 2014", dieses Datum ist kein Sonntag.
  • Französisch:
  • aktualisiert POS-Tag-Wörterbuch und Hunspell Wörterbuch zu Dicollecte-5.2
  • soeben einen Synthesizer - die Vereinbarung der Regel kann nun Vorschläge zu machen für einige Fehler
  • hinzugefügt / verbesserte mehrere Regeln
  • Neue Regel, dass, wenn ein Tag ein Datum übereinstimmt überprüft, zB erkennt "vendredi 28/08/2014", dieses Datum ist kein Sonntag.
  • German:
  • In seltenen Nullpointerexception und ein ArrayIndexOutOfBoundsException
  • Feste mehrere Fehlalarme
  • Added und verbesserte Regeln
  • Neue Regel, die für Sätze prüft ohne Verb (standardmäßig deaktiviert, da das Risiko von Fehlalarmen)
  • Neue Regel, dass, wenn ein Tag ein Datum übereinstimmt überprüft, zB erkennt "Dienstag, 2014.09.29", wie das Tag kein Freitag.
  • Performance-Verbesserungen für die Rechtschreibprüfung Vorschläge
  • Persisch:
  • hinzugefügt anfängliche Unterstützung für Persisch (Farsi)
  • Polnisch:
  • hinzugefügt und verbessert einige Regeln
  • neue Regel, dass, wenn ein Tag ein Datum übereinstimmt prüft
  • Portugiesisch:
  • hinzugefügt / verbesserte mehrere Regeln
  • hinzugefügt viele Dutzende von zusammengesetzten Wörtern
  • Russisch:
  • hat neue Regeln
  • beheben Sourceforge Feature Request # 38 (Überprüfung für unterschiedliche Anführungszeichen)
  • noch ein paar falschen Freund Regeln (Russisch / Englisch)
  • neue Regel, dass, wenn ein Tag ein Datum übereinstimmt überprüft, zB erkennt "ÐонеÐ'еÐ"NŒÐ½Ð¸Ðº, 30 N ?? & ETH, & micro; & ETH, & frac12; N & sbquo; N ?? & ETH, & plusmn; N & euro; N ?? 2014 & ETH, & sup3 ;. ", wie dieser Zeitpunkt nicht ein Montag
  • .
  • erweitert Russian Verbindung Regel mit neuen Worten von Post AG Wörterbuch
  • Spanisch:
  • Es wurden neue POS Kategorie Z (für geschriebene Zahlen, zB "uno ',' dos ', ...)
  • buchstabiert Nummern können nun erkannt und verwaltet sowohl in Begriffsklärung und Regeln.
  • Es wurden einige falsche Lemmata in POS-Wörterbuch.
  • Hinzugefügt Hybrid chunker-disambiguator.
  • Tamil:
  • Hinzugefügt anfängliche Unterstützung für Tamil. Wenn der font für Tamil ist nicht richtig auf Ihrem Computer angezeigt wird und Sie mit Windows arbeiten, müssen Sie möglicherweise gelten die Arbeit um hier beschrieben: https://bugs.openjdk.java.net/browse/JDK-8008572
  • Ukrainisch:
  • Großes Update für POS-Wörterbuch (Fixes und neue Wörter)
  • einige POS-Tag für Konsistenz umbenannt; Neue Etiketten hinzufügen für Abkürzungen und seltene Wörter
  • viele neue Regeln und Updates für bestehende Regeln
  • neue Regel, dass, wenn ein Tag ein Datum übereinstimmt überprüft, zB erkennt "& ETH, & ETH, & frac34; & ETH, & frac12; & ETH, & micro; & ETH," N- & ETH; "& ETH, & frac34; & ETH, & ordm ;, 7 & ETH, & para; & ETH, & frac34; & ETH, & sup2; 2014 ", da dieses Datum nicht auf einen Montag
  • Token Normalisierung Leistungsverbesserung
  • Libreoffice-Integration:
  • Sie nicht von Fußnoten in Libreoffice 4.3 verwirrt und später (sie uns jetzt mit den Fußnote Positionen als Meta-Daten, so dass wir sie ignorieren).
  • API:
  • Wichtige Leistungsverbesserungen für die Multi-Thread-Anwendungsfall, in dem JLanguageTool bekommt pro Thread erstellt, aber die Sprache Objekt (zB 'Deutsch') wird nur einmal erstellt. Overhead für die Erstellung JLanguageTool sollte jetzt viel niedriger sein.
  • Removed mehrere Klassen und Methoden, die seit Version 2.6
  • veraltet worden war
  • Entfernt DutchSpellerRule - verwenden MorfologikDutchSpellerRule statt
  • Die Unterzeichnung Language.getRelevantRules () hat sich geändert
  • Die JLanguageTool und MultiThreadedJLanguageTool Bauer nicht erklären, eine IOException werfen mehr
  • WhitespaceRule hat MultipleWhitespaceRule umbenannt (WhitespaceRule noch vorhanden ist, aber nicht mehr empfohlen)
  • Veraltete einige Methoden, deren Sichtbarkeit wird verringert (zB aus der Öffentlichkeit zu geschützt)
  • MorfologikSpellerRule.getRuleMatch (String, int) hat MorfologikSpellerRule.getRuleMatches (String, int) umbenannt
  • Die RuleMatch Konstruktor wirft jetzt eine Ausnahme, wenn toPosition nicht größer als fromposition
  • eine neue abstrakte Klasse TextLevelRule die Regel erstreckt und das kann für Regeln, die mehr als einzelne Sätze decken verwendet werden.
  • Befehlszeile:
  • Aktivieren und Deaktivieren von spezifischen Regeln zur gleichen Zeit ist jetzt erlaubt. Um nur einige Regeln (Deaktivierung der ganze Rest), die zuvor mit "--enable LIST_OF_RULES" getan zu testen, nun "--enabledonly --enable LIST_OF_RULES" (oder "-eo -e LIST_OF_RULES").
  • Embedded-Server:
  • Zwei neue Optionen in den Eigenschaften festgelegt Datei zu machen Language die gleiche XML-Format wie nach Ablauf der Frist (ATD) zurückkehren werden. Auf diese Weise kann es als direkter Ersatz für ATD verwendet werden: * Modus - 'Languagetool "oder" AfterTheDeadline' * afterTheDeadlineLanguage - Code der Standardsprache, wenn mode auf 'AfterTheDeadline "HINWEIS: Wird der Modus" AfterTheDeadline "in Betracht gezogen werden Versuchs für jetzt.
  • Die neue Option 'maxCheckThreads' ermöglicht die Einstellung der maximalen Anzahl von Threads arbeiten Anforderungen parallel. Der Standardwert ist 10, wie es früher war.
  • Internals:
  • New abstrakte Regel AbstractDateCheckFilter, die, wenn ein Wochentag und Datum Spiel überprüfen können. Zum Beispiel "Tuesday, 29. September 2014" festgestellt werden, wie 29. September 2014 ist nicht wirklich ein Montag. Dies verwendet die neue experimentelle RuleFilter Schnittstelle, die aus XML mit dem neuen "Filter" Element bezeichnet werden kann. "Filter" nimmt diese Attribute: "Klasse": den vollständigen Namen einer Java-Klasse, RuleFilter implementiert, zB "Org.languagetool.rules.de.DateCheckFilter" "args": eine Zeichenkette wie "Jahr: 1 Monat: 2 Tage: 3 Wochentag: 4", dh eine durch Leerzeichen getrennte Liste von Schlüssel / Wert-Paaren, wobei x wird aufgelöst Tokenwert des Musters (wie in der "Botschaft" Element)
  • Die Verbindung der Regel ignoriert jetzt Token, die in der disambiguation.xml immunisiert wurden
  • Die "Filter" Aktion im disambiguator wird nur noch zu POS-Tags, die die POS-Tag angegebenen übereinstimmen angewendet. Wenn sie nicht übereinstimmen, wird die Regel nicht angewendet.
  • Wenn Sie die Erweiterung der XML-Regeln sind als bei http://wiki.languagetool.org/tips-and-tricks#toc2 beschrieben, die externe Regel und Begriffsklärung-Dateien können jetzt auf einer passwortgeschützten Server durch Angabe gehostet werden eine URL wie folgt aus: http: // user: password@example.org/path/user-rules.xml
  • Der Gedankenstrich ("a & euro;" ") ist jetzt ein Tokenerstellung Zeichen für alle Sprachen
  • Neues Feature:
  • Die Verwendung von Sprachmodellen
  • Languagetool können jetzt nutzen ngram Daten. ngram Daten sind Informationen darüber, wie oft Sätze in einer Sprache auftreten. Derzeit nutzt diese Sätze der Länge 3.
  • Die Daten werden von einem englischen Regel wie Vermischung Grob- / Kurs oder flair / Flare zur homophone Fehler zu finden,. Language hatte einige Regeln dieser Art vor, aber die neue Regel unterstützt nun etwa 900 solcher Wortpaare / Sets.
  • Die dafür benötigten Daten ist riesig (7 GB für Englisch) und somit nicht Teil oder Languagetool.
  • Die Daten (nur Englisch jetzt) ​​und Dokumentation ist http://wiki.languagetool.org/finding-errors-using-big-data verfügbar
  • Mit ngrams macht Languagetool etwas langsamer, wenn die Daten auf einer SSD gespeichert.
  • Wenn nicht auf einer SSD gespeichert, kann die Leistung drastisch zu verringern.
  • Verwenden Sie die neue --languagemodel Option mit dem Kommandozeilen-Client, um die Regel, die die Daten verwendet zu aktivieren. Diese Option ist für den Stand-alone-GUI ist noch nicht verfügbar.

Was ist neu in Version 2.4.1:

  • Aktualisiert Morfologik Bibliotheken 1.8.3 zu langsam Vorschläge in der Rechtschreibprüfung, die betroffen beheben mindestens en-US

Was ist neu in Version 2.4:

  • Breton:
  • SRX Satz tokenization
  • hinzugefügt / verbessert ein paar Regeln
  • Fest einige Fehlalarme
  • falsche Vorschläge dank Fest hinzugefügt Tests korrigiert
  • Katalanisch:
  • hinzugefügt / verbesserte mehrere Regeln
  • Fest Fehlalarme
  • gemacht Ergänzungen und Korrekturen an den Tagger Wörterbuch
  • entfernt Ein paar Worte von Synthese-Wörterbuch (siehe filterarchaic.txt)
  • Mehrfrequenzdaten an den Tagger Wörterbuch; Frequenzwortliste stammt aus dem Gaia-Projekt, mit Apache License, Version 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • Englisch:
  • hinzugefügt / verbessert ein paar Regeln
  • Fest einige Fehlalarme
  • Französisch:
  • hinzugefügt / verbesserte mehrere Regeln
  • Fest einige Fehlalarme
  • German:
  • hinzugefügt / verbesserte mehrere Regeln
  • soeben einen Synthesizer die Vereinbarung Regel kann nun Vorschläge zu machen für einige Fehler (nicht alle Vorschläge sind richtig, wenn auch)
  • Polnisch:
  • hinzugefügt / verbesserte mehrere Regeln, insbesondere für Trennstrich und Bindestrich Nutzung
  • Mehrfrequenzinformationen für die Rechtschreibprüfung Wörterbuch; Frequenzwortliste stammt aus dem Gaia-Projekt, mit Apache License, Version 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • Fest einige Fehlalarme
  • Portugiesisch:
  • hinzugefügt / verbesserte mehrere Regeln (es enthält jetzt Geschlecht Regeln "ein" / "o")
  • Es ist nun 3400+ gesetzte Wörter
  • die JAR-Datei wurde umbenannt in languagetool.jar, von ehemals languagetoolstandalone.jar zu Verwirrung darüber, was 'standalone' bedeutet in diesem Zusammenhang (github Ausgabe # 29) zu vermeiden
  • für Sprachen mit vielen Regeln (wie Französisch oder Deutsch) Leistung auf langen Texten wurde von über 2030% erhöht
  • Update für threadsafety (könnte dazu führen, hängen in MultiWordChunker)
  • ein Fehler behoben, chunk Anmerkungen wurden in Gruppen getestet Fest
  • fix: 1 und nicht in ... bewertet worden
  • einen Fehler in der Vereinigung Mechanismus, der einige der passenden Interpretationen vorzeitig verworfen Fest
  • Unterstützung für chunk Anmerkungen im disambiguator und fixiert einen Fehler bei der Filterung Token mit chunk Anmerkungen
  • aktualisiert Morfologik Bibliotheken 1.8.2 (Bugfixes, strengere Eingangs sanity Überprüfung, fügen Frequenzdaten, Wörterbücher)
  • hinzugefügt die Möglichkeit, einschließlich Frequenzdaten zu taggging oder Rechtschreibwörterbücher. Das erwartete Format der Frequenzwortlisten ist die in der Gaia-Projekt, mit Apache License, Version 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
  • neue Kommandozeilen-Tools zu exportieren und binäre Übersetzungswörterbüchern:
  • org.languagetool.dev.DictionaryExporter
  • org.languagetool.dev.POSDictionaryBuilder
  • Libreoffice / Openoffice-Integration:
  • hat einen Workaround für falsch Satzerkennung für den Fall, dass eine Fußnote erschien nach einem Satz Punkt (Sourceforge Bug # 191)
  • Standalone-GUI:
  • Die von der "Mehr ..." im Kontextmenü eines Fehlers geöffneten Dialog wird nun auch angezeigt werden richtige und falsche Sätze Beispiel
  • API:
  • SentenceTokenizer ist jetzt eine Schnittstelle, die Umsetzung hat zu RegexSentenceTokenizer verschoben worden, aber das ist überholt und sollte SRXSentenceTokenizer stattdessen verwendet werden
  • Einige Methoden von org.languagetool.tools.StringTools haben zur org.languagetool.gui.Tools Klasse im languagetoolguicommons Projekt verschoben worden
  • LanguageToolListener.languageToolEventOccured () auf LanguageToolListener.languageToolEventOccurred () umbenannt
  • org.languagetool.tools.SymbolLocator nicht öffentlich ist mehr (sollte keine Auswirkungen auf jemand)
  • entfernt DanishSentenceTokenizer, die seit drei Jahren veraltet waren
  • Rule.getCorrectExamples () und Rule.getIncorrectExamples () nicht mehr null zurück, sondern eine leere Liste, wenn es keine Beispiele. Folglich haben setCorrectExamples () und setIncorrectExamples () nicht akzeptieren null mehr.
  • Rule.getId () kann eine beliebige Zeichenfolge jetzt zurückkehren, nicht nur AsciiOnly Saiten (eigentlich war dies vor der Fall, wie die AsciiOnly Einschränkung wurde nie durchgesetzt und nur in der javadoc erwähnt)
  • languagetoolwikipedia: die Kommandozeilenoptionen zur Überprüfung eines Wikipedia-Dump wurden vereinfacht. Der Befehl kann nun wie folgt aufgerufen werden: java jar languagetoolwikipedia.jar check l en f enwiki20130621pagesarticles.xml Rufen Sie einfach "java jar languagetoolwikipedia.jar check", um eine Nutzungsmeldung. Mehr als eine Datei kann mit der Option f festgelegt werden. Zusätzlich zu Wikipedia XML-Dumps, CSV-Dateien aus Tatoeba (http://tatoeba.org) werden nun ebenfalls unterstützt, müssen sie zunächst gefiltert, dass nur die gewünschte Sprache enthält.

Was ist neu in Version 2.3:

  • Breton:
  • hinzugefügt / verbessert ein paar Regeln
  • Fest Fehlalarme
  • aktualisiert POS Wörterbuch von Apertium (SVN r47282)
  • Katalanisch:
  • Unterstützung für den Sprachcode ca-ES-Valencia (Valencia Katalanisch), die in Libreoffice 4.2.0
  • verwendet werden
  • hat ein einfaches Ersetzen der Regel mit Hunderten von Ersatzvorschläge
  • hinzugefügt / verbesserte mehrere Regeln
  • Fest Fehlalarme
  • Chinese:
  • hat einen Workaround für einen StringIndexOutOfBoundsException (http://sourceforge.net/p/languagetool/bugs/186/)
  • Englisch:
  • hinzugefügt Ersatzmuster für die Rechtschreibprüfung Vorschläge besser zu machen (jetzt bietet 'gelehrt' für 'gelehrt')
  • hinzugefügt / verbessert ein paar Regeln
  • Französisch:
  • hinzugefügt / verbessert ein paar Regeln
  • Fest Fehlalarme
  • aktualisiert POS-Tag-Wörterbuch und Hunspell Wörterbuch zu Dicollecte-4.12
  • German:
  • hinzugefügt / verbesserte mehrere Regeln
  • Portugiesisch:
  • hinzugefügt / verbessert ein paar Regeln
  • Es wurde nun 3300 + zusammengesetzte Wörter
  • Ukrainisch:
  • hinzugefügt / verbesserte mehrere Regeln
  • der Quellcode auf GitHub verschoben: https://github.com/languagetool-org/languagetool
  • Languagetool benötigt Java 7 jetzt
  • Languagetool nutzt mehrere Threads jetzt Textprüfung auf moderner Hardware, die Verbesserung der Leistung (dies wirkt sich auf die Standalone-Version, die Befehlszeilenversion und die Libreoffice / Openoffice-Erweiterung)
  • Rule Syntax:
  • vorläufige Unterstützung neuer Min / Max-Attribute, die ein Element, das die gegebene Anzahl von Malen erscheint entsprechen können. Zum Beispiel: foo wird nichts oder "foo", also passen "foo" ist optional foo wird "foo" oder "foo foo" foo wird nichts übereinstimmt, "foo" oder "foo foo" Use max = Match "- 1" unbegrenzt Vorkommen zu ermöglichen. Für min, nur 0 oder 1 unterstützt wird (1 ist die Standardeinstellung).
  • Unterstützung für die OR-Anweisungen. Zum Beispiel: ein intern und in der Laufzeit, in der Regel ODER-Anweisungen enthält, ist in mehrere Regeln ohne OR-Anweisungen umgewandelt
  • .
  • Englisch hat jetzt eine chunker zu erkennen, unter anderem Singular und Plural Nomen Brocken. Dies ist bei http://wiki.languagetool.org/using-chunks dokumentiert
  • Standalone-Version:
  • Die Standalone-Version unterstreicht nun Fehler mit einer roten (Rechtschreibfehler) oder blau (andere Fehler) Linie (Panagiotis Minos)
  • Denken Sie an die Sprachenauswahl für den nächsten Start
  • Verbesserte Fenster und Dialog Platzierung in einer Multi-Monitor-Setup
  • Embedded Server: nutzt Standard-Port (8081) wieder, wenn sie ohne Argumente gestartet
  • aktualisiert die morfologik-stamm Bibliothek auf Version 1.7.1, um bessere Vorschläge, einschließlich sachgerechten Umgang mit diakritischen Zeichen und Ersatz Mustern zu ermöglichen (in Höhe von MAP und REP Funktionen in hunspell Wörterbücher)
  • Openoffice / Libreoffice-Integration:
  • fix: der "About" -Dialog nicht in Apache Openoffice 4.0
  • fix: länderspezifischen Vorschriften (wie British English) hat nicht funktioniert
  • API:
  • In Klasse Sprache hat getCountryVariants (), um getCountries () umbenannt, und eine neue Methode getVariant wurde hinzugefügt.
  • Es wurden einige Verfahren veraltet
  • Einige Verfahren wurden aus dem Werkzeug-Klasse (Languagetool-Core) an den neuen CommandLineTools Klasse verschoben (Languagetool-Kommandozeile)










Was ist neu in Version 2.2:



Was ist neu in der Version 2.1:





Was ist neu in der Version 2.0:







Anforderungen :

  • Java 2 Standard Edition Runtime Environment

Andere Software von Entwickler Daniel Naber

Jwordsplitter
Jwordsplitter

21 Jan 15

LanguageTool
LanguageTool

21 Jan 15

Kommentare zu LanguageTool

Kommentare nicht gefunden
Kommentar hinzufügen
Schalten Sie auf die Bilder!