Kostenloser Herunterladen LanguageTool Für Linux ::: Software

Screenshot der Software:

Softwarebeschreibung:

Version: 2.9 ^Aktualisiert

Upload-Datum: 14 Apr 15

Entwickler: Daniel Naber

Lizenz: Frei

Popularität: 18

Herunterladen

Currently nan/5
1
2
3
4
5

Rating: nan/5 (Total Votes: 0)

Languagetool ist ein Open Source-Programm entwickelt, Korrekturlesen, um Fehler, dass regelmäßige Rechtschreibprüfung Tools nicht erkennen kann, zu finden. Es ist eine regelbasierte Stil und Grammatikprüfung, die Fehler, für die eine Regel in seine XML-Konfigurationsdateien definiert sind, wie Mischen up & ldquo finden werden; ihre & rdquo; mit & ldquo;. es & rdquo;

Erkennt verschiedene Grammatik Probleme

Das Programm kann auch verschiedene Grammatik Probleme zu erkennen und kommt mit Unterstützung für mehr als 20 Sprachen, darunter Englisch, Deutsch, Polnisch, Französisch, Spanisch, Schwedisch, Griechisch, Chinesisch, Dänisch, Japanisch, Isländisch, Portugiesisch und brasilianisches Portugiesisch.
Darüber hinaus verfügt es über eine einfach zu bedienende, einfache und unkomplizierte grafische Benutzeroberfläche, mit dem jeder Text, der zu buchstabieren prüft werden muss einfügen können. Sie kann den Text in die Zwischenablage, text, Ausschneiden / Kopieren / Einfügen von Text zu überprüfen, und befinden sich in der System-Tray-Bereich.

Erkennt eine breite Palette von Problemen

Von den Optionen-Dialog können Sie ermöglichen, die Art von Problemen, die Anwendung erkennen können, einschließlich schlechter Stil, Grammatikfehler, Slang, Interpunktionsfehler, mögliche Tippfehler, redundante Sätze, häufig verwechselt Wörter, Wortverbindungen, Kapitalisierung, Semantik, sowie Nicht-Standard-Phrasen.

Languagetool für Libreoffice und Openoffice

Abgesehen davon, dass eine Standalone-Anwendung, ist Languagetool auch als Verlängerung für zwei der beliebtesten und leistungsstärksten Open-Source-Office-Suiten, Libreoffice und Apache OpenOffice.org zur Verfügung, so dass Anwender ihre Texte Korrektur gelesen Rechtsklick auf ausgewählte Sätze oder Absätze.

Languagetool für Mozilla Firefox

Darüber hinaus ist die Anwendung auch zum Download als Add-on für die Welt & rsquo verfügbar; s populärste Open-Source-Web-Browser in der Welt, Mozilla Firefox. Es erfordert keine Wiederanlauf und legt einen kleinen Knopf in der Werkzeugleiste, so dass Sie markierten Text aus Webseiten oder Formen Korrektur gelesen.

Unter der Haube und Verfügbarkeit
Sa Cross-Plattform-Software entwickelt, um mit jedem GNU / Linux-Distribution sowie den BSD, Solaris, Microsoft Windows und Mac OS X Betriebs arbeiten,

Die Anwendung ist komplett in der Programmiersprache Java, was bedeutet, dass es & rsquo geschrieben Systeme, bei denen das Java Runtime Environment installiert ist.

Was ist neu in dieser Pressemitteilung:

Katalanisch:
aktualisiert POS Tag Wörterbuch
hat neue Regeln
Fest Fehlalarme
Englisch:
noch ein paar Regeln und festen wenige Fehlalarme
Hinzugefügt viele neue Stilregeln von Heikki Lehväslaiho beigetragen. Da diese zu Fehlalarmen führen, werden sie standardmäßig nicht aktiviert. Sie können sie, indem Sie auf allen Regeln der neuen "Plain English" in der Kategorie zu aktivieren.
Esperanto:
noch ein paar neue Regeln
Französisch
aktualisiert POS-Tag-Wörterbuch und Hunspell Wörterbuch zu Dicollecte-5.3
German:
noch ein paar neue Regeln und festen Fehlalarme
Es wurde eine neue Regel, die zum Thema Verb Vereinbarung überprüft. Vorerst werden nur Fälle mit "ist", "Sind", "Krieg" und "Waren" unterstützt. Beispiel für Fehler, die erkannt werden: ". Der Hund Sind scha & para; n", "Die Autos ist schnell." Um diese Regel funktioniert, werden die Sätze jetzt in disambiguation.xml Unified: zum Beispiel, "Mann" in der Phrase "Ein Mann" nur seine Nominativ Lesung beibehalten (SUB: NOM: SIN: MAS), während sie verwendet werden, um auch Akkusativ und Dativ Lesungen (SUB: AKK: SIN: MAS, SUB: DAT: SIN: MAS). (Https://github.com/languagetool-org/languagetool/issues/233)
Italienisch:
verbessert ein paar Regeln
Polnisch:
einige neue Regeln
Portugiesisch:
hinzugefügt / verbesserte mehrere Regeln
3695 zusammengesetzte Wörter (vor der Reform) - die größte freie Datenbank
Russisch:
aufgenommen und verbesserte Regeln
Ukrainisch:
big Wörterbuch Update
neue Grammatikregeln
neue einfache ersetzen Regel für weiche Vorschläge
disambiguator Verbesserungen
Verbindung Tagging und Rechtschreibung Verbesserungen
Initialen Tagging Verbesserungen
Satz- und Wort Tokenisierung Verbesserungen
eine verbesserte Verarbeitung der stres Symbol und weichen Trennstrich
Bitextes Regeln:
hinzugefügt eine einfache Regel zur Überprüfung, ob die Übersetzungen mit dem gleichen Satzzeichen als Erstkäufer (dies schließt nur.?! Zeichen).
Es ist jetzt möglich, Außen Bitextes Regeldateien in der Befehlszeile hinzufügen, indem Sie
-bitextrule Option. Der Dateipfad muss absolut sein. . Achtung: dies ermöglicht mit Bitextes Regeln auch für Sprachen, die keine Bitextes Regeln standardmäßig enthalten haben
Rechtschreibung:
Die neuen Dateien auf /hunspell/spelling.txt kann verwendet werden, um akzeptiert Worte an die Rechtschreibprüfung, die auch berücksichtigt werden bei der Erstellung von Vorschlägen für falsch geschriebene Wörter hinzuzufügen. Dies ist vergleichbar mit den /hunspell/ignore.txt Dateien, die Liste der zulässigen Worte, die * nicht * verwendet werden, bei der Erstellung von Vorschlägen für falsch geschriebene Wörter.
API:
JLanguageTool.activateDefaultPatternRules () und JLanguageTool.activateDefaultFalseFriendRules () wurden entfernt - alle Muster Regeln und falscher Freund Regeln (wenn eine zweite Sprache angegeben) werden nun automatisch aktiviert, wenn der Konstruktor JLanguageTool aufgerufen wird. Sollten Sie einen Stein ohne die XML-basierte Musterregeln benötigen, erweitern Sie Ihre Sprache Klasse (zB "Englisch") mit ein, dass die getPatternRules () Methode überschreibt und gibt eine leere Liste gibt.
ManualTagger.lookup () wurde von ManualTagger.tag (), nachdem sie seit der letzten Version nicht mehr ersetzt worden
Alle statische Methoden und Felder von der Klasse 'Sprache' wurden an die neue Klasse "Sprachen" verschoben. Denn jetzt, die Methoden / Felder in der Klasse Sprache noch existieren, aber sind veraltet.
LanguageIdentifierTools wurde entfernt. Verwenden LanguageIdentifier statt.
entfernt (Default) ResourceDataBroker.setResourceDir () und setRulesDir (), da diese mit dem Konstruktor gesetzt werden
up Aufgeräumt Klasse Profi, z.B. Entfernen getRemark ()
Category.setDefaultOff () entfernt worden ist, kann dies via Konstruktor jetzt eingestellt werden
Umbenannt Klassen: o.lt.rules.patterns.Element = & gt; o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher = & gt; o.lt.rules.patterns.PatternTokenMatcher
Andere kleine API Aufräumarbeiten, die sich nicht auf die gemeinsame Anwendungsfälle sollte, zB IncorrectExample.getCorrections () zurückkehrt und unveränderbare Liste jetzt, Beseitigung von veralteten Methoden.
Embedded-Server:
XML escaping wurde behoben, könnte dies dazu führen, ungültige XML-Dokumente zurückgegeben werden
neue Konfigurationsdatei Option 'maxWorkQueueSize ", dass Sie die maximale Größe der Anforderungswarteschlange festlegen können - wenn es größer als diese bekommt, werden Anträge abgelehnt (503 Service unavailable)
Der Server antwortet jetzt mit mehr spezifischen HTTP-Statuscodes zu diesen Fehlerbedingungen: 413 anfordern Wesen zu groß - wenn Text überschreitet die maximale Schriftgröße 503 Service Unavailable - wenn Check maximale Überwachungszeit überschreitet,
GUI:
Die Stand-alone-GUI kann nun eine einfache Textdatei als Argument, wird diese Datei dann beim Start (Github Ausgabe # 232) geladen werden.
Die Kommandozeilen:
ist es nun möglich, eine externe Regeldatei beim Aufruf Languagetool über die Befehlszeile hinzuzufügen. Verwenden --rulefile, um eine Datei hinzuzufügen. Wenn der Dateiname hat ein Format, das eine Sprachnamen enthält, wird es zusammen mit anderen Regeln verwendet werden; sonst wird es die Regeln ersetzen. Sie können auch eine externe Datei mit falschen Freunden zu laden, indem Sie die Option --falsefriends. Der Dateiname sollte ein absoluter Pfad sein und falscher Freund Dateien werden immer zu denen, die für die Sprache geladen werden hinzugefügt. (Github Ausgabe # 192)
Rule Syntax:
Eine Regel kann nun eine einzelne Beispielsätze haben, solange es hat eine "Korrektur" Attribut - das kann eine gewisse Redundanz zu speichern, wenn die einzig richtige Satz ist der gleiche wie der falsche Satz mit der Korrektur angewendet. Bevor eine Regel benötigt mindestens zwei Beispielsätzen.
"Beispiel" Element: type = "falsch" ist nun optional, wenn es eine "Korrektur" Attribut. Die "Korrektur" Attribut bedeutet, dass der Satz ist falsch.
"Beispiel" Element: type = "richtige" ist nun optional. Kein Attribut "Typ" und keine "Korrektur" Attribut bedeutet, dass der Satz korrekt ist.
Intern:
Wir haben von Apache Tika zur Sprachauswahl Detektor (https://github.com/optimaize/language-detector) zum automatischen Identifizieren der Textsprache umgeschaltet. Es sollte schneller und Ergebnisse sind zuverlässiger. Nachweis von Asturien und Galizisch musste gesperrt werden, weil die Erfassungsqualität zu niedrig und ebenfalls betroffen Nachweis von Spanisch.
Regression behoben, der es unmöglich macht, externe Regeldateien in der GUI zu laden werden.

Was ist neu in Version 2.8:

asturischen:
entfernt die Abhängigkeit von Hunspell, verwendet nun Morfologik für die Rechtschreibprüfung
Breton:
hinzugefügt und verbessert ein paar Regeln
Katalanisch:
aktualisiert Wörterbuch
aufgenommen und verbesserte Regeln
Fest Fehlalarme
Dutch:
hinzugefügt und verbessert viele Regeln
Englisch:
ein paar neue Regeln (Dank an Nick Hough)
aktualisiert die Tagger und Synthesizer-Wörterbücher, Festsetzung der Ausgabe # 202
neuen Filter zur Anpassung der partofspeech der Wortteile, beispielsweise verwendet werden:. In * Dies wird nur zu halten Termine der Wörter, die mit "in" und dem Start der Teil nach dem "in" ist ein Adjektiv (POS-Tag 'JJ'). Die "no: 1" ist das Zeichen Stellung, also hier die erste (und einzige) Anpassung bezeichnet
Französisch:
hinzugefügt und verbessert ein paar Regeln
German:
hinzugefügt und verbessert ein paar Regeln
Polnisch:
aufgenommen und verbesserte mehrere Regeln
hinzugefügt und verbessert falsche Freunde mit Englisch
Portugiesisch:
hinzugefügt / verbesserte mehrere Regeln
Spanisch:
entfernt die Abhängigkeit von Hunspell, verwendet nun Morfologik für die Rechtschreibprüfung
Neu formatierte Datei rules
Hinzugefügt mehr Regeln
Tagalog:
entfernt die Abhängigkeit von Hunspell, verwendet nun Morfologik für die Rechtschreibprüfung
der Bindestrich ("") ist ein Trennzeichen jetzt bei Tokenerstellung den Text
Russisch:
aufgenommen und verbesserte Regeln
noch ein paar falschen Freund Regeln (Russisch / Englisch)
Ukrainisch:
vielen neuen Regeln (einschließlich der Vereinbarung mit Substantiven, Zeitangaben usw.)
Regel Abdeckung Verbesserung
Wörterbuch update (große Verbesserungen für Eigennamen und Vokativ)
neuen Tag und herrschen über alternative Schreibweise zu warnen,
Mehrwortfrequenz Informationen zur Rechtschreibvorschläge zu verbessern
ein paar neue Regeln disambiguator
Rule Syntax:
... können nun auf eine RuleGroup hinzugefügt werden, um alle Regeln dieser Gruppe beeinflussen
Wenn Sie Ihre eigenen Regeln, die nicht Teil des LT Sie können nun externe = "yes", um Ihre Kategorien, um die Regel-Link zu vermeiden, um von in unserem Standalone-GUI erscheinen community.languagetool.org entwickeln (der Link nicht funktionieren würde für Regeln, die nicht Teil der Hauptverteilung LT) sind. (Github Ausgabe # 223)
Wenn eine Regelgruppe gibt an, default = "off", die Regeln in der Regelgruppe kann auch nicht standardmäßig festlegen = "on" / "off".
API:
Entfernt Klassen und Methoden, die seit 2,7 oder mehr als veraltet war
Embedded-Server:
der Konfigurationsdatei-Optionen 'request "und" requestLimitPeriodInSeconds' können nun auch für den HTTP-Server (und nicht nur für den HTTPS-Server) verwendet werden
Neue Konfigurationsdatei Option 'trustXForwardForHeader': setzen Sie diese auf "true", wenn Sie die Server hinter einem Reverse-Proxy laufen und wollen, dass die Anfrage Grenze auf die ursprüngliche IP-Adressen von der 'Xforwardedfor "HTTP-Header zur Verfügung gestellt zu arbeiten, in der Regel festgelegt der Proxy. Wenn Sie hinter einem Proxy laufen, aber nicht diese Eigenschaft auf true gesetzt ist, kann ein Benutzer alle Anfragen verwenden, damit andere Benutzer erhalten auch eine Fehlermeldung wegen der Anfrage Grenze.
Fix Antwort nach Ablauf der Frist Modus: ... war manchmal leer, verwirrend die Textprüfung in Wordpress
Bitextes Regeln wurden nicht ordnungsgemäß deaktiviert, auch wenn sie mit einem geeigneten Parameter für den Server festgelegt wurden; jetzt ist es fixiert
Das Problem mit falschen Positionen für einige Bitextes Regeln (Ausgabe # 218)
GUI:
Eine neue Einstellung 'errorColors' wurde an die languagetool.cfg Konfigurationsdatei hinzugefügt. Es kann verwendet werden, um die Hintergrundfarbe von Fehlern eingestellt werden. Zum Beispiel errorColors = Tipp: # b8b8ff, style: # ffb8b8 wird "typographische" Fehler mit einem blauen Hintergrund und "Stil" Fehler mit einem roten Hintergrund im oberen Teil des LT-Fenster zeigen. "Typographische" und "Stil" sind die Arten, die in grammar.xml als "type = ..." eingestellt sind. Es gibt keine Benutzeroberfläche noch diese Farben konfigurieren. Beachten Sie, dass Sie nur die Datei, wenn languagetool.cfg LT läuft nicht bearbeitet werden.
Intern:
Bugfix: Regeln in einer Regelgruppe war nicht aktiviert, wenn eine vorherige Regel aus dem gleichen RuleGroup verwendet default = "off"
Die Wörter werden nicht mehr von der Rechtschreibprüfung, nur weil sie in Vorschlag einer Regel auftreten, ignoriert. Wenn Sie die Rechtschreibprüfung auf Wörter global ignoriert werden sollen, fügen Sie sie hunspell / ignore.txt. Zu ignorieren, je nach Kontext, fügen Sie ein 'ignore_spelling "-Regel zu disambiguation.xml.
Eine Datei 'hunspell / prohibit.txt' kann nun verwendet werden, um Wörter als Rechtschreibfehler zu kennzeichnen, auch wenn die Rechtschreibprüfung normalerweise akzeptiert. Dies ist sinnvoll, um den Languagerechtschreibprüfung, ohne auf die vorgelagerten checker aktualisiert werden, zu verbessern. Die Datei 'prohibit.txt "ist das Gegenteil von" ignore.txt ", die die Rechtschreibprüfung, um Wörter zu ignorieren verursacht.
Die partofspeech Tagger für die meisten Sprachen können jetzt durch Hinzufügen von Einträgen in der Datei org / Languagetool / Mittel / XX / added.txt (XX ist der Sprachcode) erweitert werden. Das Format ist "Fullform Grundform Post AG", drei Spalten durch Tabulatoren getrennt. Dies macht es einfacher für die Benutzer (und Entwickler), um die POS-Tagger zu verlängern, da sie nicht brauchen, um zu exportieren, zu ändern, und erstellen Sie die Binär-Wörterbuch für jede Änderung.

Was ist neu in Version 2.7:

Breton:
aufgenommen und verbesserte Regeln
Neue Regel, dass, wenn ein Tag ein Datum übereinstimmt überprüft, zB erkennt "Gwener 28 a viz EOST 2014", dieses Datum ist kein Sonntag.
Katalanisch:
aufgenommen und verbesserte Regeln
Fest Fehlalarme
Dutch:
hinzugefügt und verbessert viele Regeln
geschaltet Morfologik-basierte Rechtschreibprüfung
-Englisch:
Möchten Sie ein Teil des Teams, das zu den weltweit leistungsfähigsten Open Source Lektorat Tool entwickelt sein? Wir suchen nach einem Betreuer für die englischen Regeln in Languagetool suchen. Siehe http://wiki.languagetool.org/tasks-for-language-maintainers für Details.
Alle englischen Wörterbüchern wurden erweitert, um Worthäufigkeitsklassen enthalten, um die Rechtschreibprüfung Vorschläge zu verbessern (die Frequenzdaten aus https://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/js genommen / imes / Latin / Wörterbücher, wie für andere Sprachen, die bereits diese Funktion zu nutzen).
Bessere Vorschläge für Englisch Lernende: unregelmäßige Verben, Substantive und Adjektive jetzt haben in der Regel einen besseren Vorschlag. Beispielsweise 'thinked' schlägt ', dachte' schlägt 'frau' 'Frauen'.
Weitere Rechtschreibfehler enthalten Vorschläge nun, zB 'Garentee' (Garantie), "dankbar" (danke). Dies kann einen Leistungsabfall von ca. 10% (mehr für Texte mit viel unbekannter Wörter) führen.
Neue Regel, dass, wenn ein Tag ein Datum übereinstimmt überprüft, zB erkennt "Monday, 7. Oktober 2014", so dass Tag kein Freitag. Diese Regel wird nur funktionieren, wenn sie das Datumsformat im Einsatz erkennt. Bisher werden diese Formate unterstützt: * "Monday, 7. Oktober 2014" * "Montag, 7. Oktober 2014" * "Monday, 7. Oktober 2014" * "Monday, 7. Oktober 2014" * (dies funktioniert auch mit verkürzten Woche Tage wie Mo oder Mo für Montag)
Esperanto:
Neue Regel, dass, wenn ein Tag ein Datum übereinstimmt überprüft, zB erkennt "Vendredon la 28-eine de AAgusto 2014", dieses Datum ist kein Sonntag.
Französisch:
aktualisiert POS-Tag-Wörterbuch und Hunspell Wörterbuch zu Dicollecte-5.2
soeben einen Synthesizer - die Vereinbarung der Regel kann nun Vorschläge zu machen für einige Fehler
hinzugefügt / verbesserte mehrere Regeln
Neue Regel, dass, wenn ein Tag ein Datum übereinstimmt überprüft, zB erkennt "vendredi 28/08/2014", dieses Datum ist kein Sonntag.
German:
In seltenen Nullpointerexception und ein ArrayIndexOutOfBoundsException
Feste mehrere Fehlalarme
Added und verbesserte Regeln
Neue Regel, die für Sätze prüft ohne Verb (standardmäßig deaktiviert, da das Risiko von Fehlalarmen)
Neue Regel, dass, wenn ein Tag ein Datum übereinstimmt überprüft, zB erkennt "Dienstag, 2014.09.29", wie das Tag kein Freitag.
Performance-Verbesserungen für die Rechtschreibprüfung Vorschläge
Persisch:
hinzugefügt anfängliche Unterstützung für Persisch (Farsi)
Polnisch:
hinzugefügt und verbessert einige Regeln
neue Regel, dass, wenn ein Tag ein Datum übereinstimmt prüft
Portugiesisch:
hinzugefügt / verbesserte mehrere Regeln
hinzugefügt viele Dutzende von zusammengesetzten Wörtern
Russisch:
hat neue Regeln
beheben Sourceforge Feature Request # 38 (Überprüfung für unterschiedliche Anführungszeichen)
noch ein paar falschen Freund Regeln (Russisch / Englisch)
neue Regel, dass, wenn ein Tag ein Datum übereinstimmt überprüft, zB erkennt "ÐÐ¾Ð½ÐµÐ'ÐµÐ"NŒÐ½Ð¸Ðº, 30 N ?? & ETH, & micro; & ETH, & frac12; N & sbquo; N ?? & ETH, & plusmn; N & euro; N ?? 2014 & ETH, & sup3 ;. ", wie dieser Zeitpunkt nicht ein Montag
erweitert Russian Verbindung Regel mit neuen Worten von Post AG Wörterbuch
Spanisch:
Es wurden neue POS Kategorie Z (für geschriebene Zahlen, zB "uno ',' dos ', ...)
buchstabiert Nummern können nun erkannt und verwaltet sowohl in Begriffsklärung und Regeln.
Es wurden einige falsche Lemmata in POS-Wörterbuch.
Hinzugefügt Hybrid chunker-disambiguator.
Tamil:
Hinzugefügt anfängliche Unterstützung für Tamil. Wenn der font für Tamil ist nicht richtig auf Ihrem Computer angezeigt wird und Sie mit Windows arbeiten, müssen Sie möglicherweise gelten die Arbeit um hier beschrieben: https://bugs.openjdk.java.net/browse/JDK-8008572
Ukrainisch:
Großes Update für POS-Wörterbuch (Fixes und neue Wörter)
einige POS-Tag für Konsistenz umbenannt; Neue Etiketten hinzufügen für Abkürzungen und seltene Wörter
viele neue Regeln und Updates für bestehende Regeln
neue Regel, dass, wenn ein Tag ein Datum übereinstimmt überprüft, zB erkennt "& ETH, & ETH, & frac34; & ETH, & frac12; & ETH, & micro; & ETH," N- & ETH; "& ETH, & frac34; & ETH, & ordm ;, 7 & ETH, & para; & ETH, & frac34; & ETH, & sup2; 2014 ", da dieses Datum nicht auf einen Montag
Token Normalisierung Leistungsverbesserung
Libreoffice-Integration:
Sie nicht von Fußnoten in Libreoffice 4.3 verwirrt und später (sie uns jetzt mit den Fußnote Positionen als Meta-Daten, so dass wir sie ignorieren).
API:
Wichtige Leistungsverbesserungen für die Multi-Thread-Anwendungsfall, in dem JLanguageTool bekommt pro Thread erstellt, aber die Sprache Objekt (zB 'Deutsch') wird nur einmal erstellt. Overhead für die Erstellung JLanguageTool sollte jetzt viel niedriger sein.
Removed mehrere Klassen und Methoden, die seit Version 2.6
Entfernt DutchSpellerRule - verwenden MorfologikDutchSpellerRule statt
Die Unterzeichnung Language.getRelevantRules () hat sich geändert
Die JLanguageTool und MultiThreadedJLanguageTool Bauer nicht erklären, eine IOException werfen mehr
WhitespaceRule hat MultipleWhitespaceRule umbenannt (WhitespaceRule noch vorhanden ist, aber nicht mehr empfohlen)
Veraltete einige Methoden, deren Sichtbarkeit wird verringert (zB aus der Öffentlichkeit zu geschützt)
MorfologikSpellerRule.getRuleMatch (String, int) hat MorfologikSpellerRule.getRuleMatches (String, int) umbenannt
Die RuleMatch Konstruktor wirft jetzt eine Ausnahme, wenn toPosition nicht größer als fromposition
eine neue abstrakte Klasse TextLevelRule die Regel erstreckt und das kann für Regeln, die mehr als einzelne Sätze decken verwendet werden.
Befehlszeile:
Aktivieren und Deaktivieren von spezifischen Regeln zur gleichen Zeit ist jetzt erlaubt. Um nur einige Regeln (Deaktivierung der ganze Rest), die zuvor mit "--enable LIST_OF_RULES" getan zu testen, nun "--enabledonly --enable LIST_OF_RULES" (oder "-eo -e LIST_OF_RULES").
Embedded-Server:
Zwei neue Optionen in den Eigenschaften festgelegt Datei zu machen Language die gleiche XML-Format wie nach Ablauf der Frist (ATD) zurückkehren werden. Auf diese Weise kann es als direkter Ersatz für ATD verwendet werden: * Modus - 'Languagetool "oder" AfterTheDeadline' * afterTheDeadlineLanguage - Code der Standardsprache, wenn mode auf 'AfterTheDeadline "HINWEIS: Wird der Modus" AfterTheDeadline "in Betracht gezogen werden Versuchs für jetzt.
Die neue Option 'maxCheckThreads' ermöglicht die Einstellung der maximalen Anzahl von Threads arbeiten Anforderungen parallel. Der Standardwert ist 10, wie es früher war.
Internals:
New abstrakte Regel AbstractDateCheckFilter, die, wenn ein Wochentag und Datum Spiel überprüfen können. Zum Beispiel "Tuesday, 29. September 2014" festgestellt werden, wie 29. September 2014 ist nicht wirklich ein Montag. Dies verwendet die neue experimentelle RuleFilter Schnittstelle, die aus XML mit dem neuen "Filter" Element bezeichnet werden kann. "Filter" nimmt diese Attribute: "Klasse": den vollständigen Namen einer Java-Klasse, RuleFilter implementiert, zB "Org.languagetool.rules.de.DateCheckFilter" "args": eine Zeichenkette wie "Jahr: 1 Monat: 2 Tage: 3 Wochentag: 4", dh eine durch Leerzeichen getrennte Liste von Schlüssel / Wert-Paaren, wobei x wird aufgelöst Tokenwert des Musters (wie in der "Botschaft" Element)
Die Verbindung der Regel ignoriert jetzt Token, die in der disambiguation.xml immunisiert wurden
Die "Filter" Aktion im disambiguator wird nur noch zu POS-Tags, die die POS-Tag angegebenen übereinstimmen angewendet. Wenn sie nicht übereinstimmen, wird die Regel nicht angewendet.
Wenn Sie die Erweiterung der XML-Regeln sind als bei http://wiki.languagetool.org/tips-and-tricks#toc2 beschrieben, die externe Regel und Begriffsklärung-Dateien können jetzt auf einer passwortgeschützten Server durch Angabe gehostet werden eine URL wie folgt aus: http: // user: password@example.org/path/user-rules.xml
Der Gedankenstrich ("a & euro;" ") ist jetzt ein Tokenerstellung Zeichen für alle Sprachen
Neues Feature:
Die Verwendung von Sprachmodellen
Languagetool können jetzt nutzen ngram Daten. ngram Daten sind Informationen darüber, wie oft Sätze in einer Sprache auftreten. Derzeit nutzt diese Sätze der Länge 3.
Die Daten werden von einem englischen Regel wie Vermischung Grob- / Kurs oder flair / Flare zur homophone Fehler zu finden,. Language hatte einige Regeln dieser Art vor, aber die neue Regel unterstützt nun etwa 900 solcher Wortpaare / Sets.
Die dafür benötigten Daten ist riesig (7 GB für Englisch) und somit nicht Teil oder Languagetool.
Die Daten (nur Englisch jetzt) und Dokumentation ist http://wiki.languagetool.org/finding-errors-using-big-data verfügbar
Mit ngrams macht Languagetool etwas langsamer, wenn die Daten auf einer SSD gespeichert.
Wenn nicht auf einer SSD gespeichert, kann die Leistung drastisch zu verringern.
Verwenden Sie die neue --languagemodel Option mit dem Kommandozeilen-Client, um die Regel, die die Daten verwendet zu aktivieren. Diese Option ist für den Stand-alone-GUI ist noch nicht verfügbar.

Was ist neu in Version 2.4.1:

Aktualisiert Morfologik Bibliotheken 1.8.3 zu langsam Vorschläge in der Rechtschreibprüfung, die betroffen beheben mindestens en-US

Was ist neu in Version 2.4:

Breton:
SRX Satz tokenization
hinzugefügt / verbessert ein paar Regeln
Fest einige Fehlalarme
falsche Vorschläge dank Fest hinzugefügt Tests korrigiert
Katalanisch:
hinzugefügt / verbesserte mehrere Regeln
Fest Fehlalarme
gemacht Ergänzungen und Korrekturen an den Tagger Wörterbuch
entfernt Ein paar Worte von Synthese-Wörterbuch (siehe filterarchaic.txt)
Mehrfrequenzdaten an den Tagger Wörterbuch; Frequenzwortliste stammt aus dem Gaia-Projekt, mit Apache License, Version 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
Englisch:
hinzugefügt / verbessert ein paar Regeln
Fest einige Fehlalarme
Französisch:
hinzugefügt / verbesserte mehrere Regeln
Fest einige Fehlalarme
German:
hinzugefügt / verbesserte mehrere Regeln
soeben einen Synthesizer die Vereinbarung Regel kann nun Vorschläge zu machen für einige Fehler (nicht alle Vorschläge sind richtig, wenn auch)
Polnisch:
hinzugefügt / verbesserte mehrere Regeln, insbesondere für Trennstrich und Bindestrich Nutzung
Mehrfrequenzinformationen für die Rechtschreibprüfung Wörterbuch; Frequenzwortliste stammt aus dem Gaia-Projekt, mit Apache License, Version 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
Fest einige Fehlalarme
Portugiesisch:
hinzugefügt / verbesserte mehrere Regeln (es enthält jetzt Geschlecht Regeln "ein" / "o")
Es ist nun 3400+ gesetzte Wörter
die JAR-Datei wurde umbenannt in languagetool.jar, von ehemals languagetoolstandalone.jar zu Verwirrung darüber, was 'standalone' bedeutet in diesem Zusammenhang (github Ausgabe # 29) zu vermeiden
für Sprachen mit vielen Regeln (wie Französisch oder Deutsch) Leistung auf langen Texten wurde von über 2030% erhöht
Update für threadsafety (könnte dazu führen, hängen in MultiWordChunker)
ein Fehler behoben, chunk Anmerkungen wurden in Gruppen getestet Fest
fix: 1 und nicht in ... bewertet worden
einen Fehler in der Vereinigung Mechanismus, der einige der passenden Interpretationen vorzeitig verworfen Fest
Unterstützung für chunk Anmerkungen im disambiguator und fixiert einen Fehler bei der Filterung Token mit chunk Anmerkungen
aktualisiert Morfologik Bibliotheken 1.8.2 (Bugfixes, strengere Eingangs sanity Überprüfung, fügen Frequenzdaten, Wörterbücher)
hinzugefügt die Möglichkeit, einschließlich Frequenzdaten zu taggging oder Rechtschreibwörterbücher. Das erwartete Format der Frequenzwortlisten ist die in der Gaia-Projekt, mit Apache License, Version 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
neue Kommandozeilen-Tools zu exportieren und binäre Übersetzungswörterbüchern:
org.languagetool.dev.DictionaryExporter
org.languagetool.dev.POSDictionaryBuilder
Libreoffice / Openoffice-Integration:
hat einen Workaround für falsch Satzerkennung für den Fall, dass eine Fußnote erschien nach einem Satz Punkt (Sourceforge Bug # 191)
Standalone-GUI:
Die von der "Mehr ..." im Kontextmenü eines Fehlers geöffneten Dialog wird nun auch angezeigt werden richtige und falsche Sätze Beispiel
API:
SentenceTokenizer ist jetzt eine Schnittstelle, die Umsetzung hat zu RegexSentenceTokenizer verschoben worden, aber das ist überholt und sollte SRXSentenceTokenizer stattdessen verwendet werden
Einige Methoden von org.languagetool.tools.StringTools haben zur org.languagetool.gui.Tools Klasse im languagetoolguicommons Projekt verschoben worden
LanguageToolListener.languageToolEventOccured () auf LanguageToolListener.languageToolEventOccurred () umbenannt
org.languagetool.tools.SymbolLocator nicht öffentlich ist mehr (sollte keine Auswirkungen auf jemand)
entfernt DanishSentenceTokenizer, die seit drei Jahren veraltet waren
Rule.getCorrectExamples () und Rule.getIncorrectExamples () nicht mehr null zurück, sondern eine leere Liste, wenn es keine Beispiele. Folglich haben setCorrectExamples () und setIncorrectExamples () nicht akzeptieren null mehr.
Rule.getId () kann eine beliebige Zeichenfolge jetzt zurückkehren, nicht nur AsciiOnly Saiten (eigentlich war dies vor der Fall, wie die AsciiOnly Einschränkung wurde nie durchgesetzt und nur in der javadoc erwähnt)
languagetoolwikipedia: die Kommandozeilenoptionen zur Überprüfung eines Wikipedia-Dump wurden vereinfacht. Der Befehl kann nun wie folgt aufgerufen werden: java jar languagetoolwikipedia.jar check l en f enwiki20130621pagesarticles.xml Rufen Sie einfach "java jar languagetoolwikipedia.jar check", um eine Nutzungsmeldung. Mehr als eine Datei kann mit der Option f festgelegt werden. Zusätzlich zu Wikipedia XML-Dumps, CSV-Dateien aus Tatoeba (http://tatoeba.org) werden nun ebenfalls unterstützt, müssen sie zunächst gefiltert, dass nur die gewünschte Sprache enthält.

Was ist neu in Version 2.3:

Breton:
hinzugefügt / verbessert ein paar Regeln
Fest Fehlalarme
aktualisiert POS Wörterbuch von Apertium (SVN r47282)
Katalanisch:
Unterstützung für den Sprachcode ca-ES-Valencia (Valencia Katalanisch), die in Libreoffice 4.2.0
hat ein einfaches Ersetzen der Regel mit Hunderten von Ersatzvorschläge
hinzugefügt / verbesserte mehrere Regeln
Fest Fehlalarme
Chinese:
hat einen Workaround für einen StringIndexOutOfBoundsException (http://sourceforge.net/p/languagetool/bugs/186/)
Englisch:
hinzugefügt Ersatzmuster für die Rechtschreibprüfung Vorschläge besser zu machen (jetzt bietet 'gelehrt' für 'gelehrt')
hinzugefügt / verbessert ein paar Regeln
Französisch:
hinzugefügt / verbessert ein paar Regeln
Fest Fehlalarme
aktualisiert POS-Tag-Wörterbuch und Hunspell Wörterbuch zu Dicollecte-4.12
German:
hinzugefügt / verbesserte mehrere Regeln
Portugiesisch:
hinzugefügt / verbessert ein paar Regeln
Es wurde nun 3300 + zusammengesetzte Wörter
Ukrainisch:
hinzugefügt / verbesserte mehrere Regeln
der Quellcode auf GitHub verschoben: https://github.com/languagetool-org/languagetool
Languagetool benötigt Java 7 jetzt
Languagetool nutzt mehrere Threads jetzt Textprüfung auf moderner Hardware, die Verbesserung der Leistung (dies wirkt sich auf die Standalone-Version, die Befehlszeilenversion und die Libreoffice / Openoffice-Erweiterung)
Rule Syntax:
vorläufige Unterstützung neuer Min / Max-Attribute, die ein Element, das die gegebene Anzahl von Malen erscheint entsprechen können. Zum Beispiel: foo wird nichts oder "foo", also passen "foo" ist optional foo wird "foo" oder "foo foo" foo wird nichts übereinstimmt, "foo" oder "foo foo" Use max = Match "- 1" unbegrenzt Vorkommen zu ermöglichen. Für min, nur 0 oder 1 unterstützt wird (1 ist die Standardeinstellung).
Unterstützung für die OR-Anweisungen. Zum Beispiel: ein intern und in der Laufzeit, in der Regel ODER-Anweisungen enthält, ist in mehrere Regeln ohne OR-Anweisungen umgewandelt
Englisch hat jetzt eine chunker zu erkennen, unter anderem Singular und Plural Nomen Brocken. Dies ist bei http://wiki.languagetool.org/using-chunks dokumentiert
Standalone-Version:
Die Standalone-Version unterstreicht nun Fehler mit einer roten (Rechtschreibfehler) oder blau (andere Fehler) Linie (Panagiotis Minos)
Denken Sie an die Sprachenauswahl für den nächsten Start
Verbesserte Fenster und Dialog Platzierung in einer Multi-Monitor-Setup
Embedded Server: nutzt Standard-Port (8081) wieder, wenn sie ohne Argumente gestartet
aktualisiert die morfologik-stamm Bibliothek auf Version 1.7.1, um bessere Vorschläge, einschließlich sachgerechten Umgang mit diakritischen Zeichen und Ersatz Mustern zu ermöglichen (in Höhe von MAP und REP Funktionen in hunspell Wörterbücher)
Openoffice / Libreoffice-Integration:
fix: der "About" -Dialog nicht in Apache Openoffice 4.0
fix: länderspezifischen Vorschriften (wie British English) hat nicht funktioniert
API:
In Klasse Sprache hat getCountryVariants (), um getCountries () umbenannt, und eine neue Methode getVariant wurde hinzugefügt.
Es wurden einige Verfahren veraltet
Einige Verfahren wurden aus dem Werkzeug-Klasse (Languagetool-Core) an den neuen CommandLineTools Klasse verschoben (Languagetool-Kommandozeile)

Was ist neu in Version 2.2:

Was ist neu in der Version 2.1:

Was ist neu in der Version 2.0:

Anforderungen :

Java 2 Standard Edition Runtime Environment

14 Apr 15

Suche nach Kategorie

LanguageTool

Andere Software von Entwickler Daniel Naber

Jwordsplitter

LanguageTool

Kommentare zu LanguageTool

Kommentare nicht gefunden

Kommentar hinzufügen

Suche nach Kategorie

Suche nach Kategorie

Beliebte Software

ChaletOS 17 Feb 15

WEAKERTH4N Blue Ghost 17 Feb 15

Yandex Browser 17 Feb 15

Quirky Linux 22 Jun 18

Simple Scan 2 Dec 17

PCLinuxOS 22 Jun 18

NdisWrapper 11 May 16

LanguageTool

Andere Software von Entwickler Daniel Naber

Jwordsplitter

LanguageTool

Kommentare zu LanguageTool

Kommentare nicht gefunden

Kommentar hinzufügen

Suche nach Kategorie

Beliebte Software

Java-Chess 3 Jun 15

Zorin OS Ultimate 16 Aug 18

LXLE 22 Jun 18

Asterisk 2 Oct 17

Cactus McCoy 2 20 Feb 15

OpenShot Video Editor 17 Aug 18

Kodachi Linux 12 Jan 17