Open Search Server (OSS) ist eine unter der GPL v3 Open Source-Lizenz entwickelt Suchmaschinen-Software.
Gebaut mit die besten Open-Source-Technologien, Open Search Server eine stabile, leistungsfähige Stück Software. Es ist sowohl eine moderne Suchmaschine und eine Suite von High-Power-Volltextsuche-Algorithmen.
Open Search Server läuft auf Windows 20xx / XP / Vista, MacOS X, Solaris und Linux + Java Virtual Machine.
OSS Engine
Dieses Add-on ist eine native Bibliothek in C ++ entwickelt, und eine beträchtliche Steigerung der Kapazitäten von Open Search Server. Dank einer optimierten Maschinencode, OSS Motor bekommt außergewöhnliche Leistungen von Open Search Server. Verbesserungen umfassen:
* Pertinence Personalisierung bietet gigantische Möglichkeiten
* Dokumentenindexierung ist schneller durch eine Größenordnung
* Verbesserte Reaktionszeiten
* Erhöhte Anzahl der möglichen gleichzeitigen Anfragen
OSS Engine arbeitet als ein Add-on, ob in 32 oder 64 Bit Open Search Server unter Linux, Solaris, Windows 20xx / XP / Vista und MacOS X. Es wird durch die Zuordnung von einer proprietären Lizenz verteilt
Eigenschaften .
- Multi-Sprachen Indizierung. Dokumente können in sechzehn Sprachen indiziert werden -. Chinesisch, Dänisch, Niederländisch, Englisch, Finnisch, Französisch, Deutsch, Ungarisch, Italienisch, Norwegisch, Portugiesisch, Rumänisch, Russisch, Spanisch, Schwedisch, Türkisch
- Mehrsprachige Analysatoren schneiden Sätze in Worte, dann laufen Lemmatisierung Algorithmen auf Wörter auf Basis der Dokumentsprache (Singular / Plural, Geschlecht, konjugierten Verben, etc.)
- Die Crawler durch Websites und Dateisysteme, schnell und einfach erstellen Sie Ihre Index.
- Zahlreiche Dokument-Formate werden unterstützt, wie zum Beispiel XML, HTML / XHTML, Adobe PDF, Microsoft Word, Powerpoint, Openoffice, etc.
- Die Web-Oberfläche ist um die Macht durch die Zkoss Rahmen angeboten gebaut. Es läuft mit den wichtigsten Ajax-Browsern. Das RIA-Typ-Schnittstelle ist so bequem wie die eines schweren Client verwenden.
- Einfache Konfiguration über eine einzelne XML-Datei, die Felder Definition und die Indexbindung Optionen enthält.
- Schnelle Integration durch eine XML-Schnittstelle via HTTP-Abfragen (XML über HTTP).
Was ist neu in dieser Pressemitteilung:.
- Das Entwickler-Release stellt neue leistungsstarke Funktionen und einige Fehlerkorrekturen
- Der Screenshot-Funktion erfasst Screenshots der Webseiten automatisch gecrawlt.
- Suchabfragen sind in der Lage, Begriffe aus nicht gespeichert Felder zurück.
- Negative Filter stehen zur Verfügung.
- Der Web-Crawler ist in der Lage, Sitemap-Dateien zu folgen.
Was ist neu in Version 1.2.1-r987:
- Neue Features:
- 3176150: Zeit / Datum-Stempel
- 3186042: Deaktivieren nicht erlaubt (robots.txt)
- 3182953: Crawl URL aus einer Datenbank
- 3182950: Muster und Ausschlussliste Deaktivierung
- 3182097: Hinzufügen von Feldschub Unterstützung
- 3175585: Ähnliche dieser Funktion
- 3169421: japanische und koreanische Unterstützung
- 3159477: identische Webseiten
- 3151757: Upgrade auf PDFBox 1.4.x
- 3141193: FTP / FTPS-Unterstützung in der Datei Crawler
- 3141192: SMB / CIFS-Unterstützung in Datei Crawler
- 3034238: Crawler in der Lage, in geschützten Website einzuloggen
- 3011773: Quarz als Scheduler-Service hinzufügen
- 3138603: Upgrade auf Version 6.0.xx Tomcat
- 3103055: Konvertieren Sie HTML-Entitäten
- 3087916: Upgrade auf PDFBox 1.2
- 3043692: Torrent Parser
- 3042488: Audio-Parser
- 2882260: Fügen Sie einen Parser für text / plain
- 3010010: RTF-Parser
- 3038733: Fügen Sie eine Kiesfilter
- 3036262: Log Management
- 3031800: Schema-Schnittstelle
- 3031204: Hinzufügen Ngram Unterstützung
- 3008440: Index-Replikation
- 3026212: API-Schnittstelle für Dokument und Löschen
- 3023327: Sub-Domain-Extraktion in Web Crawler
- 2820289: Datenbank-Crawler
- 3019035: Neglight dynamische URL beim Crawlen
- 3017277: Lassen Sie Wildcard-Abfrage in der URL-Browser
- 3016491: Url Exporteur
- 3016566: Überwachung API
- 3015939: Cluster zusammenbrechenden
- 2830490: Größe des Index
- 3011847: Score Erklärung
- 3008633: Möglichkeit, schalten Sie die Markierung
- 2997836: In den zurückgegebenen Felder mit zusätzlichen Felder von Meta-Tags
- 2997826: Möglichkeit, Index nur den angegebenen Inhalt
- 2991252: Möglichkeit, Index Binär-Datei und sie zu einem Dokument
- 2982545: Extrahieren von Zeitfrequenz Informationen
- 2881385: API, um den verfügbaren indice abrufen
- 2887376: Erweiterung für die Indexseite Indizes löschen
- 2881388: API zur Liste / Erstellen / Ändern Felder in einem angegebenen Schema
- 2973374: Upgrade auf ZKoss 5.0.x
- 2970747: Upgrade auf Version 6.0.26 Tomcat
- 2966139: Statistik verloren, wenn OSS restart
- 2964704: Upgrade auf Lucene 2.9.x
- 2958015: Fügen Sie Quellarchiv
- 2958005: Upgrade von Apache Httpclient-Bibliothek 4.0.1
- 2956498: Geben Sie einen Weg, um Statistikbericht per E-Mail senden
- 2953803: Upgrade auf PDFBox 1.0
- 2953802: Aktualisieren Sie auf POI 3.6
- 2953575: Charset Erkennung sollte meta http-equiv aussehen
- 2953524: Geben Sie Standard-Zeichensatz für Parser
- 2929332: Faceting Post zenden
- 2900462: Upgrade POI auf 3,5 für xlsx und docs Unterstützung
- 2900449: Upgrade PDFBox bis 0,8
- Fehlerbehebungen:
- 3178432: Falsche cron Werte im Scheduler
- 3104065: Dateiraupen stürzt mit java.io.EOFException
- 3090248: Statistik-Konfiguration verloren, wenn Hinzufügen Felder
- 3051308: nicht interpretiert
- 2881689: Requests.xml fehl auf einigen Windows-Plattformen rotieren
- 3019491: Nullpointerexception & gt; bei java.util.regex.Matcher
- 3017481: Der Web-Crawler wählt den Host in alphabetischer Reihenfolge
- 3015838: Webcrawler Problem mit UTF-8-Kodierung BOM
- 2993103: NoClassDefFoundError BouncyCastleProvider
- 2990960: Begriff nicht in Schnipsel markiert
- 2982541: Phrase Synonyme erzeugen unerwünschte Wörter
- 2934214: Verschobene Hervorhebung auf Schnipsel
Was ist neu in der Version 1.2 Beta:.
- Mehr als 50 neue Features und Bugfixes wurden hinzugefügt
- Ein Index kann auf einem Remote-Server repliziert werden.
- Ein n-Gramm-Filter und ein Kiesfilter bieten neue Möglichkeiten, wie ein Kummerkasten, falsche Schreibweise Toleranz und automatisierte Thema Generation.
- Eine Datenbank-Crawler unterstützen Join-Abfragen und externe Dateien wurde hinzugefügt.
- Verschiedene Verbesserungen wurden an den Web-Crawler, wie beispielsweise eine URL exportiert, Sub-Domain-Extraktion, einer Ausschlussliste, manuelle Krabbeln, und einem Parameter-Filter.
- Eine API und Web-Schnittstelle zur Überwachung und Kontrolle wurde hinzugefügt.
- Die neue Audio-Parser bietet die Möglichkeit, Index torrent, MP3 / MP4, OGG Vorbis, FLAC und WMA-Dateien.
Was ist neu in Version 1.1.2:
- Neue Features:
- In Quellarchiv
- Lucene Nur-Lese-Unterstützung
- Fehlerbehebungen:
- PHP API fehl auf einigen Abfrage mit falschen xml Zeichen
- Ausgabe mit Statistiken Aggregation
- Sortieren functionnality scheinen Art ignorieren bestellen
- Performance-Problem mit großen Feld-Cache
- Ausgabe mit der Ausführung der Web-Crawler
- Negativer Wert auf Web-Crawler Statistiken
- Behaviour Problem der Platzhalterfunktion
- Doppelzurück Feld zurückgegebenen XML
Was ist neu in der Version 1.1:
- Synonyme Unterstützung
- Rechtschreibprüfung Unterstützung
- Web-Crawler und Crawler-Datei
- Unterstützung für weitere Sprachen: Rumänisch, Türkisch, Dänisch, Russisch und individuelle chinesische Zeichen
- Opendocument-Format-Unterstützung
- Verwaltung mehrerer Indizes innerhalb einer einzigen Instanz
Kommentare nicht gefunden