Kostenloser Herunterladen PDFTextStream Für Linux ::: Software

PDFTextStream

Screenshot der Software:

Softwarebeschreibung:

Version: 2.6.0

Upload-Datum: 20 Feb 15

Entwickler: Snowtide Informatics Systems, Inc.

Lizenz: Shareware

Preis: 1900.00 $

Popularität: 63

Herunterladen

Kaufen

Currently 3.50/5
1
2
3
4
5

Rating: 3.5/5 (Total Votes: 2)

PDFTextStream Projekt ist ein PDF-Text und Metadaten-Extraktion Bibliothek für Java, Python und .NET zur Verfügung.
Es unterstützt alle Versionen des PDF-Dokuments Spezifikation (einschließlich v1.6 von Acrobat 7 verwendet), Entnahme von Text kodiert mit Double-Byte-Zeichensätzen (einschließlich Chinesisch, Japanisch und Koreanisch), Entschlüsselung von 40-Bit- und 128- Bit verschlüsselte Dokumente und Extraktion aller Dokument-Metadaten von PDF-Dokumenten (einschließlich Formulardaten, Lesezeichen und Anmerkungen) zur Verfügung gestellt.
Einfache Integration in Jakarta Lucene ist im Lieferumfang enthalten

Was ist neu in dieser Pressemitteilung:.

Diese Version enthält eine Vielzahl von Korrekturen vorgenommen um sicherzustellen, PDFTextStream ist in der Lage Extrahieren von Text aus PDF-Dokumenten, die nicht-konforme an die PDF-Spezifikation.
Es enthält auch eine Reihe von Leistungsverbesserungen.

Was ist neu in Version 2.3.0:

Added eine .isStruckThrough () -Methode com. snowtide.pdf.TextUnit, der angibt, ob ein Zeichen eine durchgestrichen durchgezogen.
Verbesserte Unterstützung PDFTextStream für eingebettete Zeichenzuordnungen.
Die Berechnung der Leerzeichen zwischen Wörtern, wurde behoben richtig machen Leerzeichen, die in den Quell PDF-Dokumenten explizit kodiert wird.
Verbesserte PDFTextStream Die Verarbeitung von Composite-Content-Kodierungen, die zuvor konnte was in einigen Bereichen von PDF-Inhalten, die 'ignoriert' während der Extraktion nicht.
ein Fehler in VisualOutputTarget wenn Text aus einer einzigen Zeile würde über mehrere aufgeteilt werden, Fest
Verbesserte vertikale Ausrichtung von Text extrahiert mit VisualOutputTarget
Verbesserte VisualOutputTarget-hergestellten Extrakte, um störende zusätzliche Leerzeichen zwischen eng benachbarten Wörtern beseitigen

Was ist neu in Version 2.2.5:

Diese Version unterstützt zum Extrahieren XFA-Formulare Daten XML.
Sie deutlich die Leistung der Textextraktion mit VisualOutputTarget verbessert. Unterstützung für PDF-Dokumente größer als 2GB.
Ein Fix für einen Bug, wo die Codierungen von Embedded-Type1-Schriften waren bisher nicht richtig in einigen Fällen angewendet.
Ein Update für ein Problem in dem neueren Inhalt in PDF-Dokumenten aktualisiert wurde manchmal ignoriert werden.
Ein Update für ein Problem, wo PDFDocEncoding-kodierte Lesezeichen und Metadaten wurden nicht korrekt dekodiert.
Ein .getDestinationName () -Methode in com.snowtide.pdf.Bookmark.

Anforderungen :

Apache Lucene

20 Feb 15

Kommentare zu PDFTextStream

Suche nach Kategorie

PDFTextStream

Kommentare zu PDFTextStream

Kommentare nicht gefunden

Kommentar hinzufügen

Suche nach Kategorie

Zuletzt angesehene Apps

acew2k.exe 6 Dec 15

Pratagon 3 May 20

Boounce 5 May 15

imEye 25 Oct 15

AutoUnbreak 24 Sep 15

pl121ch.exe 6 Dec 15

w9x2870.exe 6 Dec 15

AKARH00.exe 29 Oct 15

WebKeep 23 Sep 15

IrriPro 18 Jun 16

Suche nach Kategorie

Beliebte Software

BlackArch Linux 22 Jun 18

Elastix 2 Oct 16

Absolute Linux 22 Jun 18

KAVClient 3 Jun 15

Zorin OS Ultimate 16 Aug 18

Adobe Developer Connection Developer Desktop 3 Jun 15

qNotesManager 17 Feb 15

PDFTextStream

Kommentare zu PDFTextStream

Kommentare nicht gefunden

Kommentar hinzufügen

Zuletzt angesehene Apps

acew2k.exe 6 Dec 15

Pratagon 3 May 20

Boounce 5 May 15

imEye 25 Oct 15

AutoUnbreak 24 Sep 15

pl121ch.exe 6 Dec 15

w9x2870.exe 6 Dec 15

AKARH00.exe 29 Oct 15

WebKeep 23 Sep 15

IrriPro 18 Jun 16

Suche nach Kategorie

Beliebte Software

Puppy Linux "Slacko" 28 Apr 17

qNotesManager 17 Feb 15

Adobe Developer Connection Developer Desktop 3 Jun 15

WhatsApp for Desktop 18 Jul 15

antiX MX 1 Dec 17

Sophos UTM 17 Feb 15

Xplore 3 Jun 15