Volltext RSS arbeitet, indem sie eine URL eingegeben, Parsen der Inhalt, und die Schaffung einer Volltext-Feed aus ihm heraus.
Das Futter kann dann für Änderungen über Online-oder Desktop-Feed-Reader, arbeitet wie jedes andere Futtermittel verfolgt werden, die Aktualisierung jeder Änderung auf der Originalseite festgestellt.
Volltext-RSS in seiner vollen Pracht ist verfügbar unter zwei kommerziellen Lizenzen. Eine kostenlose Version ist verfügbar, aber die kommerziellen Versionen zu besseren Extraktionsergebnisse
Was ist neu in dieser Pressemitteilung:.
- Öffnen Graph-Eigenschaften og: title, og: type, og: url, og: image und og: Beschreibung jetzt zurückgegeben, wenn in der Seite in Bearbeitung
- Bug fix: bestimmte XPath-Ausdrücke wurden nicht richtig bewertet, wenn HTML5 Parsing aktiviert wurde
- Cookiebehandlung nur noch auf Weiterleitungen - behebt Problem mit bestimmten Websites (Dank an Dave Vasilevsky)
- Verträglichkeitstest wird nicht mehr angezeigt HHVM unvereinbar - Volltext-RSS arbeitete mit HHVM 3.7.1 in unseren Tests (aber ohne Tidy-Unterstützung und kein automatisches Website Config Updates)
- Humble HTTP-Agent aktualisiert, um die Version 2 des PHP HTTP-Erweiterung unterstützen
- HTML5-PHP-Bibliothek aktualisiert
- Site-Konfigurationsdateien können nun HTTP-Header (User-Agent, Cookie, referer), zB HTTP_HEADER (User-Agent): PHP / 5.6
- Config-Option entfernt:. $ options - & # X3e; user_agents - Gebrauch Website Konfigurationsdateien
- Site-Konfigurationsdateien, die single_page_link verwenden können jetzt folgen sie mit if_page_contains: XPath es bedingte, um .
- Mindest unterstützt PHP-Version ist jetzt 5,3. Wenn Sie müssen PHP 5.2 verwenden, laden Sie bitte die Volltext RSS 3.4
- Site Config-Dateien für eine bessere Extraktion aktualisiert
- Weitere kleinere Korrekturen / Verbesserungen
Was ist neu in Version 3.4:
- Neue Anfrage Parameter: siteconfig können Sie Extraktionsregeln unterbreiten direkt Anfrage
- Neue Anfrage Paramter: = (auto | feed | html) akzeptieren bestimmt, was wir als Antwort zu akzeptieren (missbilligt html = 1 Parameter)
- Neue Anfrage Parameter: key_redirect = 0 auf HTTP-Umleitung zu verhindern, um API-Schlüssel zu verbergen
- Site-Konfigurationsdateien können nun native_ad_clue enthalten: [XPath], um nach Elementen, die bedeuten, dass der Artikel ist eine native ad überprüfen
- Neue Konfigurationsoption: remove_native_ads - auf true gesetzt, und wenn wir feststellen, nativen Anzeige (siehe oben) werden wir sie aus der Ausgabe zu entfernen (nur bei der Verarbeitung von RSS-Feeds, hat keinen Einfluss, wenn der Eingang-Ausgang URL auf einer HTML-Seite) .
- Feed-Ausgang wird für Artikel, die auf native Anzeigen erscheinen gehören Ureinwohner Ad.
- Neue Konfigurationsoption: user_submitted_config zu bestimmen, ob siteconfig Parameter aktiviert ist oder nicht
- Feed-Ausgabe enthält nun URL der erzeugten Futtermittel
- Feed-Ausgabe enthält nun URL der ursprünglichen (Eingang) URL
- Feed-Ausgabe enthält nun URL zum des erzeugten Feed zu abonnieren (mit subtome.com)
- Feed-Vorschau Sheet (feed.xsl) präsentiert nun eine Zeichnung von Link zu füttern
- Feste Zeichencodierung Problem für bestimmte Texte
- Feste Zeichencodierung Problem für bestimmte Zeichen in HTML5 Parsing-Modus
Was ist neu in Version 3.3:
- Neue HTML5-Parser: HTML5Lib wurde von HTML5-PHP (das alte zu viele Probleme hatten) ersetzt worden
- Neue Konfigurationsoption: Cache-Zeit (Optionen- $ & gt; cache_time)
- Neue Konfigurationsoption: aktivieren / deaktivieren Sie Single-Page-Abruf ($ Optionen- & gt; Singlepage)
- Neue Konfigurationsoption: erlaubt HTML-Parser-Override durch Querystring ($ Optionen- & gt; allow_parser_override)
- Neue Anfrage Parameter: Parser - es verwenden, um neue HTML5-Parser zu zwingen, verwendet werden, & amp; Parser = html5php (es wird langsamer sein)
- Erweiterte Debug-Request-Parameter: & amp; debug = rawhtml (zeigt Original-Antwort-Header und Körper), & amp; debug = parsedhtml (zeigt Antwort Körper nach dem Parsen)
- APC Statistikseite erwartet nun APCU (ältere Version von APC weiterhin unterstützt, aber Statistiken im Admin-Bereich wird nicht angezeigt werden)
- Automatische Aktualisierung der ortsspezifischen Extraktionsregeln festgelegt
- Inhalt Sicherheit HTTP-Header jetzt der Fördervorschau verwendet
- Anfrage Parameter und Antwortbeispiele jetzt in einer Tabelle auf der Indexseite aufgeführt (neue Anforderungsparameter Registerkarte)
- Compatibility Test-Datei aktualisiert, um anzuzeigen, wenn HTML5-PHP-Parser wird unterstützt (PHP 5.3 Abhängigkeit), und für HHVM testen (noch nicht unterstützt)
- Config-Option entfernt: $ Optionen- & gt; registration_key
- Preserve TTL Element in RSS 2.0 Feeds
- Weitere kleinere Korrekturen / Verbesserungen
Was ist neu in der Version 3.2:
- Vollständiger Inhalt kann nun von der Ausgabe ausgeschlossen werden (mit & amp; Gehalt = 0 in Abfragezeichenfolgen finden Sie unter Optionen- $ & gt; Gehalt in Config-Datei für weitere Informationen)
- Site-Konfigurationsdateien können nun automatisch aus unserem GitHub-Repository aktualisiert werden (URL aufrufen im Admin-Bereich sichtbar)
- Site Config-Dateien für eine bessere Extraktion aktualisiert
- PHP Lesbarkeit aktualisiert, um mehr gnädig Beschneiden HTML
- Spracherkennungsbibliothek aktualisiert
- HTML Meta-Refresh Weiterleitungen nun auch gefolgt
- APC-Statistik (wenn APC ist auf Ihrem Server verfügbar) jetzt im Admin-Bereich sichtbar
- Bug fix: Doppelte find_string und replace_string Werte in Website-Konfigurationsdateien nicht mehr entfernt (! Dank Fabrizio)
- Bug fix: MIME-Typ Aktionen jetzt angewendet werden, wenn folgende einzelne Seite URLs
- Weitere kleinere Korrekturen / Verbesserungen
Was ist neu in Version 3.1:
- Lassen Sie mehrere Elemente (bisher nur ein aufbewahrt wurde)
- Bug fix: Nicht mehr selbstschließ iframe-Elemente
- Bug fix: Fest manifest.yml um Fehlermeldung zu verhindern, wenn die Bereitstellung auf AppFog
- Weitere kleinere Korrekturen / Verbesserungen
Was ist neu in der Version 3.0:
- Mehrseitiges supportnext_page_link jetzt im Ort config (mehr aktivieren / deaktivieren mit $ Optionen- & gt) unterstützt
- HTML5-Parser availableuse Parser: html5lib in Website Config, siehe auch $ Optionen- & gt; allowed_parsers
- Aktualisiert vor Ort Muster für eine bessere Extraktion
- New globale Website config, um auf alle Websites angewendet werden (global.txt)
- Streifen 'http: //' Präfix, wenn API-Schlüssel wird mitgeliefert
- Site Config Verschmelzung (custom + Standard + Fingerprint + global)
- Site config replace_string (zu finden): ersetzen kann nun auf zwei Zeilen aufgeteilt werden: find_string: Finden Sie, replace_string: Ersetzen Sie
- YouTube und Vimeo URLs jetzt zurückkehren iframe Embed-Code
- Wir haben jetzt sucht Opengraph Titel und Datum-Elemente
- Verbesserte Extraktion aus AJAX pageswe jetzt AJAX aussehen löst in HTML eingebettet, per Google spec
- JSONP supportuse & amp; format = json & amp; Callback = function im Querystring
- New Config-Option aktivieren Cross-Origin Resource Sharing (CORS): $ wahl & gt; cors
- Neue Konfigurationsoption, um XSS zu filtern, falls erforderlich: $ wahl & gt; xss_filter
- Zend_Cache aktualisiert
- Smart cachingexperimental Funktion zum Speichern von Cache-IDs in APC ersten und schreiben Ausgang auf die Festplatte auf nachfolgende Anforderung (siehe $ Optionen- & gt; smart_cache)
- Einfachere Cloud deploymanifest.yml hinzugefügt für AppFog
- APC Zwischenspeichern von Website-Konfigurationsdateien, um die Leistung zu verbessern, wenn APC availablesee $ Optionen- & gt; apc
- Site Config Editor in admin / Schnell finden, zu bearbeiten, zu testen und Testgelände Config-Dateien, oder neue hinzufügen
- Debug-Modus zu sehen, was hinter dem scenessee $ Optionen- & gt geschieht; debug
- Entfernt veraltete Konfigurationsoptionen: Filterung, message_to_prepend_with_key, message_to_append_with_key, error_message_with_key
- Entfernt Extraktion mit CSS via Querystring
- Entfernte config-Option: $ Optionen- & gt; alternative_url
- Bug fix: ermöglichen die Extraktion eines einzelnen Elements
- Bug fix: redirect Handhabung verbessert
;
Anforderungen :
- PHP 5.2 oder höher
Kommentare nicht gefunden