Apache Tika 0.5 veröffentlicht, Solr Cell auf trunk aktualisiert
Das Apache Tika Team hat soeben bekannt gegeben, dass Tika 0.5 veröffentlicht wurde (siehe unten). Ich habe heute Morgen die Tika-Integration von Apache Solr (auch bekannt als Solr Cell) aktualisiert, um die neuen Bibliotheken zu verwenden. Um sie zu verwenden, sollten Sie den SVN-Stamm von Apache Solr auschecken.
Das Apache Lucene Projekt freut sich, die Veröffentlichung von Apache Tika 0.5 bekannt zu geben. Die Inhalte der Version wurden auf die Apache-Hauptseite und den m2 ibiblio-Sync übertragen, so dass die Versionen verfügbar sein sollten, sobald die Mirrors die Synchronisationen erhalten.
Apache Tika, ein Unterprojekt von Apache Lucene, ist ein Toolkit zum Erkennen und Extrahieren von Metadaten und strukturierten Textinhalten aus verschiedenen Dokumenten unter Verwendung vorhandener Parser-Bibliotheken.
Apache Tika 0.5 enthält eine Reihe von Verbesserungen und Fehlerbehebungen. Einzelheiten finden Sie in der Änderungsdatei:
http://www.apache.org/dist/lucene/tika/CHANGES-0.5.txt
Apache Tika ist im Quelltext auf der folgenden Download-Seite verfügbar:
http://www.apache.org/dyn/closer.cgi/lucene/tika/apache-tika-0.5-src.zipApache Tika ist auch in binärer Form oder zur Verwendung mit Maven 2 in den zentralen Maven Repositories erhältlich:
http://repo1.maven.org/maven2/org/apache/tika/0.5/
http://mirrors.ibiblio.org/pub/mirrors/maven2/org/apache/tika/0.5/In den ersten 48 Stunden ist die Version möglicherweise nicht auf allen Spiegelservern verfügbar.
Wenn Sie von einem Spiegelserver herunterladen, denken Sie bitte daran, die Downloads anhand der Signaturen auf der Apache-Website zu überprüfen:
http://www.apache.org/dist/lucene/tika/KEYS-0.5.txtWeitere Informationen über Apache Tika finden Sie auf der Homepage des Projekts:
http://lucene.apache.org/tika