Lucene 2.9 wird veröffentlicht

Hallo Lucene-Benutzer,

Im Namen der Lucene-Entwicklergemeinschaft (einer wachsenden Gemeinschaft, die weit über die Committer hinausgeht) möchte ich die Veröffentlichung von Lucene 2.9 bekannt geben.

Während wir im Allgemeinen versuchen, eine vollständige Abwärtskompatibilität zwischen den Hauptversionen aufrechtzuerhalten, gibt es in Lucene 2.9 eine Reihe von Unterbrechungen, die im Abschnitt ‚Changes in backwards compatibility policy‘ in CHANGES.txt aufgeführt sind.

Wir empfehlen Ihnen, Ihre Anwendung mit Lucene 2.9 neu zu kompilieren, anstatt zu versuchen, es „einzubauen“. Dadurch werden Sie auf Probleme aufmerksam gemacht, die Sie möglicherweise beheben müssen, wenn Sie von einer der Abwärtskompatibilitätslücken betroffen sind. Wie immer ist es eine gute Idee, die CHANGES.txt vor dem Upgrade gründlich zu lesen.

Lucene 2.9 kommt mit einer Vielzahl neuer Funktionen, darunter:

  • Suche und Zwischenspeicherung pro Segment (kann u.a. zu einem viel schnelleren Wiederöffnen führen)
  • IndexWriter bietet nun Suchfunktionen nahezu in Echtzeit
  • Neue Abfragetypen
  • Intelligentere, besser skalierbare Abfragen mit mehreren Begriffen (Platzhalter, Bereich usw.)
  • Eine frisch optimierte Collector/Scorer API
  • Verbesserte Unicode-Unterstützung und Hinzufügen von Collation contrib
  • Eine neue attributbasierte TokenStream API
  • Ein neues QueryParser-Framework in Contrib mit einem Kern-QueryParser-Ersatz ist enthalten.
  • Das Scoring ist jetzt optional, wenn Sie nach Feld sortieren oder einen benutzerdefinierten Collector verwenden, was zu einer erheblichen Leistungssteigerung führt, wenn keine Scores benötigt werden.
  • Neue Analysatoren (PersianAnalyzer, ArabicAnalyzer, SmartChineseAnalyzer)
  • Neuer schneller Vektor-Highlighter für große Dokumente
  • Lucene bietet jetzt eine leistungsstarke Verarbeitung von numerischen Feldern. Solche Felder werden mit einer Trie-Struktur indiziert, die eine einfache und viel schnellere Suche in numerischen Bereichen ermöglicht, ohne dass numerische Werte extern in Textwerte umgewandelt werden müssen.


Und viele, viele weitere Funktionen, Fehlerbehebungen, Optimierungen und verschiedene Verbesserungen. Die vollständige Liste der Änderungen finden Sie hier:

http://lucene.apache.org/java/2_9_0/changes/Changes.html

Auch im Contrib-Bereich von Lucene haben sich viele Änderungen ergeben:

http://lucene.apache.org/java/2_9_0/changes/Contrib-Changes.html

Die Binär- und Quellcode-Distributionen sind unter http://www.apache.org/dyn/closer.cgi/lucene/java/ verfügbar.

Lucene-Artefakte sind auch im Maven2-Repository verfügbar unter

http://repo1.maven.org/maven2/org/apache/lucene/

Die nächste Veröffentlichung

Die nächste Version wird Lucene 3.0 sein. Diese sollte in Kürze erscheinen und wird den gesamten veralteten Code in Lucene 2.9 entfernen. Lucene 3.0 wird auch die erste Version sein, für die der Wechsel von Java 1.4 zu Java 1.5 Voraussetzung ist.

Danke,
Mark Miller

Share the knowledge

You Might Also Like

Agentische KI und der Aufstieg von Protokollen: Wohin sich das Ökosystem als nächstes bewegt

m Jahr 2025 bewegen wir uns schnell auf ein neues Paradigma in...

Read More

MCP und Kontextfenster: Warum Protokolle eine größere Rolle spielen als größere LLMs

Im letzten Jahr hat sich das Rennen um die Erweiterung der LLM-Kontextfenster...

Read More

Wie MCP die KI-gestützte Suche und Entdeckung verbessern kann

In der Ära der generativen KI ist die Suche nicht länger ein...

Read More

Quick Links