Apache Solr 1.5 auf dem Vormarsch mit mehr „Funktionalität“

Der Lack von Apache Solr 1.4 ist kaum trocken und die Community arbeitet bereits an Solr 1.5 (das eigentlich Solr…

Der Lack von Apache Solr 1.4 ist kaum trocken und die Community arbeitet bereits an Solr 1.5 (das eigentlich Solr 2.0 sein könnte, aber nennen wir es vorerst 1.5).

Auf ein paar Dinge bin ich besonders gespannt:

  1. Massive Skalierbarkeit durch verteilte Suche, Indizierung und Shard-Management – Bis jetzt skaliert Solr bei der Suche ziemlich gut (ich habe Instanzen mit mehr als einer Milliarde Dokumenten gesehen und wir haben auch Benchmarks auf diesem Niveau durchgeführt), aber die Arbeit an Solr 1.5 wird dank der Integration von Apache ZooKeeper und anderen verteilten Technologien eine ganz neue Ebene erreichen. Wenn Sie daran interessiert sind, sehen Sie sich den „Cloud“-Zweig in SVN an.
  2. Funktionen, Funktionen, Funktionen! Wir haben bereits eine ganze Reihe von Funktionen hinzugefügt (siehe meinen früheren Beitrag) und ich sehe weitere am Horizont. Darüber hinaus sehe ich einen großen Wert darin, dass wir (in Ermangelung eines besseren Ausdrucks) Aggregationsfunktionen in den Mix aufnehmen (über SOLR-1622). Damit können Anwendungsentwickler viel anspruchsvollere mathematische Berechnungen in einer Suchergebnismenge durchführen, als dies derzeit über die StatsComponent möglich ist. In gewisser Weise kann dies sowohl Business Intelligence-Anwendungen auf der Grundlage von Solr (ich weiß, dass dies nur ein kleiner Teil des BI-Kuchens ist) als auch anspruchsvollere mathematische Anwendungen ermöglichen.
  3. Räumliche Suche! Es ist schon komisch, viele Leute wollen eine räumliche Suche und Solr hätte einfach ein wirklich schönes bestehendes Paket (LocalSolr) nutzen können, so wie es viele bereits tun. Aber wenn Sie einen Schritt zurücktreten und die räumliche Suche im Kontext des größeren Bildes der Dinge betrachten (siehe SOLR-773), die in Solr wünschenswert wären, wird die Community nicht nur in der Lage sein, eine räumliche Suche zu implementieren (indem sie wichtige Teile von LocalSolr nutzt, wo es angebracht ist), sondern sie wird auch eine ganze Reihe anderer Funktionen erhalten, darunter:
    1. Nach Funktion sortieren – Warum sollten Sie Solr-Benutzern nicht die Möglichkeit geben, nach einer beliebigen Funktion zu sortieren, anstatt nur nach der Entfernung zu sortieren? Ich habe dies gerade heute Abend über SOLR-1297 umgesetzt.
    2. „Poly“-Feldtypen – Dank SOLR-1131 kann der FieldType-Mechanismus von Solr verwendet werden, um mehrere zugrunde liegende Felder darzustellen. Dies ist besonders nützlich für die Darstellung von Dingen wie Punkten in einem n-dimensionalen Raum, kartesischen Ebenen (Zoomstufen) und anderen coolen Dingen. Außerdem zeigt es, welche Arten von Abstraktionen Solr über das bereits leistungsstarke Apache Lucene legen kann, um noch mehr Funktionalität zu bieten.
    3. Facette nach Funktion – Sicher, es ist toll, Ihre Entfernungen in Bereiche zu legen, aber warum nicht auch das Ergebnis jeder Funktion in Bereiche legen? Siehe SOLR-1581.
    4. Spatial Query Parsers – auch bekannt als Geokodierung – analysieren Dinge wie Straßenadressen usw. und geben entsprechende Abfrageinstanzen zurück. Siehe SOLR-1568 und SOLR-1578.
    5. Mehrere verschiedene Distanzfunktionen, einschließlich Haversinus (Großkreis), Manhattan, Euklidisch (Solr unterstützt jetzt alle p-Normen als Distanzfunktionen.) Siehe SOLR-1302. Ich habe sogar die Möglichkeit hinzugefügt, String-Distanzberechnungen unter Verwendung von Levenstein (edit), Jaro-Winkler, n-gram (im Grunde alle Distanzmaße der Lucene-Rechtschreibprüfung) sowie jede benutzerdefinierte String-Distanzberechnung durchzuführen.
    6. „Pseudo“-Felder – Anstatt nur die Möglichkeit zu hacken, eine Entfernungsberechnung in das Ergebnis einzubauen, warum sollten Sie der Antwort nicht erlauben, „Felder“ auf der Grundlage von Funktionen oder anderen benutzerdefinierten Werten auszugeben? Siehe SOLR-1298.
  4. Field Collapsing – Ich hatte noch keine Zeit, daran zu arbeiten, aber ich vermute, Field Collapsing wird es endlich in 1.5 schaffen. Field Collapsing ermöglicht es Solr, ähnliche Ergebnisse „aufzurollen“, ähnlich wie Sie es auf vielen Internet-Such-Websites sehen, die Ergebnisse aus derselben Domain einrücken.
  5. Unterstützung für Payloads und Span Query – Solr kann schon seit einiger Zeit Payloads indizieren, aber der Benutzer muss immer noch seinen eigenen Query Parser einbinden. Es wäre auch sehr schön, Funktionen zu sehen, die auch mit Payloads arbeiten können. Siehe SOLR-1337 und SOLR-1485.

Wie ich immer zu sagen pflege: „Bei Open Source weiß man nie, woher die nächste gute Idee kommt“. Ich vertraue also voll und ganz darauf, dass die Solr-Community eine Fülle weiterer großartiger neuer Funktionen sowie die üblichen Fehlerbehebungen usw. entwickeln wird.

You Might Also Like

Vom Suchunternehmen zum praktischen KI-Pionier: Unsere Vision für 2025 und darüber hinaus

CEO Mike Sinoway gibt Einblicke in die Zukunft der KI und stellt...

Read More

Wenn KI schief geht: Fehlschläge in der realen Welt und wie man sie vermeidet

Lassen Sie nicht zu, dass Ihr KI-Chatbot einen 50.000 Dollar teuren Tahoe...

Read More

Lucidworks Kernpakete: Branchenoptimierte KI-Such- und Personalisierungslösungen

Entdecken Sie unsere umfassenden Core Packages, die Analytics Studio, Commerce Studio und...

Read More

Quick Links