Lernen Sie Lucene… tiefer
Sie verwenden Solr oder eine andere Lucene-basierte Suchlösung, … oder Sie sollten und werden es tun! Sie bauen (oder werden)…
Sie verwenden Solr oder eine andere Lucene-basierte Suchlösung, … oder Sie sollten und werden es tun! Sie bauen (oder werden) Ihre Lösungen auf einer erstklassigen Suchbibliothek auf, Apache Lucene.
Solr macht die Verwendung von Lucene einfacher – Sie können eine Vielzahl von Datenquellen ganz einfach indizieren, sozusagen „out of the box“, und Sie können ganz einfach Funktionen wie Facettierung, Hervorhebung und Rechtschreibprüfung integrieren – und das alles ohne Java-Code zu schreiben. Und wenn das alles ist, was Sie brauchen und es für Sie solide funktioniert, dann ist das großartig! Sie können jetzt aufhören zu lesen und einen unserer anderen hervorragenden Schulungskurse besuchen, die Ihren Bedürfnissen entsprechen. Aber wenn Sie ein Tüftler sind und wissen wollen, was Solr zum Strahlen bringt, oder wenn Sie eine neue oder verbesserte Funktion benötigen, lesen Sie weiter…
In der Tiefe arbeitet Lucene auf Hochtouren – es analysiert, puffert und indiziert Ihre Dokumente, führt Segmente zusammen, parst Abfragen, speichert Datenstrukturen im Cache, hüpft schnell durch einen invertierten Index, berechnet Bewertungen, navigiert durch endliche Zustandsautomaten und vieles mehr.
Wie können Sie also Lucene tiefergehend lernen? Sie können mit unserer DZone-Referenzkarte „Lucene verstehen“ beginnen. Und vergessen Sie nicht Lucene in Action, die ausgefeilteste, detaillierteste und am besten ausgearbeitete Dokumentation, die es zur Lucene-Bibliothek gibt. Und natürlich gibt es die unglaublich lebendige und hilfsbereite Lucene Open Source Community. Diese Ressourcen werden Ihnen gute Dienste leisten, aber es gibt keinen Ersatz für ein interaktives, persönliches Live-Training, das Sie schnell auf den neuesten Stand der Best Practices bringt.
Ich bin gerade dabei, unseren Lucene-Schulungskurs zu überarbeiten, den ich nächsten Monat persönlich auf der Lucene EuroCon 2011 in Barcelona abhalten werde. Dieser neue und verbesserte Kurs verfolgt einen aktivitätsbasierten Ansatz, um die Lucene-API zu erlernen und zu nutzen. Er beginnt mit den üblichen Aufgaben bei der Erstellung von Lösungen mit Lucene, unabhängig davon, ob Sie direkt auf die Lucene-API zugreifen oder eigene Komponenten für Solr schreiben.
Ein Bereich, den ich besonders gerne unterrichte, ist das „Query Parsing“, der Prozess, bei dem eine Suchanfrage eines Benutzers (oder einer Maschine) in eine entsprechende Lucene Query Objektinstanz umgewandelt wird. Viele Leute, die mit Lucene entwickeln, sind mit dem QueryParser von Lucene vertraut. Aber wussten Sie, dass es noch ein paar andere QueryParser mit besonderen Fähigkeiten gibt? Da gibt es den Surround Query Parser, der ausgeklügelte Proximity SpanQuery-Klauseln ermöglicht. Und es gibt den geheimnisvollen „XML Query Parser“ (lassen Sie sich von dem hässlich klingenden Namen nicht abschrecken), der dynamische Abfrageparameter, die z.B. aus einer „erweiterten Suche“ stammen, in eine baumstrukturierte Abfragevorlage einfügt. Weitere Einblicke in die Welt der Lucene-Abfrageparser erhalten Sie in dem Blogbeitrag „Exploring Query Parsers“.
Was ist mit all den Lucene Contrib-Modulen, die in den Lucene 3.x-Versionen aktiv sind? Hier eine kleine Auswahl: bessere Unicode-Behandlung mit den ICU-Tokenizern und -Filtern, verbessertes Stemming und viele andere Analyseverbesserungen, Feldgruppierung/Kollabierung und Block-Join/Abfrage zur Behandlung bestimmter Eltern/Kind-Beziehungen.
Lernen Sie auf der Lucene EuroCon das Neueste über die erstaunliche Lucene-Bibliothek! Sie, Ihr Chef und Ihre Projekte werden es Ihnen danken.