Abfrage von Rich Text mit XQuery
Solr und Lucene bieten einen leistungsstarken, skalierbaren Suchserver. XQuery bietet ein umfangreiches Abfrage- und Programmiermodell für die Verwendung mit markiertem Text. Die Sitzung „Querying Rich Text with XQuery“, von Michael SokolovMichael Sokolov, Senior Architect bei Safari Books Online, wird Lux vorstellen, ein System, das diese Funktionen zu einer leistungsstarken XML-Suchmaschine kombiniert und unter einer Open-Source-Lizenz frei verfügbar ist. Abfrageoptimierer geben Datenbankbenutzern oft Rätsel auf: Manchmal laufen Abfragen schnell und manchmal nicht. Ein intuitives Gespür dafür, was in einem Optimierer gut funktioniert, erhält man oft nur durch Versuch und Irrtum, induktive Logik (d.h. fundierte Vermutungen) und manchmal auch durch Opferbereitschaft.
In dieser Sitzung wird ein Teil des Geheimnisses gelüftet, indem die Arbeit am Lux-Optimierer beschrieben wird. Lux optimiert Abfragen, indem es sie in äquivalente (aber in der Regel schnellere) indizierte Abfragen umschreibt. So sind die Ergebnisse für den Benutzer leichter zu verstehen als die abstrakten Abfragepläne, die von einigen Optimierern erzeugt werden. Lucene-basierte QName- und Pfad-Indizes erweisen sich als nützlich, um die Ausführung von XQuery durch Saxon zu beschleunigen. Schließlich werden in dieser Sitzung die Mechanismen beschrieben, die Lux für die Erweiterung von Solr und Lucene einsetzt. Dazu gehören Solr UpdateProcessor, ResponseWriter und QueryComponent Plugins, dynamische Solr Schema-Erweiterungen, benutzerdefinierte XML-aware Analysatoren und Tokenizer.
Diese Sitzung für Fortgeschrittene findet am Mittwoch, den 6. November von 3:40-4:25 Uhr statt. Klicken Sie hier für weitere Details.
Über den Redner:
Michael Sokolov(@msokolov) hat die letzten 14 Jahre mit der Entwicklung komplexer, suchgesteuerter Online-Texte verbracht, darunter oed.com, oxfordscholarship.com, degruyter.com und viele mehr, früher bei iFactory, jetzt als Teil von Safari Books. Er entwarf und implementierte sowohl die Kern-Such-API als auch das Datenverarbeitungs-Framework für die PubFactory-Plattform und setzte sich für die Einführung von Solr/Lucene ein. In letzter Zeit hat er an der Entwicklung von Empfehlungen für Safari Books gearbeitet und seit etwa einem Jahr entwickelt er Lux, die XML-Suchmaschine, die eine XML-Suchfunktion als Plugin für Solr bietet und unter luxdb.org unter einer Open-Source-Lizenz verfügbar ist.
Mehr Details:
- Für weitere Informationen über Lucene/Solr Revolution EU besuchen Sie bitte lucenerevolution.org.
- Für weitere Road to Revolution Beiträge, klicken Sie hier.
- Um die vollständige Agenda der Sitzung einzusehen, klicken Sie hier.
- Um sich für die Konferenz zu registrieren, klicken Sie hier.
- Um die neuesten Nachrichten und Updates zur Konferenz zu erhalten, folgen Sie @LuceneSolrRev auf Twitter.
- Haben Sie eine Frage zur Konferenz? Möchten Sie in die Mailingliste der Konferenz aufgenommen werden? Sind Sie daran interessiert, Revolution zu sponsern? Wenn ja, senden Sie uns bitte eine E-Mail an: info@lucenerevolution.org.
Lucene/Solr Revolution wird präsentiert von Lucidworks, dem kommerziellen Unternehmen für die Open-Source-Suche Apache Lucene/Solr – die Zukunft der Suchtechnologie.