Benutzerdefinierte Such-Syntax mit Solr, Lucene und Parboiled
In einem kürzlich durchgeführten Projekt mit dem United States Patent and Trademark Office wurde Opensource Connections gebeten, einen Prototyp für die nächste Generation der Patentsuche zu entwickeln – unter Verwendung von Solr und Lucene. Ein wichtiger Aspekt dieses Projekts war die Implementierung von BRS, einer speziellen Suchsyntax, die von Patentprüfern während des Prüfungsverfahrens verwendet wird.
In dieser rasanten Sitzung, John Berryman, Datenarchitekt bei Bloom, von den Erfahrungen von Opensource Connections berichten und beschreiben, wie sie eine Kombination aus Parboiled (einem Parser Expression Grammar [PEG] Parser), Lucene Queries und SpanQueries sowie eine Erweiterung des QParserPlugin von Solr verwendet haben, um BRS-Suchfunktionen in Solr zu erstellen. Zunächst wird er das Problem der Patentsuche charakterisieren und dann die BRS-Syntax selbst definieren. Anschließend stellt er den Parboiled-Parser vor und erörtert verschiedene Überlegungen, die man bei der Entwicklung eines Syntaxparsers anstellen muss. Anschließend wird er die Methodik beschreiben, die zur Implementierung der Suchfunktionalität in Lucene/Solr verwendet wurde. Schließlich wird er einen Überblick über die syntaktischen und semantischen Teststrategien geben.
Die Zuhörer werden diese Sitzung mit einem Verständnis dafür verlassen, wie Solr, Lucene und Parboiled verwendet werden können, um ihren eigenen benutzerdefinierten Suchparser zu implementieren.
Diese Sitzung für Fortgeschrittene findet am Mittwoch, den 6. November von 2:50-3:35 Uhr statt. Klicken Sie hier für weitere Details.
Über den Redner:
Er kommt aus dem Bereich der Luft- und Raumfahrttechnik, John Berryman entdeckte bald, dass sein wahres Interesse an den Schnittpunkten von Informationstechnologie und Unternehmertum (und gegebenenfalls Mathematik) lag. Anfang 2011 gab John Berryman seinen Job auf, um als Softwareberater tätig zu werden. Schließlich fand John eine Festanstellung bei Opensource Connections, wo er derzeit große Unternehmen zu Volltextsuche und Big Data-Anwendungen berät. Zu den bisherigen Höhepunkten gehörten die Entwicklung eines Prototyps für die Zukunft der Suche mit dem US-Patent- und Markenamt, die Implementierung der von Patentprüfern verwendeten Suchsyntax und die Entwicklung eines Frameworks zur Optimierung der Solr-Suchrelevanz namens SolrPanl.
Mehr Details:
- Für weitere Informationen über Lucene/Solr Revolution EU besuchen Sie bitte lucenerevolution.org.
- Für weitere Road to Revolution Beiträge, klicken Sie hier.
- Um die vollständige Agenda der Sitzung einzusehen, klicken Sie hier.
- Um sich für die Konferenz zu registrieren, klicken Sie hier.
- Um die neuesten Nachrichten und Updates zur Konferenz zu erhalten, folgen Sie @LuceneSolrRev auf Twitter.
- Haben Sie eine Frage zur Konferenz? Möchten Sie in die Mailingliste der Konferenz aufgenommen werden? Sind Sie daran interessiert, Revolution zu sponsern? Wenn ja, senden Sie uns bitte eine E-Mail an: info@lucenerevolution.org.
Lucene/Solr Revolution wird präsentiert von Lucidworks, dem kommerziellen Unternehmen für die Open-Source-Suche Apache Lucene/Solr – die Zukunft der Suchtechnologie.