Ein paar Sitzungen, auf die Sie sich bei der Lucene Revolution freuen können

Es ist nur noch eine Woche bis zur Eröffnung der diesjährigen Lucene Revolution und es ist an der Zeit, sich Gedanken darüber zu machen, an welchen Sitzungen Sie teilnehmen möchten. (Es ist auch an der Zeit, sich bei der Community anzumelden und Ihren Kalender einzurichten…) Es ist immer schön, Open Source in großen Unternehmen zu sehen, und es ist gut zu sehen, dass Unternehmen wie Intuit und Travelocity dieses Jahr Sprecher zur Lucene Revolution schicken. Es ist auch faszinierend zu sehen, wie diese Unternehmen die Technologie in die Praxis umsetzen. Um nur ein paar Beispiele zu nennen:

  • Trey Grainger von Careerbuilder.com wird über die Umstellung von Microsoft FAST ESP auf Solr sprechen, die zum Teil aus nichttechnischen Gründen interessant ist. Wie bringen Sie die Firmenchefs dazu, den Umstieg auf Open Source zu wagen, wenn ein 1 %iger Qualitätsverlust bei den Suchergebnissen buchstäblich Millionen von verpassten Gelegenheiten zur Folge hat? (Und wie bringen Sie sie dazu, Geld für die Umstellung auszugeben?) Sie stellen sicher, dass Sie ein System entwickeln, das die Qualität Ihrer Suchergebnisse beibehält (oder verbessert), und Sie nutzen die zusätzlichen Vorteile, das ist der Weg.

    Der bei weitem größte Vorteil [der Migration] ist die Steigerung unserer Flexibilität. CareerBuilder sieht in unserer Fähigkeit, schnell auf Marktanforderungen zu reagieren, einen entscheidenden Wettbewerbsvorteil. Wir sind jetzt in der Lage, mit unserer Solr-Implementierung Dinge in Stunden oder Tagen zu erledigen, für die wir früher Wochen (oder manchmal Monate, wenn wir sie überhaupt erledigen konnten) brauchten. Ein Teil dieser Geschwindigkeitsverbesserung hängt mit den zugrundeliegenden Technologien zusammen, aber ich denke, das meiste hängt mit der verstärkten Konzentration und dem Fachwissen im Bereich der Suche zusammen, die dadurch entstanden sind, dass wir unsere Suchplattform vollständig in die eigenen Hände genommen haben und in der Lage sind, den zugrundeliegenden Code-Stack anzupassen und tief in ihn einzudringen.

    Trey wird darüber sprechen, wie Careerbuilder seine Suchqualität während der Migration beibehalten hat und wie sie eine Cloud-ähnliche API entwickelt haben, mit der ihre Ingenieure Suchanwendungen erstellen und in ihr System integrieren können, ohne etwas über Solr wissen zu müssen.

  • Ich freue mich besonders auf die Präsentation von Alberto Mijares über die Software as a Service von Canoo. Dabei geht es nicht so sehr um den SaaS-Aspekt (obwohl auch der interessant ist), sondern Canoo hat einen Service entwickelt, bei dem Artikel aus verschiedenen Publikationen gesammelt und mit Hilfe der Lucene-Analysepipeline mit semantischen Informationen angereichert werden, um „verwandte“ Artikel empfehlen zu können. „Es ist im Grunde das MoreLikeThis von Lucene, aber auf Steroiden“, sagte er gegenüber DZone. Canoo nutzt Informationen aus externen Quellen, wie z.B. Wikipedia, um den semantischen Reichtum noch weiter zu erhöhen.

    Die Semantik ist ein wirklich komplexes Thema und vor allem subjektiv. Was für mich „Sinn macht“, kann für eine andere Person völlig falsch sein (anderes Wissen, andere Erfahrung, anderer Kontext). Was die meisten Menschen nicht wissen, ist, dass die Technologien des Semantic Web sehr gut funktionieren, wenn sie im Bereich der Datenintegration eingesetzt werden.

    Ich bin auf jeden Fall gespannt, wie sich das alles im Zusammenhang mit Lucene entwickelt.

  • Olaf Zschiedrich, der Leiter der eBay-Kleinanzeigen in Deutschland, wird darüber sprechen, wie das Unternehmen seine Website in nur vier Monaten von Grund auf neu aufbauen konnte, auch weil die Suche bereits von Solr übernommen wurde. Er wird auch einige Best Practices vorstellen, die sie als Nummer eins unter den Kleinanzeigen-Websites in Deutschland gelernt haben.
  • Ein Punkt, der immer wieder auf der Wunschliste der Leute auftaucht, ist die Echtzeitsuche, und Boris Aleksandrovsky von Yammer wird über genau das sprechen.

    Die Informationen auf Yammer sollten indiziert und für die Benutzer in Echtzeit, praktisch in weniger als einer Sekunde, abrufbar sein. Damit ähnelt das Indexierungssystem von Yammer dem von Twitter, wo Tweets in Echtzeit indexiert werden. Die Suchergebnisse sind ebenfalls in umgekehrter chronologischer Reihenfolge verfügbar, wobei davon ausgegangen wird, dass für bestimmte Arten von Ereignissen die Aktualität das wichtigste Merkmal ist. Dies passt sehr gut zu Inhalten wie Nachrichten, deren Relevanz im Laufe der Zeit ziemlich schnell abnimmt, oder zu Inhalten, die eher flüchtiger Natur sind, wie Veranstaltungen und Meetings.

    In Anbetracht des Umfangs des Materials, mit dem Yammer umgeht – das System hat 100.000 Netzwerke, 2 Millionen Benutzer und kann bis zu 1 Milliarde Nachrichten verwalten – ist es gut zu wissen, wie die Architektur strukturiert ist, vor allem, wenn man bedenkt, dass Yammer eine komplexe Wissensdatenbank ist und nicht nur ein einfaches Abfragesystem.

  • Jon Gifford von Loggly wird über die Verwendung von Solr Cloud zur Zähmung einer Indexexplosion sprechen. Loggly arbeitet mit einer riesigen Menge an Daten.

    Unser derzeitiger Indexierungsansatz besteht darin, alle Protokolle als einfachen Text zu behandeln, was schnell und flexibel ist – wir akzeptieren Ereignisse in jedem beliebigen Format. Wir erstellen einen „Index“ pro Kunde und teilen ihn nach Zeit auf. So können wir den Index eines Benutzers so groß werden lassen, wie er ihn braucht.

    Das bedeutet natürlich, dass ihr System mehrere Server benötigt, die alle zusammenarbeiten. Man könnte meinen, dass dies für die meisten Entwickler zu kompliziert ist, aber Solr Cloud ebnet hier wirklich das Spielfeld, und es wird interessant sein, von Jon zu hören, wie das bei Loggly funktioniert.

  • Schließlich habe ich noch ein Video-Interview mit Erik Hatcher über seinen Vortrag auf der Lucene Revolution gefunden. Er wird wieder seinen Vortrag über Rapid Prototyping mit Solr halten, und das Lustige daran ist, dass er jedes Mal etwas anderes macht, wenn er ihn hält. Darüber hinaus wird Erik am Montag und Dienstag einige der Lucene- und Solr-Schulungen durchführen. Und wie oft bekommt man schon die Gelegenheit, von einem der führenden Committer eines solchen Projekts geschult zu werden?

Natürlich sind dies nur einige der angebotenen Sitzungen; Lucene Revolution wird vier Tracks gleichzeitig anbieten.

Sie haben sich noch nicht angemeldet? Einige der Schulungssitzungen sind bereits ausverkauft, aber es sind noch einige Plätze für die Konferenz selbst verfügbar.

You Might Also Like

KI-Agenten dominieren den Einkauf. Ist Ihre Website auf die KI-gestützte Suche vorbereitet?

Generative KI-Agenten wie ChatGPT definieren die Produktsuche neu. Erfahren Sie, wie Sie...

Read More

Vom Suchunternehmen zum praktischen KI-Pionier: Unsere Vision für 2025 und darüber hinaus

CEO Mike Sinoway gibt Einblicke in die Zukunft der KI und stellt...

Read More

Wenn KI schief geht: Fehlschläge in der realen Welt und wie man sie vermeidet

Lassen Sie nicht zu, dass Ihr KI-Chatbot einen 50.000 Dollar teuren Tahoe...

Read More

Quick Links