Wie StubHub die Daten mit Apache Solr löscht

Während der Countdown für die jährliche Lucene/Solr Revolution Konferenz in Austin im Oktober läuft, stellen wir Ihnen Vorträge und Sitzungen aus vergangenen Konferenzen vor. Heute stellen wir Ihnen die Sitzung von StubHub-Ingenieur Neeraj Jain zum Thema De-Dupling in Solr vor.

Stubhub verarbeitet eine große Anzahl von Veranstaltungen und zugehörigen Dokumenten. Die Verwendung von Solr bei Stubhub hat sich von der Suche nach Veranstaltungen/Tickets auf die Aufnahme von Inhalten ausgeweitet. Eine der größten Herausforderungen bei der Aufnahme von Inhalten besteht darin, Duplikate zu erkennen und zu entfernen, ohne die Qualität und Leistung zu beeinträchtigen. Wir stellen eine Lösung vor, die eine räumliche Suche, einen benutzerdefinierten Update-Handler, eine benutzerdefinierte Geodist-Funktion usw. umfasst, um das Problem der Duplikatentfernung zu lösen. In diesem Vortrag werden wir Details zum Design und zur Implementierung der benutzerdefinierten Module und APIs vorstellen und einige der Herausforderungen erörtern, mit denen wir konfrontiert waren und wie wir sie überwunden haben.
Wir werden auch die Vergleichsanalyse zwischen dem alten und dem neuen System zur Deduplizierung vorstellen.

Neeraj Jain ist Ingenieur und arbeitet bei Stubhub Inc. in San Francisco. Er hat ein besonderes Interesse an der Suchdomäne und arbeitet seit über 4 Jahren mit SOLR. Er arbeitet als Freiberufler und hat Anwendungen im Google Play Store und iTunes Store, die mit SOLR entwickelt wurden. Neeraj hat einen Master-Abschluss in Technologie vom Indian Institute of Technology, Kharagpur.

http://www.slideshare.net/lucidworks/deduplication-using-solr-presented-by-neeraj-jain-stub

lucenerevolution-avatarMitmachen auf der Lucene/Solr Revolution 2015, der größten Open-Source-Konferenz zum Thema Apache Lucene/Solr vom 13. bis 16. Oktober 2015 in Austin, Texas. Treffen Sie sich mit den Vordenkern, die die Open-Source-Suchtechnologie Lucene/Solr entwickeln und einsetzen, und vernetzen Sie sich mit ihnen. Vollständige Details und Anmeldung…

You Might Also Like

KI-Agenten dominieren den Einkauf. Ist Ihre Website auf die KI-gestützte Suche vorbereitet?

Generative KI-Agenten wie ChatGPT definieren die Produktsuche neu. Erfahren Sie, wie Sie...

Read More

Vom Suchunternehmen zum praktischen KI-Pionier: Unsere Vision für 2025 und darüber hinaus

CEO Mike Sinoway gibt Einblicke in die Zukunft der KI und stellt...

Read More

Wenn KI schief geht: Fehlschläge in der realen Welt und wie man sie vermeidet

Lassen Sie nicht zu, dass Ihr KI-Chatbot einen 50.000 Dollar teuren Tahoe...

Read More

Quick Links