Wie StubHub die Daten mit Apache Solr löscht
Während der Countdown für die jährliche Lucene/Solr Revolution Konferenz in Austin im Oktober läuft, stellen wir Ihnen Vorträge und Sitzungen aus vergangenen Konferenzen vor. Heute stellen wir Ihnen die Sitzung von StubHub-Ingenieur Neeraj Jain zum Thema De-Dupling in Solr vor.
Stubhub verarbeitet eine große Anzahl von Veranstaltungen und zugehörigen Dokumenten. Die Verwendung von Solr bei Stubhub hat sich von der Suche nach Veranstaltungen/Tickets auf die Aufnahme von Inhalten ausgeweitet. Eine der größten Herausforderungen bei der Aufnahme von Inhalten besteht darin, Duplikate zu erkennen und zu entfernen, ohne die Qualität und Leistung zu beeinträchtigen. Wir stellen eine Lösung vor, die eine räumliche Suche, einen benutzerdefinierten Update-Handler, eine benutzerdefinierte Geodist-Funktion usw. umfasst, um das Problem der Duplikatentfernung zu lösen. In diesem Vortrag werden wir Details zum Design und zur Implementierung der benutzerdefinierten Module und APIs vorstellen und einige der Herausforderungen erörtern, mit denen wir konfrontiert waren und wie wir sie überwunden haben.
Wir werden auch die Vergleichsanalyse zwischen dem alten und dem neuen System zur Deduplizierung vorstellen.
Neeraj Jain ist Ingenieur und arbeitet bei Stubhub Inc. in San Francisco. Er hat ein besonderes Interesse an der Suchdomäne und arbeitet seit über 4 Jahren mit SOLR. Er arbeitet als Freiberufler und hat Anwendungen im Google Play Store und iTunes Store, die mit SOLR entwickelt wurden. Neeraj hat einen Master-Abschluss in Technologie vom Indian Institute of Technology, Kharagpur.
http://www.slideshare.net/lucidworks/deduplication-using-solr-presented-by-neeraj-jain-stub
Mitmachen auf der Lucene/Solr Revolution 2015, der größten Open-Source-Konferenz zum Thema Apache Lucene/Solr vom 13. bis 16. Oktober 2015 in Austin, Texas. Treffen Sie sich mit den Vordenkern, die die Open-Source-Suchtechnologie Lucene/Solr entwickeln und einsetzen, und vernetzen Sie sich mit ihnen. Vollständige Details und Anmeldung…