Die Galene-Sucharchitektur von LinkedIn basiert auf Apache Lucene
Wie LinkedIn-Ingenieure ihre Sucharchitektur für das riesige soziale Netzwerk betreiben.
Während wir den Countdown für die jährliche Lucene/Solr Revolution Konferenz in Austin im Oktober dieses Jahres laufen lassen, heben wir Vorträge und Sitzungen von vergangenen Konferenzen hervor. Heute stellen wir Ihnen die Sitzung der LinkedIn-Ingenieure Diego Buthay und Sriram Sankar vor, in der sie erklären, wie sie ihre Sucharchitektur für das riesige soziale Netzwerk betreiben.
Der LinkedIn-Korpus ist ein reich strukturierter professioneller Graph, der mehr als 300 Millionen Personen, mehr als 3 Millionen Unternehmen, mehr als 2 Millionen Gruppen und mehr als 1,5 Millionen Publisher umfasst. Mitglieder führen Milliarden von Suchanfragen durch, und jede dieser Suchanfragen ist hochgradig personalisiert, basierend auf der Identität des Suchenden und seinen Beziehungen zu anderen professionellen Entitäten im wirtschaftlichen Graphen von LinkedIn. Und all diese Daten sind ständig im Fluss, da LinkedIn jede Sekunde mehr als 2 Mitglieder in über 200 Ländern (2/3 davon außerhalb der USA) hinzufügt. Aus diesem Grund haben wir ein System entwickelt, das sich von anderen Suchanwendungen deutlich unterscheidet. In diesem Vortrag werden wir einige der einzigartigen Systemherausforderungen erörtern, mit denen wir bei der Bereitstellung einer hochgradig personalisierten Suche über halbstrukturierte Daten in großem Umfang konfrontiert waren.“
Diego („Mono“) Buthay ist Staff Engineer bei LinkedIn, wo er an der Back-End-Infrastruktur für alle Suchprodukte von LinkedIn arbeitet. Davor baute er die Search-as-a-Service-Plattform bei IndexTank auf, das LinkedIn 2011 übernommen hatte. Er hat einen BS- und MS-Abschluss in Computer Software Engineering von der Universität Buenos Aires. Sriram Sankar ist Principal Staff Engineer bei LinkedIn, wo er die Entwicklung der Sucharchitektur der nächsten Generation leitet. Davor leitete er die Bemühungen von Facebook um die Suchqualität für Graph Search und war maßgeblich an der Entwicklung von Unicorn beteiligt. Zuvor arbeitete er bei Google an der Suchqualität und der Anzeigeninfrastruktur. Er ist auch der Autor von JavaCC, einem führenden Parsergenerator für Java. Sriram hat einen Doktortitel von der Stanford University und einen BS vom IIT Kanpur.“
http://www.slideshare.net/lucidworks/galene-linkedins-search-architecture-presented-by-diego-buthay-sriram-sankar-linkedin
Mitmachen auf der Lucene/Solr Revolution 2015, der größten Open-Source-Konferenz zum Thema Apache Lucene/Solr vom 13. bis 16. Oktober 2015 in Austin, Texas. Treffen Sie sich mit den Vordenkern, die die Open-Source-Suchtechnologie Lucene/Solr entwickeln und einsetzen, und tauschen Sie sich mit ihnen aus. Alle Details und Anmeldung…