Verteilte Indizierung von Solr bei WalmartLabs
Während der Countdown für die jährliche Lucene/Solr Revolution Konferenz in Boston im Oktober läuft, heben wir Vorträge und Sitzungen von vergangenen Konferenzen hervor. Heute stellen wir Ihnen den Vortrag von Shenghua Wan vor: „Solr Distributed Indexing at WalmartLabs“.
Als Einzelhandelsriese stellt Walmart über seine E-Commerce-Websites Millionen von Artikelinformationen zur Verfügung, und die Zahl wächst schnell. Dies erfordert Big Data-Technologien zur Indizierung der Dokumente. Das Map-Reduce-Framework ist eine skalierbare und hochverfügbare Basis, auf der die verteilte Indizierung aufgebaut werden kann. Das ursprüngliche Solr verfügt zwar über ein Map-Reduce-Index-Tool, aber es gibt einige Hindernisse, die es nicht in der Lage machen, den Anwendungsfall von Walmart einfach und effizient zu bewältigen. In dieser Fallstudie zeigt Shenghua, wie Sie Ihr eigenes Tool für die verteilte Indizierung aufbauen und die Leistung optimieren können, indem Sie die Indizierungsphase zu einem reinen Map-Job machen, bevor die Daten zusammengeführt werden.
Shenghua Wan ist ein Senior Software Engineer im Polaris Search Team bei WalmartLabs. Sein Schwerpunkt liegt auf der Anwendung von Big Data-Technologien zur Verarbeitung umfangreicher Produktinformationen, die online gesucht werden sollen.
http://www.slideshare.net/lucidworks/solr-distributed-indexing-in-walmartlabs-presented-by-shengua-wan-walmartlabs
Mitmachen auf der Lucene/Solr Revolution 2016, der größten Open-Source-Konferenz zum Thema Apache Lucene/Solr vom 11. bis 14. Oktober 2016 in Boston, Massachusetts. Treffen Sie sich mit den Vordenkern, die die Open-Source-Suchtechnologie Lucene/Solr entwickeln und einsetzen, und vernetzen Sie sich mit ihnen. Alle Details und Anmeldung…