Aufbau einer groß angelegten SEO/SEM-Anwendung mit Apache Solr

Während wir den Countdown für die jährliche Lucene/Solr Revolution Konferenz in Austin im Oktober dieses Jahres herunterzählen, stellen wir Ihnen Vorträge und Sitzungen aus vergangenen Konferenzen vor. Heute stellen wir Ihnen die Sitzung von Rahul Jain über die Indizierung großer SEO/SEM-Daten vor. Suchmaschinenoptimierung (SEO) ist der Prozess, der die Sichtbarkeit einer Website oder einer Webseite in den natürlichen oder unbezahlten (organischen) Suchergebnissen einer Suchmaschine beeinflusst, während auf der anderen Seite Suchmaschinenmarketing (SEM) eine Form des Internetmarketings ist, die die Förderung von Websites durch die Erhöhung ihrer Sichtbarkeit in den Suchmaschinenergebnisseiten (SERPs) durch Optimierung und Werbung beinhaltet. Wir arbeiten an der Entwicklung einer SEO/SEM-Anwendung, in der ein Endbenutzer nach einem Schlüsselwort oder einer Domain sucht und innerhalb weniger Sekunden alle Informationen darüber erhält, einschließlich Suchmaschinen-Ranking, CPC/CPM, Suchvolumen, Anzahl der Anzeigen, Details über die Konkurrenz usw. Um über diese Informationen zu verfügen, erhalten wir riesige Webdaten aus verschiedenen Quellen und nach intensiver Verarbeitung sind es bis zu 40 Milliarden Datensätze/Monat in der MySQL-Datenbank mit 4,6 TB komprimierten Indexdaten in Apache Solr. Aufgrund des großen Volumens standen wir bei der Verbesserung der Indizierungsleistung, der Suchlatenz und der Skalierung des Gesamtsystems vor mehreren Herausforderungen. In dieser Sitzung werde ich über unsere verschiedenen Designansätze zum schnelleren Importieren von Daten aus MySQL, Tricks und Techniken zur Verbesserung der Indizierungsleistung, verteilte Suche, DocValues (Lebensretter), Redis und die gesamte Systemarchitektur sprechen.“

Rahul Jain ist ein freiberuflicher Big Data/Search Consultant aus Hyderabad, Indien, wo er Unternehmen bei der Skalierung ihrer Big-Data/Search-Anwendungen hilft. Er hat 7 Jahre Erfahrung in der Entwicklung von Java- und J2EE-basierten verteilten Systemen und 2 Jahre Erfahrung in der Arbeit mit Big Data-Technologien (Apache Hadoop/Spark) und Search/IR-Systemen (Lucene/Solr/Elasticsearch). Zuvor war er bei Aricent Technologies und Wipro Technologies Ltd. in Bangalore tätig, wo er an der Entwicklung mehrerer Produkte arbeitete. Er ist ein gefragter Redner und hat bereits mehrere Vorträge/Präsentationen zu verschiedenen Themen im Bereich Search/IR auf verschiedenen Meetings/Konferenzen gehalten.

http://www.slideshare.net/lucidworks/building-a-large-scale-seo-sem-application-with-apache-solr-rahul-jain

lucenerevolution-avatarMitmachen auf der Lucene/Solr Revolution 2015, der größten Open-Source-Konferenz zum Thema Apache Lucene/Solr vom 13. bis 16. Oktober 2015 in Austin, Texas. Treffen Sie sich mit den Vordenkern, die die Open-Source-Suchtechnologie Lucene/Solr entwickeln und einsetzen, und tauschen Sie sich mit ihnen aus. Alle Details und Anmeldung…

You Might Also Like

Jenseits der Ladenfront: Wie ACP die Rolle des Händlers erweitert

Seit Jahrzehnten dreht sich das Merchandising um eine einfache Frage: Wie findet...

Read More

Neue Umfrage: 67% der Käufer wollen, dass KI Produkte erklärt, nicht kauft

Verbraucherzentrierte Daten zeigen, dass Kunden nicht wollen, dass die KI für sie...

Read More

Die 5 wichtigsten Anwendungsfälle für ACP im B2B-Handel

Der Aufstieg des agentenbasierten Handels eröffnet B2B-Unternehmen ganz neue Möglichkeiten.

Read More

Quick Links