Aufbau einer groß angelegten SEO/SEM-Anwendung mit Apache Solr
Verschiedene Designansätze, um Daten schneller aus MySQL zu importieren, sowie Tricks und Techniken zur Verbesserung der Indizierungsleistung.
Während wir den Countdown für die jährliche Lucene/Solr Revolution Konferenz in Austin im Oktober dieses Jahres herunterzählen, stellen wir Ihnen Vorträge und Sitzungen aus vergangenen Konferenzen vor. Heute stellen wir Ihnen die Sitzung von Rahul Jain über die Indizierung großer SEO/SEM-Daten vor. Suchmaschinenoptimierung (SEO) ist der Prozess, der die Sichtbarkeit einer Website oder einer Webseite in den natürlichen oder unbezahlten (organischen) Suchergebnissen einer Suchmaschine beeinflusst, während auf der anderen Seite Suchmaschinenmarketing (SEM) eine Form des Internetmarketings ist, die die Förderung von Websites durch die Erhöhung ihrer Sichtbarkeit in den Suchmaschinenergebnisseiten (SERPs) durch Optimierung und Werbung beinhaltet. Wir arbeiten an der Entwicklung einer SEO/SEM-Anwendung, in der ein Endbenutzer nach einem Schlüsselwort oder einer Domain sucht und innerhalb weniger Sekunden alle Informationen darüber erhält, einschließlich Suchmaschinen-Ranking, CPC/CPM, Suchvolumen, Anzahl der Anzeigen, Details über die Konkurrenz usw. Um über diese Informationen zu verfügen, erhalten wir riesige Webdaten aus verschiedenen Quellen und nach intensiver Verarbeitung sind es bis zu 40 Milliarden Datensätze/Monat in der MySQL-Datenbank mit 4,6 TB komprimierten Indexdaten in Apache Solr. Aufgrund des großen Volumens standen wir bei der Verbesserung der Indizierungsleistung, der Suchlatenz und der Skalierung des Gesamtsystems vor mehreren Herausforderungen. In dieser Sitzung werde ich über unsere verschiedenen Designansätze zum schnelleren Importieren von Daten aus MySQL, Tricks und Techniken zur Verbesserung der Indizierungsleistung, verteilte Suche, DocValues (Lebensretter), Redis und die gesamte Systemarchitektur sprechen.“
Rahul Jain ist ein freiberuflicher Big Data/Search Consultant aus Hyderabad, Indien, wo er Unternehmen bei der Skalierung ihrer Big-Data/Search-Anwendungen hilft. Er hat 7 Jahre Erfahrung in der Entwicklung von Java- und J2EE-basierten verteilten Systemen und 2 Jahre Erfahrung in der Arbeit mit Big Data-Technologien (Apache Hadoop/Spark) und Search/IR-Systemen (Lucene/Solr/Elasticsearch). Zuvor war er bei Aricent Technologies und Wipro Technologies Ltd. in Bangalore tätig, wo er an der Entwicklung mehrerer Produkte arbeitete. Er ist ein gefragter Redner und hat bereits mehrere Vorträge/Präsentationen zu verschiedenen Themen im Bereich Search/IR auf verschiedenen Meetings/Konferenzen gehalten.
http://www.slideshare.net/lucidworks/building-a-large-scale-seo-sem-application-with-apache-solr-rahul-jain
Mitmachen auf der Lucene/Solr Revolution 2015, der größten Open-Source-Konferenz zum Thema Apache Lucene/Solr vom 13. bis 16. Oktober 2015 in Austin, Texas. Treffen Sie sich mit den Vordenkern, die die Open-Source-Suchtechnologie Lucene/Solr entwickeln und einsetzen, und tauschen Sie sich mit ihnen aus. Alle Details und Anmeldung…