Aufbau einer groß angelegten SEO/SEM-Anwendung mit Apache Solr

Während wir den Countdown für die jährliche Lucene/Solr Revolution Konferenz in Austin im Oktober dieses Jahres herunterzählen, stellen wir Ihnen Vorträge und Sitzungen aus vergangenen Konferenzen vor. Heute stellen wir Ihnen die Sitzung von Rahul Jain über die Indizierung großer SEO/SEM-Daten vor. Suchmaschinenoptimierung (SEO) ist der Prozess, der die Sichtbarkeit einer Website oder einer Webseite in den natürlichen oder unbezahlten (organischen) Suchergebnissen einer Suchmaschine beeinflusst, während auf der anderen Seite Suchmaschinenmarketing (SEM) eine Form des Internetmarketings ist, die die Förderung von Websites durch die Erhöhung ihrer Sichtbarkeit in den Suchmaschinenergebnisseiten (SERPs) durch Optimierung und Werbung beinhaltet. Wir arbeiten an der Entwicklung einer SEO/SEM-Anwendung, in der ein Endbenutzer nach einem Schlüsselwort oder einer Domain sucht und innerhalb weniger Sekunden alle Informationen darüber erhält, einschließlich Suchmaschinen-Ranking, CPC/CPM, Suchvolumen, Anzahl der Anzeigen, Details über die Konkurrenz usw. Um über diese Informationen zu verfügen, erhalten wir riesige Webdaten aus verschiedenen Quellen und nach intensiver Verarbeitung sind es bis zu 40 Milliarden Datensätze/Monat in der MySQL-Datenbank mit 4,6 TB komprimierten Indexdaten in Apache Solr. Aufgrund des großen Volumens standen wir bei der Verbesserung der Indizierungsleistung, der Suchlatenz und der Skalierung des Gesamtsystems vor mehreren Herausforderungen. In dieser Sitzung werde ich über unsere verschiedenen Designansätze zum schnelleren Importieren von Daten aus MySQL, Tricks und Techniken zur Verbesserung der Indizierungsleistung, verteilte Suche, DocValues (Lebensretter), Redis und die gesamte Systemarchitektur sprechen.“

Rahul Jain ist ein freiberuflicher Big Data/Search Consultant aus Hyderabad, Indien, wo er Unternehmen bei der Skalierung ihrer Big-Data/Search-Anwendungen hilft. Er hat 7 Jahre Erfahrung in der Entwicklung von Java- und J2EE-basierten verteilten Systemen und 2 Jahre Erfahrung in der Arbeit mit Big Data-Technologien (Apache Hadoop/Spark) und Search/IR-Systemen (Lucene/Solr/Elasticsearch). Zuvor war er bei Aricent Technologies und Wipro Technologies Ltd. in Bangalore tätig, wo er an der Entwicklung mehrerer Produkte arbeitete. Er ist ein gefragter Redner und hat bereits mehrere Vorträge/Präsentationen zu verschiedenen Themen im Bereich Search/IR auf verschiedenen Meetings/Konferenzen gehalten.

http://www.slideshare.net/lucidworks/building-a-large-scale-seo-sem-application-with-apache-solr-rahul-jain

lucenerevolution-avatarMitmachen auf der Lucene/Solr Revolution 2015, der größten Open-Source-Konferenz zum Thema Apache Lucene/Solr vom 13. bis 16. Oktober 2015 in Austin, Texas. Treffen Sie sich mit den Vordenkern, die die Open-Source-Suchtechnologie Lucene/Solr entwickeln und einsetzen, und tauschen Sie sich mit ihnen aus. Alle Details und Anmeldung…

You Might Also Like

Der Stand der generativen KI in der globalen Wirtschaft: 2025 Benchmark Report, Dawn of the Agentic AI Era

Die erste Studie, die autonome KI-Agenten einsetzt, um die KI-Fähigkeiten von über...

Read More

KI-Benchmark-Bericht 2025: Ranglisten und Diagramme zu KI-Fähigkeiten nach Branchen

Die erste Studie, die autonome KI-Agenten einsetzt, um die KI-Fähigkeiten von über...

Read More

Wie ein Elektronikriese Ingenieure dort trifft, wo sie sind – mit 44 Millionen Produkten im Katalog

Lernen Sie Mohammad Mahboob kennen: Ein Direktor der Suchplattform, der 44 Millionen...

Read More

Quick Links