Aufbau einer groß angelegten SEO/SEM-Anwendung mit Apache Solr

Verschiedene Designansätze, um Daten schneller aus MySQL zu importieren, sowie Tricks und Techniken zur Verbesserung der Indizierungsleistung.

Während wir den Countdown für die jährliche Lucene/Solr Revolution Konferenz in Austin im Oktober dieses Jahres herunterzählen, stellen wir Ihnen Vorträge und Sitzungen aus vergangenen Konferenzen vor. Heute stellen wir Ihnen die Sitzung von Rahul Jain über die Indizierung großer SEO/SEM-Daten vor. Suchmaschinenoptimierung (SEO) ist der Prozess, der die Sichtbarkeit einer Website oder einer Webseite in den natürlichen oder unbezahlten (organischen) Suchergebnissen einer Suchmaschine beeinflusst, während auf der anderen Seite Suchmaschinenmarketing (SEM) eine Form des Internetmarketings ist, die die Förderung von Websites durch die Erhöhung ihrer Sichtbarkeit in den Suchmaschinenergebnisseiten (SERPs) durch Optimierung und Werbung beinhaltet. Wir arbeiten an der Entwicklung einer SEO/SEM-Anwendung, in der ein Endbenutzer nach einem Schlüsselwort oder einer Domain sucht und innerhalb weniger Sekunden alle Informationen darüber erhält, einschließlich Suchmaschinen-Ranking, CPC/CPM, Suchvolumen, Anzahl der Anzeigen, Details über die Konkurrenz usw. Um über diese Informationen zu verfügen, erhalten wir riesige Webdaten aus verschiedenen Quellen und nach intensiver Verarbeitung sind es bis zu 40 Milliarden Datensätze/Monat in der MySQL-Datenbank mit 4,6 TB komprimierten Indexdaten in Apache Solr. Aufgrund des großen Volumens standen wir bei der Verbesserung der Indizierungsleistung, der Suchlatenz und der Skalierung des Gesamtsystems vor mehreren Herausforderungen. In dieser Sitzung werde ich über unsere verschiedenen Designansätze zum schnelleren Importieren von Daten aus MySQL, Tricks und Techniken zur Verbesserung der Indizierungsleistung, verteilte Suche, DocValues (Lebensretter), Redis und die gesamte Systemarchitektur sprechen.“

Rahul Jain ist ein freiberuflicher Big Data/Search Consultant aus Hyderabad, Indien, wo er Unternehmen bei der Skalierung ihrer Big-Data/Search-Anwendungen hilft. Er hat 7 Jahre Erfahrung in der Entwicklung von Java- und J2EE-basierten verteilten Systemen und 2 Jahre Erfahrung in der Arbeit mit Big Data-Technologien (Apache Hadoop/Spark) und Search/IR-Systemen (Lucene/Solr/Elasticsearch). Zuvor war er bei Aricent Technologies und Wipro Technologies Ltd. in Bangalore tätig, wo er an der Entwicklung mehrerer Produkte arbeitete. Er ist ein gefragter Redner und hat bereits mehrere Vorträge/Präsentationen zu verschiedenen Themen im Bereich Search/IR auf verschiedenen Meetings/Konferenzen gehalten.

http://www.slideshare.net/lucidworks/building-a-large-scale-seo-sem-application-with-apache-solr-rahul-jain

lucenerevolution-avatarMitmachen auf der Lucene/Solr Revolution 2015, der größten Open-Source-Konferenz zum Thema Apache Lucene/Solr vom 13. bis 16. Oktober 2015 in Austin, Texas. Treffen Sie sich mit den Vordenkern, die die Open-Source-Suchtechnologie Lucene/Solr entwickeln und einsetzen, und tauschen Sie sich mit ihnen aus. Alle Details und Anmeldung…

You Might Also Like

B2B-KI-Benchmarkstudie 2025: Was wir in den Schützengräben sehen

Laden Sie die B2B-KI-Benchmark-Highlights 2025 von Lucidworks herunter. Sehen Sie sich die...

Read More

Vom Suchunternehmen zum praktischen KI-Pionier: Unsere Vision für 2025 und darüber hinaus

CEO Mike Sinoway gibt Einblicke in die Zukunft der KI und stellt...

Read More

Wenn KI schief geht: Fehlschläge in der realen Welt und wie man sie vermeidet

Lassen Sie nicht zu, dass Ihr KI-Chatbot einen 50.000 Dollar teuren Tahoe...

Read More

Quick Links