Solr glänzt in der Cloud – Lucidworks Solr auf EC2

Übersicht Lucidworks hat jetzt die neueste Version unserer Lucidworks Suche als eine Amazon Maschinen-Instanz (AMI). Sie ist für jeden mit…

Übersicht

Lucidworks hat jetzt die neueste Version unserer Lucidworks Suche als eine Amazon Maschinen-Instanz (AMI). Sie ist für jeden mit einem Amazon Web Services-Konto und Amazon EC2-Zugang kostenlos verfügbar. In diesem Beitrag erkläre ich Ihnen, worum es sich dabei handelt, was es für Sie tun kann und wie Sie es in Betrieb nehmen können.

Unser kostenloses AMI mit Lucidworks für Solr bietet die folgenden Vorteile:

  1. Ein sehr einfacher Weg, um eine Solr-Instanz zum Laufen zu bringen, für diejenigen, die Solr zum ersten Mal ausprobieren möchten.
  2. Eine einfache Möglichkeit, die von Lucidworks zertifizierte Distribution von Solr zu testen.
  3. Ein praktischer Startpunkt mit einer Maschineninstanz, die von jedem genutzt werden kann, der Solr in der Cloud betreiben möchte.

Das AMI, das wir zur Verfügung gestellt haben, ist eine sehr einfache Solr-Instanz, die die Standard-Beispielkonfigurationsdateien verwendet, die Solr als Ausgangspunkt für neue Benutzer enthält, zusammen mit einer Reihe von neunzehn Dokumenten, die indiziert und für die Suche bereit sind. Wenn Sie daran interessiert sind, Solr-Instanzen in der Cloud zu erstellen, ist dieses AMI ein guter Ausgangspunkt: Bearbeiten Sie einfach die Konfigurationsdateien für Ihre Bedürfnisse, richten Sie persistenten Speicher mit Amazon EBS oder S3 für Ihre Indizes ein, und schon haben Sie eine Maschineninstanz, die für Ihre eigene Verwendung gebündelt und registriert werden kann.

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) ist ein Webservice, der anpassbare Rechenkapazität in der Cloud bereitstellt. Cloud Computing ist eine Möglichkeit, internetbasierte Dienste anzubieten, die manchmal in die folgenden Kategorien eingeteilt werden: Infrastructure-as-a-Service (IaaS), Platform-as-a-Service (PaaS) und Software-as-a-Service (SaaS). Die Dienste werden auf Abruf verkauft, und ein Verbraucher wird für die von ihm genutzten Dienste stundenweise abgerechnet. EC2 ist einer der beliebtesten Cloud Computing-Anbieter.

Für den Betrieb von Lucidworks für Solr auf Amazon EC2 müssen Sie ein Konto bei Amazon Web Services haben und einigermaßen mit der Bereitstellung einer Amazon Machine Instance vertraut sein. Wir beschreiben den Prozess jedoch ausführlich und Schritt für Schritt, damit Sie problemlos loslegen können.

Diese Anleitung geht davon aus, dass Sie bereits mit dem Betrieb von Maschineninstanzen in EC2 vertraut sind. Wir geben Ihnen detaillierte Anweisungen, wie Sie die Lucidworks-Instanz einrichten und zum Laufen bringen, aber dies ist keine Anleitung zur Verwendung von EC2, wenn Sie nicht bereits damit vertraut sind. Wenn Sie noch kein Amazon Web Services-Konto haben und mit EC2 nicht vertraut sind, finden Sie hier einen Link zu einer Einführung in die Nutzung von EC2. Sobald Sie ein Konto haben und mit den EC2-Tools vertraut sind, können Sie mit den nächsten Schritten in diesem Leitfaden fortfahren.

Lucidworks for Solr Version 1.4 ist, wie Sie vielleicht bereits wissen, eine umfassende, getestete und release-stabile zertifizierte Distribution von Apache Solr, die kostenlos erhältlich ist. Lucidworks für Solr bietet:

  • Eine solide Grundlage für Zuverlässigkeit und Konsistenz bei der produktionsgerechten Nutzung von Open Source
  • Schneller und bequemer Zugriff auf die Dokumentation , die Sie benötigen, um bessere Suchanwendungen schneller zu erstellen
  • Schnelle, vereinfachte Einrichtung und Wartung von Solr und seinen Bestandteilen

Der Betrieb von Lucidworks für Solr auf EC2 ist wahrscheinlich der einfachste und schnellste Weg, eine Solr-Instanz zum Laufen zu bringen.

Schritte zur Ausführung von Lucidworks für Solr auf Amazon EC2

OK, lassen Sie uns eine Instanz des Lucidworks for Solr AMI erstellen. Wir zeigen Ihnen, wie Sie dies über die AWS Management Console tun. Sie können auch Elasticfox verwenden, eine Mozilla Firefox-Erweiterung zur Verwaltung Ihres Amazon EC2-Kontos. Wenn Sie bereits Erfahrung mit Elasticfox haben, sind die Schritte ähnlich wie diese und sollten Ihnen vertraut sein.

Anweisungen für die AWS Management-Konsole

Melden Sie sich bei Ihrem AWS-Konto an. Sie sollten sich am Startpunkt der Management-Konsole befinden:

Bevor wir das Lucidworks AMI starten, müssen wir zunächst einige Sicherheitseinstellungen vornehmen, um den Zugriff auf zwei Ports der Instanz zu ermöglichen: 8983 für Solr und 22 für ssh.

Klicken Sie in der AWS Management Console unter dem Abschnitt Netzwerk- und Sicherheitseinstellungen auf den Link „Sicherheitsgruppen“ und auf der Seite Sicherheit auf die Schaltfläche „Sicherheitsgruppe erstellen“ und geben Sie die folgenden Werte ein:

Unten auf der Sicherheitsseite müssen Sie zwei Verbindungsmethoden einrichten und speichern, eine für SSH, die andere eine „Benutzerdefinierte“ Verbindung für den Solr-Port:

Einrichten von Verbindungen

Wir werden diese neue Sicherheitsgruppe verwenden, wenn wir eine Instanz des Lucidworks AMI starten.

Klicken Sie nun auf den Link „AMIs“ unter dem Abschnitt Bilder. Wählen Sie im Dropdown-Feld „Ansicht“ die Option „Öffentliche Images“ und geben Sie in das Eingabefeld „lucidworks“ ein. Sie sollten nun ein Maschinen-Image sehen:

Solr glänzt in der Cloud

Aktivieren Sie das Kontrollkästchen auf der linken Seite und klicken Sie auf die Schaltfläche „Starten“ darüber.

Wählen Sie die Optionen für die Anzahl der Instanzen, die Maschinengröße und die Verfügbarkeitszone. Die Standardeinstellungen sind für den Anfang ausreichend.

Auf der zweiten Seite übernehmen Sie einfach die vorgegebenen Werte:

Auf der dritten Seite wählen Sie Ihre Schlüsselpaare aus, die Sie bereits eingerichtet haben sollten:

Auf der nächsten Seite werden Sie aufgefordert, die zu aktivierenden Sicherheitsgruppen auszuwählen. Wählen Sie die Gruppe solr8983, die wir zuvor konfiguriert haben. Damit werden Verbindungen zu Port 8983 für Solr und Port 22 für ssh zugelassen:

Schließlich werden Sie aufgefordert, Ihre Einstellungen zu überprüfen. Wenn alles gut aussieht, klicken Sie auf die Schaltfläche „Starten“:

Sie sollten eine Bestätigung sehen, dass die Instanz gestartet wird:

Jetzt sollte Ihre Instanz starten. Zurück auf der Hauptseite der AWS Management Console klicken Sie auf den Link „Instances“ im Abschnitt Instances:

AWS Management Console - Anhängige Instanz

Es wird ein paar Minuten dauern, bis die Instanz gestartet ist. Laden Sie die Seite erneut, bis der Status von „ausstehend“ auf „läuft“ wechselt. Sobald der Status anzeigt, dass die Instanz „läuft“, sollten Sie in der Lage sein, sich mit der Solr Admin-Konsole zu verbinden. Dazu müssen Sie den öffentlichen DNS Ihrer Instanz kennen. Wenn das Kontrollkästchen für diese Instanz aktiviert ist, werden unten in der AWS-Verwaltungskonsole einige Zeilen der Statusausgabe angezeigt, die so aussehen:

Verwenden Sie den öffentlichen DNS, um die URL für den Zugriff auf die Solr Admin-Konsole zu erstellen: http://ec2-174-129-150-181.compute-1.amazonaws.com:8983/solr/admin/

Jetzt haben Sie eine Solr-Instanz mit neunzehn Beispieldokumenten im Index in Betrieb genommen. Wenn Sie Solr noch nicht kennen, sollten Sie unbedingt das kostenlose Referenzhandbuch von Lucid Imagination herunterladen, um einen guten Einstieg in Solr zu finden.

Letzter Schritt: Anmeldung bei der Instanz zum Stoppen und Starten von Lucidworks for Solr

Wenn die Instanz nun läuft, möchten Sie vielleicht Änderungen vornehmen, weitere Inhalte indizieren usw. Um diese Aufgaben zu erledigen, müssen Sie sich per SSH in die Maschineninstanz einloggen. Wählen Sie in der AWS Management Console die Maschineninstanz aus und suchen Sie die Liste „Instance Actions“. Wählen Sie in dieser Liste die Option „Verbinden“:

AWS Management Konsole - verbinden

Sie sollten Anweisungen für die Verbindung mit Ihrer Instanz über ssh sehen:

Sobald Sie sich erfolgreich bei der Instanz angemeldet haben, finden Sie das Lucidworks for Solr-Homeverzeichnis hier: /opt/Lucidworks. In diesem Verzeichnis gibt es ein „Start“- und ein „Stop“-Skript, mit denen Sie Solr stoppen und starten können, wenn Sie Änderungen an den Dateien schema.xml oder solrconfig.xml vornehmen. Das Solr-Stammverzeichnis ist /opt/Lucidworks/lucidworks/solr und das Indexverzeichnis ist /opt/Lucidworks/lucidworks/solr/data/index.

Die Instanz ist so konfiguriert, dass sie mit den folgenden Heap-Größeneinstellungen startet: -Xms1g -Xmx3g. Diese Einstellungen werden in dem Tomcat-Startskript vorgenommen, das Lucidworks verwaltet: /opt/Lucidworks/lucidworks/tomcat/bin/catalina.sh

Beachten Sie, dass die Maschineninstanz über keinen dauerhaften Speicher verfügt. Wenn Sie also mit Ihren eigenen Daten arbeiten und Indizes erstellen möchten, die dauerhaft Bestand haben, müssen Sie das Lucidworks AMI als Ausgangspunkt verwenden und dauerhaften Speicher hinzufügen, entweder Amazon EBS oder Amazon S3.

Wir hoffen, dass Sie die Gelegenheit hatten, Solr in der Cloud zu erleben, und dass Sie einige der Grundlagen kennengelernt haben, auf denen Sie aufbauen müssen, um eine verteilte Suche in der Cloud mit Lucidworks für Solr zu implementieren.

You Might Also Like

Vom Suchunternehmen zum praktischen KI-Pionier: Unsere Vision für 2025 und darüber hinaus

CEO Mike Sinoway gibt Einblicke in die Zukunft der KI und stellt...

Read More

Wenn KI schief geht: Fehlschläge in der realen Welt und wie man sie vermeidet

Lassen Sie nicht zu, dass Ihr KI-Chatbot einen 50.000 Dollar teuren Tahoe...

Read More

Lucidworks Kernpakete: Branchenoptimierte KI-Such- und Personalisierungslösungen

Entdecken Sie unsere umfassenden Core Packages, die Analytics Studio, Commerce Studio und...

Read More

Quick Links