Supersize Apache Superset mit Lucidworks Fusion – Teil 2
Wenn Sie den ersten Beitrag dieser Serie noch nicht gelesen haben, springen Sie zu Supersize Apache Superset With Lucidworks Fusion…
Wenn Sie den ersten Beitrag dieser Serie noch nicht gelesen haben, springen Sie zu Supersize Apache Superset With Lucidworks Fusion – Part 1.
Es gibt viele Herausforderungen, auf die Benutzer stoßen, wenn sie versuchen, Software auf ihren Rechnern zu entwickeln. Ich finde es zwar immer noch hilfreich, an einigen Anwendungen lokal zu arbeiten, aber es spart Zeit, Software auf einer Plattform zu verwenden, die der Produktionsplattform ähnelt.
Mit Lucidworks Labs können Sie eine App starten, die bereits Daten für Restaurants in Sacramento enthält. Sie müssen lediglich den Index-Workflow ausführen (eine Datenquelle hinzufügen und crawlen) und schon werden die Daten umgewandelt und in eine Fusion-Sammlung zur Verwendung mit Superset geladen.
Sie benötigen einen GitHub-Link, um einen Stream zu starten.
Klicken Sie unter diesem Link auf „Instanz erstellen“ und wählen Sie „Superset“.
Sobald Fusion eingerichtet ist, besuchen Sie die im Dashboard angegebene URL. Dort können Sie sich auch mit dem dort angegebenen Benutzernamen und Passwort anmelden. Sobald Sie eingeloggt sind, sehen Sie eine bereits vorinstallierte App und eine App mit der Option, eine neue App zu erstellen/zu importieren. Klicken Sie auf das Feld Sacramento Geospatial auf der linken Seite, um die App zu öffnen.
Um sich mit Superset zu verbinden, besuchen Sie die IP Ihrer Fusion-Anwendung und den Port 8088. Zum Beispiel:
http://35.203.178.8:8088/
# Beachten Sie, dass dies keine echte Domäne ist. Es ist ein Beispiel.
Der Benutzername ist admin und das Passwort ist superset.
Als nächstes verbinden Sie Superset mit Ihrer Fusion-App. Sobald Sie sich authentifiziert haben, klicken Sie in der oberen Navigationsleiste auf „Quellen“ und dann auf „Datenbanken“ (Quellen > Datenbanken). Fügen Sie den Namen GeospatialFusion hinzu. Fügen Sie dann eine Verbindungszeichenfolge hinzu.
Hier ist die Struktur des Verbindungsstrings:
hive://admin:<password>@<Internal IP>:8768/default;transportMode=binary?auth=CUSTOM
Die interne IP finden Sie in Ihrem Instanz-Dashboard. Um Ihre interne IP zu finden, klicken Sie auf die Registerkarte „Konsolenprotokoll“, um Ihre Dashboard-Ansicht zu ändern. Suchen Sie dann auf der Seite nach ens4 | True
. Die darauf folgende IP ist diejenige, die Sie für den Wert der Internen IP verwenden müssen. Klicken Sie dann auf „Speichern“.
Um eine Tabelle hinzuzufügen, klicken Sie in der oberen Navigationsleiste auf „Quellen“ und dann auf „Tabellen“ (Quellen > Tabellen). Unten finden Sie die Einstellungen für die Tabellen.
Databases: GeospatialFusion Schema: default Tables: sacramento_geospatial
Klicken Sie auf „Speichern“.
Erstellen eines einfachen Kreisdiagramms mit den Beispieldaten
Lassen Sie uns schnell ein Tortendiagramm erstellen, das den Anteil der Restaurants nach Städten in der Sacramento Metro Region darstellt. Klicken Sie dazu auf „Diagramme“ in der oberen Navigationsleiste. Klicken Sie in der oberen rechten Ecke der Ansicht „List Charts“ auf die grüne Plus-Schaltfläche.
In der Ansicht zum Erstellen eines neuen Diagramms wählen Sie default.sacramento_geospatial als Datenquelle und Kreisdiagramm als Visualisierungstyp. Klicken Sie dann auf „Neues Diagramm erstellen“. Ändern Sie in dieser Ansicht den Zeitbereich auf der linken Seite in Kein Filter. Für Metriken wählen Sie COUNT(*)
. Ändern Sie im Abschnitt Filter die SQL-Anweisung in COUNT(*) > 25
, so dass wir Städte ausschließen, in denen es nicht viele Restaurants gibt. Für GROUP BY
fügen Sie das Feld CITY_s
hinzu. Ändern Sie den Wert Row limit auf 10.000. Und, voila:
Wenn Sie Ihre Reise fortsetzen, um den Zugang zu Informationen für Ihre Kunden mit einer KI-gesteuerten Suchmaschine zu verbessern, wird die Visualisierung in jeder Phase des Lebenszyklus Ihrer Suchentwicklung von Vorteil sein. Wenn Sie darüber nachdenken, welche Wörter Sie verstärken wollen, oder wenn Sie mit Ihren Geschäftspartnern zusammenarbeiten, kann es sehr hilfreich sein, Visualisierungen zur Unterstützung Ihrer Analyse zur Verfügung zu haben.
Nachdem Sie alles eingerichtet haben, können Sie Ihre eigenen Daten in Lucidworks Fusion laden, um die Visualisierungen in Ihrer Laborinstanz zu testen.
Bleiben Sie dran für TEIL 3, in dem wir geografische Visualisierungen für unseren Suchkorpus erforschen werden.
Lesen Sie Supersize Apache Superset mit Lucidworks Fusion – Teil 1