Supersize Apache Superset mit Lucidworks Fusion – Teil 2

Wenn Sie den ersten Beitrag dieser Serie noch nicht gelesen haben, springen Sie zu Supersize Apache Superset With Lucidworks Fusion…

Wenn Sie den ersten Beitrag dieser Serie noch nicht gelesen haben, springen Sie zu Supersize Apache Superset With Lucidworks Fusion – Part 1.

Es gibt viele Herausforderungen, auf die Benutzer stoßen, wenn sie versuchen, Software auf ihren Rechnern zu entwickeln. Ich finde es zwar immer noch hilfreich, an einigen Anwendungen lokal zu arbeiten, aber es spart Zeit, Software auf einer Plattform zu verwenden, die der Produktionsplattform ähnelt.

Mit Lucidworks Labs können Sie eine App starten, die bereits Daten für Restaurants in Sacramento enthält. Sie müssen lediglich den Index-Workflow ausführen (eine Datenquelle hinzufügen und crawlen) und schon werden die Daten umgewandelt und in eine Fusion-Sammlung zur Verwendung mit Superset geladen.

Sie benötigen einen GitHub-Link, um einen Stream zu starten.

Klicken Sie unter diesem Link auf „Instanz erstellen“ und wählen Sie „Superset“.

Sobald Fusion eingerichtet ist, besuchen Sie die im Dashboard angegebene URL. Dort können Sie sich auch mit dem dort angegebenen Benutzernamen und Passwort anmelden. Sobald Sie eingeloggt sind, sehen Sie eine bereits vorinstallierte App und eine App mit der Option, eine neue App zu erstellen/zu importieren. Klicken Sie auf das Feld Sacramento Geospatial auf der linken Seite, um die App zu öffnen.

sacramento geospatial
Um sich mit Superset zu verbinden, besuchen Sie die IP Ihrer Fusion-Anwendung und den Port 8088. Zum Beispiel:

http://35.203.178.8:8088/
# Beachten Sie, dass dies keine echte Domäne ist. Es ist ein Beispiel.

Der Benutzername ist admin und das Passwort ist superset.

Als nächstes verbinden Sie Superset mit Ihrer Fusion-App. Sobald Sie sich authentifiziert haben, klicken Sie in der oberen Navigationsleiste auf „Quellen“ und dann auf „Datenbanken“ (Quellen > Datenbanken). Fügen Sie den Namen GeospatialFusion hinzu. Fügen Sie dann eine Verbindungszeichenfolge hinzu.

Hier ist die Struktur des Verbindungsstrings:
hive://admin:<password>@<Internal IP>:8768/default;transportMode=binary?auth=CUSTOM

Die interne IP finden Sie in Ihrem Instanz-Dashboard. Um Ihre interne IP zu finden, klicken Sie auf die Registerkarte „Konsolenprotokoll“, um Ihre Dashboard-Ansicht zu ändern. Suchen Sie dann auf der Seite nach ens4 | True. Die darauf folgende IP ist diejenige, die Sie für den Wert der Internen IP verwenden müssen. Klicken Sie dann auf „Speichern“.

Um eine Tabelle hinzuzufügen, klicken Sie in der oberen Navigationsleiste auf „Quellen“ und dann auf „Tabellen“ (Quellen > Tabellen). Unten finden Sie die Einstellungen für die Tabellen.

Databases: GeospatialFusion
Schema: default
Tables: sacramento_geospatial

Klicken Sie auf „Speichern“.

Erstellen eines einfachen Kreisdiagramms mit den Beispieldaten

Lassen Sie uns schnell ein Tortendiagramm erstellen, das den Anteil der Restaurants nach Städten in der Sacramento Metro Region darstellt. Klicken Sie dazu auf „Diagramme“ in der oberen Navigationsleiste. Klicken Sie in der oberen rechten Ecke der Ansicht „List Charts“ auf die grüne Plus-Schaltfläche.

In der Ansicht zum Erstellen eines neuen Diagramms wählen Sie default.sacramento_geospatial als Datenquelle und Kreisdiagramm als Visualisierungstyp. Klicken Sie dann auf „Neues Diagramm erstellen“. Ändern Sie in dieser Ansicht den Zeitbereich auf der linken Seite in Kein Filter. Für Metriken wählen Sie COUNT(*). Ändern Sie im Abschnitt Filter die SQL-Anweisung in COUNT(*) > 25, so dass wir Städte ausschließen, in denen es nicht viele Restaurants gibt. Für GROUP BY fügen Sie das Feld CITY_s hinzu. Ändern Sie den Wert Row limit auf 10.000. Und, voila:

Kreisdiagramm Apache Superset

Wenn Sie Ihre Reise fortsetzen, um den Zugang zu Informationen für Ihre Kunden mit einer KI-gesteuerten Suchmaschine zu verbessern, wird die Visualisierung in jeder Phase des Lebenszyklus Ihrer Suchentwicklung von Vorteil sein. Wenn Sie darüber nachdenken, welche Wörter Sie verstärken wollen, oder wenn Sie mit Ihren Geschäftspartnern zusammenarbeiten, kann es sehr hilfreich sein, Visualisierungen zur Unterstützung Ihrer Analyse zur Verfügung zu haben.

Nachdem Sie alles eingerichtet haben, können Sie Ihre eigenen Daten in Lucidworks Fusion laden, um die Visualisierungen in Ihrer Laborinstanz zu testen.

Bleiben Sie dran für TEIL 3, in dem wir geografische Visualisierungen für unseren Suchkorpus erforschen werden.

Lesen Sie Supersize Apache Superset mit Lucidworks Fusion – Teil 1

You Might Also Like

B2B-KI-Benchmarkstudie 2025: Was wir in den Schützengräben sehen

Laden Sie die B2B-KI-Benchmark-Highlights 2025 von Lucidworks herunter. Sehen Sie sich die...

Read More

Vom Suchunternehmen zum praktischen KI-Pionier: Unsere Vision für 2025 und darüber hinaus

CEO Mike Sinoway gibt Einblicke in die Zukunft der KI und stellt...

Read More

Wenn KI schief geht: Fehlschläge in der realen Welt und wie man sie vermeidet

Lassen Sie nicht zu, dass Ihr KI-Chatbot einen 50.000 Dollar teuren Tahoe...

Read More

Quick Links