Handbuch für neue Benutzer von Fusion Effectiveness

Wenn Sie neu in Fusion sind, suchen Sie vielleicht nach einer Anleitung, wie Sie mit den vielen leistungsstarken Funktionen und Möglichkeiten von Fusion beginnen können. Vielleicht sind Sie sogar neu in der Suche im Allgemeinen und mit den Suchbegriffen nicht vertraut. Diese Sitzung wird Ihnen Klarheit verschaffen und Ihnen helfen, sich zu konzentrieren, um schnelle Erfolge zu erzielen.

Zielpublikum

Jeder, der daran interessiert ist, einen schnellen Einstieg in die Arbeit mit Fusion zu finden. Keine Vorkenntnisse erforderlich.

Teilnehmer nehmen mit

Lernen Sie, wie Sie Fusion effektiv nutzen können, ganz gleich, wo Sie sich auf Ihrer Suchreise befinden.

Redner

David Im, Lösungsingenieur, Lucidworks
Eric Smith, Lösungsingenieur, Lucidworks


[Erzähler]

Willkommen bei The New User’s Guide to Fusion Effectiveness. Fusion ist eine hervorragende Suchplattform mit vielen wunderbaren Funktionen. Und für jeden, der gerade erst in die Welt von Fusion einsteigt, kann es sehr entmutigend sein, alle Einzelheiten zu verstehen. Glücklicherweise haben David und Eric hier die mit dem Friedensnobelpreis 2021 ausgezeichnete Präsentation zusammengestellt, die Ihnen hilft, sich in der Welt von Fusion zurechtzufinden. Hier sind David und Eric, ohne weitere Umschweife.

[Eric Smith]

Vielen Dank für die wunderbare Einführung, allwissender Erzähler. Wie der Erzähler bereits erwähnt hat, bin ich Eric.

[David Im]

Und ich bin David.

[Eric Smith]

Wir haben beide im Januar hier bei Lucidworks angefangen und haben eine nützliche Liste von Dingen zusammengestellt, die man wissen muss, um effektiv mit Fusion arbeiten zu können. Wir bezeichnen dies gerne als Fusion Advanced Readiness Training, auch bekannt als FART.

[David Im]

Hier ist, was Sie von FART lernen werden. Zunächst erfahren Sie, was Fusion als Suchlösung im Allgemeinen ist, wie Sie sich in der Fusion-Benutzeroberfläche zurechtfinden, dann erhalten Sie einen Überblick über den Fusion-Datenworkflow vom Index bis zur Abfrage, weitere Schlüsselkomponenten in Fusion sowie Tipps und Tricks, die wir gelernt haben, um unsere Fusion-Reise zu beginnen. Lassen Sie uns beginnen.

Was ist Fusion? Fusion ist eine von Lucidworks entwickelte Plattform für die Entwicklung von Such- und Discovery-Anwendungen. Sie wird in der Cloud gehostet und basiert auf dem leistungsstarken Apache Solr, das den Index speichert und alle Abfragen steuert. Das ist im Grunde das Gehirn der Operation. Der grundlegende Prozess besteht darin, dass die Daten in Index-Pipelines eingespeist werden, die wiederum in Solr-Sammlungen einfließen. Die Solr-Sammlungen speichern die Daten, und auf der anderen Seite verarbeiten Abfrage-Pipelines die Suchanfragen und senden sie an Solr, um die Antwort abzurufen. Lassen Sie uns beginnen.

[Eric Smith]

Wenn Sie Fusion zum ersten Mal geöffnet haben, werden Sie mit diesem Schnellstartbildschirm konfrontiert. Da es sich hier aber um das Training für Fortgeschrittene handelt, werden wir diesen Bildschirm nicht durchgehen. Wir verlassen den Bildschirm und zeigen Ihnen, wie es wirklich ist.

[David Im]

Allgemeiner Überblick über die Fusion-Benutzeroberfläche. Dies ist Fusion in seiner ganzen Pracht. Schauen wir uns zunächst oben links an, wie Sie die App ändern können. Oben links befindet sich ein sechseckiges Symbol. Bewegen Sie sich darauf zu und es zeigt alle derzeit verfügbaren Apps an, zu denen Sie wechseln können. Wenn Sie in der Spalte nach unten gehen, sehen Sie verschiedene Funktionen. Gehen wir zu der Funktion namens Sammlungen. Dies sind alle Sammlungen in dieser App. Oben links sehen Sie die aktuelle Sammlung, in der wir uns gerade befinden: Trainingsdemo aktivieren.

Navigieren in der Benutzeroberfläche. Wenn Sie die Komponenten öffnen, öffnen sie Fenster. Sie können darin blättern, um zwischen geöffneten Komponenten zu wechseln. Fenster strecken. Außerdem können alle Fenster durch Klicken und Ziehen am Rand der Komponente vergrößert werden. Unten rechts befindet sich eine Schaltfläche mit der Aufschrift Alle schließen, um alle derzeit geöffneten Fenster zu schließen. Überblick über den Fusionsprozess. Über die Indizierung und die Datenquellen erhalten wir Daten in Fusion. Es gibt eine für jede Quelle. In der Benutzeroberfläche navigieren Sie von der linken Seitenleiste aus. Unter Datenquellen klicken Sie auf Hinzufügen. Hier sehen Sie, dass es in der Datenquelle eine Datenquellen-ID und eine Index-Pipeline gibt, mit der wir die eingehenden Daten aufbereiten, sowie einen Parser, mit dem die Daten interpretiert werden. Wenn Sie bereit sind, klicken Sie auf Speichern. Klicken Sie dann auf Ausführen, um eine Datenquelle zu starten, um Dokumente aus einer Indexpipeline an eine Sammlung zu senden. Sie können diese Datenquellen auch so planen, dass sie in bestimmten Abständen ausgeführt werden.

Wenn Sie nun zu den Index-Pipelines gehen, sehen Sie, dass die Index-Pipelines aus mehreren Stufen bestehen. Eine für jede Funktion. Sie können diese Pipeline-Stufen deaktivieren und aktivieren, indem Sie auf den Kreis klicken.

Sammlungen. Oben links in der Ecke finden Sie den Sammlungsmanager. Und in der linken oberen Ecke sehen Sie auch, in welcher Sammlung Sie sich gerade befinden. Im Sammlungsmanager können Sie auf Neu klicken, um eine neue Sammlung zu erstellen, und es gibt eine erweiterte Option für weitere Konfigurationen.

[Eric Smith]

Jetzt gehen wir zur Abfrage über. Ähnlich wie bei der Indizierung können wir, wenn wir auf der linken Seite die Registerkarte Abfragen öffnen, Abfrage-Pipelines auswählen. Diese Abfrage-Pipelines sind den Index-Pipelines insofern sehr ähnlich, als dass Sie die einzelnen Phasen deaktivieren und aktivieren und mit allen Teilen innerhalb dieser Phasen einzeln interagieren können. Wenn eine Pipeline einsatzbereit ist, können wir ein Abfrageprofil erstellen.

Abfrageprofile werden erstellt, indem Sie eine Pipeline und eine Sammlung auswählen, aus der Sie Ihre Ergebnisse zurückgeben oder abfragen möchten. Unten auf dem Bildschirm sehen Sie einen Endpunkt, der vom Profil zurückgegeben wird, wenn es erstellt wird. An diesen Endpunkt können Sie Ihre Abfragen senden und die Ergebnisse zurückgeben.

Ein nützliches Tool bei der Erstellung von Abfrage-Pipelines ist die Abfrage-Workbench. Die Abfrage-Workbench gibt uns nicht nur einen guten Überblick über die Pipeline, die wir gerade aktiv betrachten, sondern auch über die Ergebnisse der Abfrage, die wir an sie senden. Wenn die Workbench geöffnet ist, können Sie bestehende Phasen hinzufügen und bearbeiten. Wir wählen zum Beispiel diese Text-Tagger-Phase aus und können sie nach Belieben bearbeiten. Klicken Sie auf die Schaltfläche „Anwenden“, die Sie sehen, und unsere Ergebnisse werden sofort mit den entsprechenden Änderungen aktualisiert.

Außerdem gibt es in der oberen rechten Ecke unserer Abfrage-Workbench die neue Schaltfläche Laden und Speichern. Mit der neuen Schaltfläche können wir eine neue Abfrage-Pipeline erstellen. Über die Schaltfläche Laden können wir andere Abfrage-Pipelines laden, mit denen wir vielleicht arbeiten möchten. Und wenn wir auf die Schaltfläche Speichern klicken, sehen wir diesen Dialog. Auf diesem Bildschirm können wir entweder eine vorhandene Pipeline mit der aktuellen Pipeline überschreiben, die wir in unserer Workbench geöffnet haben, oder eine neue Pipeline erstellen. Diese Funktion zum Erstellen einer neuen Pipeline kann sogar dazu verwendet werden, vorhandene Pipelines zu duplizieren, wenn Sie sehr ähnliche Pipelines mit vielen gleichen Schritten und Konfigurationen benötigen.

Eine weitere nützliche Funktion der Abfrage-Workbench ist die Möglichkeit, Facettenfelder hinzuzufügen. Wenn Sie auf die Schaltfläche Facettenfeld hinzufügen klicken, können Sie ein Feld auswählen, dem Sie eine Facette zuordnen möchten. Wenn wir also hier das Datumsfeld eingeben und es auswählen, wird diese Facettenspalte mit Werten und der Anzahl der Dokumente mit den entsprechenden Werten für dieses Feld gefüllt. Wenn Sie einen dieser Werte auswählen, werden unsere Ergebnisse auf die Dokumente mit diesem Wert in diesem Feld beschränkt.

Außerdem haben wir diese Registerkarte für die Anzeige von Feldern am oberen Rand. Wenn Sie diese öffnen, können Sie den Namen und die Beschreibung der Ergebnisse ändern, die Sie auf dem Bildschirm der Abfragewerkbank sehen. Wenn wir den Namen in Kategoriename und die Beschreibung in Adresse ändern, sieht unser Ergebnisbildschirm etwa so aus. Wie Sie sehen können, sieht der Ergebnisbildschirm jetzt etwas anders aus, weil der Name und die Beschreibung durch die beiden von uns ausgewählten Felder ersetzt wurden.

Darüber hinaus befinden sich in der oberen rechten Ecke unter den Schaltflächen Laden und Speichern die Schaltflächen Parameter und URI. Wenn Sie Parameter auswählen, öffnet sich diese Zeile, die uns alle Abfrageparameter anzeigt, die mit unseren Abfragen gesendet werden. Dies ist auch ein nützlicher Ort, um neue Parameter zu bearbeiten und hinzuzufügen und zu sehen, welche Auswirkungen sie auf die Ergebnisse haben würden.

Die URI-Schaltfläche zeigt uns die funktionierenden und veröffentlichten URIs, die verwendet werden, um diese Abfragen zu senden und die Ergebnisse abzurufen, was uns ein besseres Gefühl dafür vermittelt, was tatsächlich hinter den Kulissen geschieht.

Unten rechts schließlich finden Sie diese Ansicht als Dropdown. Wenn Sie diese Option auswählen, können Sie das Aussehen der Ergebnisse ändern und sich einen besseren Überblick über die Vorgänge verschaffen. Wenn Sie Debuggen auswählen, erhalten Sie nicht nur eine Aufschlüsselung der verschiedenen Teile der Abfragen und deren Dauer, sondern auch Berechnungen, die erklären, wie die einzelnen Dokumente bewertet wurden.

Die JSON-Ansicht tut genau das, was Sie von ihr erwarten und zeigt uns die JSON-Darstellung der Antwort, die wir erhalten. Dies kann nützlich sein, um eine Vorstellung davon zu bekommen, wie die Antwort aussehen wird, wenn Sie außerhalb der Fusion-Benutzeroberfläche mit einer Abfrage-Pipeline interagieren.

[David Im]

Als letzten kleinen Leckerbissen können Sie die Jobs über die linke Seitenleiste aufrufen. Dort sehen Sie die verschiedenen Aufträge, von denen jeder einzigartig ist. Sie können dazu verwendet werden, regelmäßig Restaufrufe zu tätigen, Daten zu aggregieren, Analysen durchzuführen, Sammlungen zu bereinigen und vieles mehr.

Aufträge können geplant werden, und die meisten Aufträge verfügen über eine erweiterte Schaltfläche für weitere Konfigurationsoptionen. Besonders hervorzuheben ist der benutzerdefinierte Spark-Auftrag für benutzerdefinierte Scala-Skripte. Der benutzerdefinierte Python-Auftrag für benutzerdefinierte Python-Skripte.

Das nächste ist Blobs. Über die System-Seitenleiste können Sie auf die Blobs zugreifen. Dies ist ein Dateisystem, auf das Sie innerhalb von Fusion zugreifen können und das eine Reihe von wichtigen Dateien enthält, die in Fusion verwendet werden.

Schließlich gibt es noch Signale, auf die Sie über den Sammlungsmanager zugreifen können. Vereinfacht gesagt, sind Signale Daten über die Benutzeraktivität. Sie sind eine Nebendatensammlung. Sie sind Teil einer Hauptdatensammlung. Der häufigste Typ sind Benutzerabfragen. Wie Sie sehen können, geben Sie eine Abfrage wie Hallo Welt ein. Und dann wird die Signalsammlung als ein Signal, als ein Dokument, gespeichert. Tipps von Profis für Profis.

[Eric Smith]

Während Sie mit Fusion arbeiten, werden Sie diese Popups in der unteren rechten Ecke bemerken, die uns über den aktuellen Stand der Dinge informieren. Entweder Fehler oder Erfolgsmeldungen. Um eine bessere Übersicht über diese Benachrichtigungen zu erhalten oder wenn Sie eine verpasst haben, bevor sie verschwindet, können Sie auf die Glocke in der oberen rechten Ecke Ihres Bildschirms klicken, um alle Benachrichtigungen anzuzeigen, die Sie möglicherweise verpasst haben. Sie können auch auf die Schaltfläche Alle löschen klicken, um alle diese Benachrichtigungen zu löschen.

Auf der linken Seite sehen Sie, dass wir auf die Schaltfläche Alle Dienste in Betrieb geklickt haben. Dies ist nicht immer der Fall, und manchmal sind einige Dienste nicht verfügbar oder haben Probleme. Wenn Sie auf diese Schaltfläche klicken, erhalten Sie einen guten Überblick über alle Dienste in Fusion. Und ob es bei einem von ihnen Probleme gibt.

Wenn Sie auf der linken Seite das Dropdown-Menü „Systeme“ öffnen und „Protokollanzeige“ auswählen, können Sie alle Protokolle in Fusion anzeigen lassen und erhalten so einen detaillierteren Überblick über die Probleme, auf die wir stoßen.

Wie Sie wissen, ist Fusion Kubernetes-basiert und wird in der Cloud gehostet. Einige Grundkenntnisse über Kubernetes können Ihnen helfen, einige der Probleme zu verstehen, auf die Sie bei der Arbeit mit Fusion stoßen könnten. Zwei Befehle, die wir gerne verwenden, sind kubectl get pods, mit dem Sie einen guten Überblick über den Status aller Pods erhalten. So können Sie vielleicht erkennen, dass einer Ihrer Dienste oder Ihre Pods ausgefallen sind und wissen, dass dies die Ursache für eines Ihrer Probleme sein könnte.

Darüber hinaus erhalten Sie mit kubectl logs -f unter Eingabe eines Pod-Namens die Protokolle dieses Pods, die Sie verwenden können, um Probleme zu entschlüsseln, die auftreten können, wenn ein Pod ausgefallen ist oder Probleme hat.

[David Im]

Als nächstes folgt die Objekte-API. Hier können Sie ganze Anwendungen, einzelne Komponenten oder Arten von Komponenten exportieren. Mit der Funktion Fusion-Objekte importieren aus der Seitenleiste können Sie eine Zip-Datei eines Objekts . JSON, um Objekte zu importieren. Außerdem finden Sie hier einen Curl-Befehl, mit dem Sie auf diese Objekt-API zugreifen können.

Als Nächstes kann Jupyter für eine Fusion-Instanz aktiviert werden, so dass Sie Ihre Fusion-Sammlung direkt testen können oder eine Entwicklungsbasis für neue Aufträge haben. Jupyter kann über den Fusion-Parameter Jupyter enabled true aktiviert werden.

[Eric Smith]

Jetzt werde ich auf die JavaScript-Stages eingehen, die sowohl in Index-Pipelines als auch in Abfrage-Pipelines verwendet werden können. Diese Stufen sind nützlich, wenn Sie eine Stufe benötigen, die in Fusion noch nicht vorhanden ist. Wir können unsere eigenen Skripte hinzufügen und damit fast alles machen, was wir wollen.

Auf der Indexseite werden wir mit einer Funktion konfrontiert, die uns Zugriff auf das Dock-Objekt und das CTX-Objekt gibt. Das Dock-Objekt verweist auf das aktuelle Dokument, das die Pipeline durchläuft. Und das CTX-Objekt ist der Kontext der Pipeline selbst.

Auf der Abfrageseite haben wir ein Request-Objekt und ein Response-Objekt sowie das Kontextobjekt. Und das Wichtigste dabei ist, dass wir auf der rechten Seite einen netten kleinen Formatierungstrick für die Interaktion mit diesen JavaScript-Phasen haben: Die Verschachtelung dieser Funktion, die die Hauptfunktion zurückgibt, ermöglicht es uns, Code zu schreiben, der sich etwas angenehmer anfühlt.

Wir können also zusätzliche Funktionen definieren, wie in diesem Fall foobar, die dann innerhalb der Hauptfunktion verwendet werden, bevor die Antwort zurückgegeben wird.

[David Im]

Auf Solr Schema können Sie über die Solr-Konfiguration in der System-Seitenleiste zugreifen. Hier finden Sie das verwaltete Schema und die Solr-Konfiguration. Seien Sie vorsichtig, wenn Sie die Solr-Konfiguration überschreiben, da sie sehr wichtig ist, aber sie kann ein guter Bezugspunkt sein.

Das verwaltete Schema hingegen ist eine gute Möglichkeit, um zu sehen, wie Solr Ihre Daten interpretiert, und es zu ändern, wenn Sie es aus einem bestimmten Grund ändern müssen.

[Eric Smith]

Wir hoffen, dass Sie dank des Fusion Advanced Readiness Training eine Vorstellung davon haben, wie die Daten durch Fusion fließen und was nötig ist, um die besten Suchlösungen zu liefern, sowie einige Tipps und Tricks, die Sie wie einen echten Fusion-Profi erscheinen lassen. Vielen Dank fürs Zuhören.

Quick Links