Taxonomien vs. Facetten: Was ist das Beste für Ihre Website?
Obwohl Suchmaschinen manchmal das „perfekte“ Dokument an den Anfang der Ergebnisliste stellen, ist dies oft nicht der Fall. Suchbegriffe wie „Fernsehen“, „Las Vegas“ oder „Waffenkontrolle“ können für verschiedene Menschen sehr viel bedeuten, je nachdem, was sie erreichen wollen und welche persönlichen Meinungen und Vorlieben sie haben. Es gibt also nicht das eine „richtige“ Dokument.
Es ist eine gute Idee, weitere anklickbare Optionen in Ihrer Ergebnisliste zu präsentieren, damit die Benutzer mehr darüber erfahren, wonach sie suchen. So erhält Ihre Website eine zweite Chance, es richtig zu machen!
Zwei beliebte Arten von Ergebnislistennavigatoren sind Taxonomien und Facetten. Sie haben viel gemeinsam: beide bieten anklickbare Links, die die Ergebnisliste auf eine kleinere Menge herunterfiltern, und in einigen Systemen werden Teile mit demselben Code implementiert. Aber es gibt auch typische Unterschiede:
Facetten:
- Stützt sich in der Regel auf feldbasierte Daten/Attribute (z.B.: Farbe, Größe, Preis, etc.)
- Datentyp kann Text, numerisch oder datumsbasiert sein
- Weitgehend unabhängig voneinander
- Hat in der Regel Streichholzzahlen
Taxonomien:
- In der Regel nach Thema oder Kategorie
- Normalerweise eine Hierarchie, manchmal können Sie einen Baum erweitern und darin navigieren
- Normalerweise textbasiert
- Kann übereinstimmende Zahlen haben, aber nicht universell
- Einige Standardtaxonomien innerhalb bestimmter Branchen
Einige große Websites verwenden tatsächlich beides. Eine große E-Commerce-Website könnte zum Beispiel eine Taxonomie von Produktkategorien und Unterkategorien (wie Elektronik/Fernseher) haben und dann auch spezifische Attribute innerhalb jeder Kategorie (wie Fernsehgröße oder Bildschirmtyp).
Aber wie der Titel schon sagt, hängt es stark von der Art der gesuchten Daten und der Art der von den Benutzern erwarteten Abfragen ab, was für eine Website geeignet ist.
Faktoren, die Facetten begünstigen:
- Die zu durchsuchenden Objekte enthalten viele gute, klar definierte Daten, z. B. Datenbankfelder aus einem Produktinventar oder Dokumente mit vielen kuratierten Metadaten.
- Viele ähnliche Artikel, die sich nur durch 1 oder 2 Eigenschaften unterscheiden (z.B.: Größe, Material, Hersteller, etc.)
- Verschiedene Datentypen (Text, numerisch, Datum, Ort usw.)
- Die Suchmaschine unterstützt / übertrifft sie
- Konkurrierende Websites haben es!
Faktoren, die Taxonomien begünstigen:
- Der Inhalt kann logisch in Kategorien und Unterkategorien eingeteilt werden.
- Dokumente haben weniger klar definierte Felder
- Inhalt und Benutzer kommen aus einer Branche, die an die Verwendung einer Taxonomie gewöhnt ist
- Der Inhalt stammt aus vielen Quellen oder Gruppen
- Inhalte mit weit verteilten Standortdaten, die eine logische Verschachtelung aufweisen (Städte, Staaten, Länder usw.)
- Daten, die möglicherweise inkonsistent oder unvollständig sind (z.B.: nur Jahr oder Monat und Jahr)
- Es gibt Taxonomien nach Industriestandard
- Etwas spezialisiertes Personal
Sie werden feststellen, dass der Ort in beiden Listen erscheint. Bei facettierten Websites gibt es eine Tendenz zu Rohdaten in Form von Längen- und Breitengraden und die Möglichkeit, nach Entfernungen zu suchen. Bei Taxonomien handelt es sich normalerweise eher um eine logische Gruppierung. Ähnlich verhält es sich mit Datumsangaben. In facettierten Anwendungen sind sie in der Regel präziser und konsistenter, während sie in Taxonomien vager sein können, wie z.B. „18. Jahrhundert“ oder „1970er Jahre“. Aber wie ich oben schon sagte, gibt es viele Überschneidungen zwischen Taxonomien und Facetten, so dass Datums- und Zeitangaben in beide Arten von Systemen integriert werden können.
Facetten sind verbreiteter und werden wahrscheinlich besser verstanden. Wenn Sie noch unentschlossen sind, sollten Sie sie zuerst ausprobieren. Für Solr-Benutzer finden Sie online sicherlich viel mehr Beispiele. Taxonomien sind für einige Inhalte unverzichtbar. Bedenken Sie jedoch, dass der Arbeitsablauf zur Erstellung/Erstellung und Pflege dieser Taxonomien komplexer ist und einen längerfristigen, spezialisierten Personaleinsatz voraussetzt.
Und was ist, wenn Ihre Daten keine guten Metadaten haben und auch nicht logisch in irgendwelche praktischen Kategorien eingeteilt sind? Was ist, wenn Sie nur einen „riesigen Haufen Text“ haben? Das ist keine schöne Situation, aber sie ist viel häufiger, als Sie vielleicht denken. Im Allgemeinen besteht die Idee darin, Ihre Daten mit Hilfe von Tools zu „verbessern“, die zusätzliche Metadaten oder Kategoriedaten ableiten. Diese Tools sind nicht perfekt, also schrauben Sie Ihre Erwartungen ein wenig zurück.
Ein gängiger Ansatz ist die Verwendung der Entitätsextraktion, um Metadaten im Text zu finden und diese Attribute zu jedem Dokument hinzuzufügen. Auf diese Weise können Sie schließlich Facetten anzeigen, z.B. Personen, Orte, Firmennamen, Geldbeträge, Daten usw. Das wird nicht perfekt sein: Einige Dokumente haben vielleicht keine erkennbaren Entitäten, und andere haben vielleicht einen vagen Bezug (Paris, Frankreich oder Paris, Maine?). Wenn Ihre Daten zwar über einige Felder verfügen, die Werte aber etwas inkonsistent sind, sollten Sie ein Datenbereinigungstool in Betracht ziehen.
Eine weitere Technik, die Sie in Betracht ziehen sollten, ist die automatische Kategorisierung Ihrer Dokumente in einer Taxonomie. Dies geschieht in der Regel, indem Sie Ihre Inhalte entweder nach Schlüsselwörtern durchsuchen, die mit einer bestehenden Taxonomie übereinstimmen, oder indem Sie ähnliche Dokumente in Clustern zusammenfassen und versuchen, eine Taxonomie auf der Grundlage des Vorkommens von Wörtern und Phrasen automatisch zu erstellen. Diese Tools sind vielleicht nicht ganz so ausgereift und, wie man so schön sagt, „das kann sich ändern“.
Bei Web-Inhalten ist eine einfache Methode, nach Mustern in den URLs zu suchen. Wenn Sie einige der wichtigsten Websites, von denen die Inhalte stammen, charakterisieren können, können Sie ein Quellen- oder Kategoriefeld hinzufügen. Ein Blick auf den tatsächlichen Pfad in den URLs könnte Ihnen Hinweise auf das Datum, die Region oder die Gruppe geben.
Die Erwartungen und Erfahrungen der Benutzer können einen großen Unterschied ausmachen. Einem gelegentlichen Benutzer ein Dutzend verschiedener Facetten aufzudrängen , könnte ihn nur verwirren. Selbst wenn Sie nur ein einziges Element aufschlüsseln können, z.B.: „Quelle“, kann das immer noch ausreichen, um das Sucherlebnis insgesamt zu verbessern.