Bessere Suchrelevanz bei REI mit SKU-Verfügbarkeit
Wie REI die Produktverfügbarkeit mit Hilfe von SKUs definiert hat, um seinem primären Kundenstamm gerecht zu werden.
Der Outdoor-Einzelhändler REI hat eine kundenorientierte Marke, die in seinen Geschäften von sachkundigen, hilfsbereiten Mitarbeitern in grünen Westen verkörpert wird. Die Übertragung dieses Ethos auf seine Online-Kunden hat für das Unternehmen oberste Priorität. Aber wie kann REI ohne persönliche Interaktion mit den grünen Westen eine kundenorientierte Kultur über seine Website kultivieren?
„Jedes Suchergebnis ist ein Ausdruck der Authentizität und der Expertise der Marke REI“, erklärt Luke Warwick, REI’s Program Manager for Search and Browse. „Auf unserer Website haben wir mehr Interaktionen, mehr Erlebnisse und damit mehr markenbildende Erfahrungen mit Kunden als alle unsere grünen Westen im Feld zusammen, weshalb wir uns so sehr auf Relevanz konzentrieren.“
REI migrierte von Adobe Search & Promote zu Lucidworks Fusion, um seine E-Commerce-Suche zu modernisieren. Doch angesichts der schnell schwankenden Lagerverfügbarkeit blieb ein Problem bestehen. Die SKU- und Produktverfügbarkeit musste in der Reihenfolge der Suchergebnisse berücksichtigt werden. Warwick und Jake Pratt, Data Science Product Manager bei REI, sowie Joshua Groppe, Lead Software Engineer, berichteten in ihrem Vortrag auf der virtuellen Activate-Konferenz, wie sie diesen letzten Schritt zur Verbesserung der Relevanz ermöglicht haben .
Das Problem
Die große Vielfalt der einzelnen Produkttypen, die bei REI erhältlich sind, macht die Relevanz der Suche unglaublich wichtig, da die Top-Ergebnisse starke Positionen sind, um Klicks und Käufe zu fördern. Bei über 100 Fahrradhosen im Katalog sollten die Artikel, die in den Suchergebnissen ganz oben stehen, idealerweise beliebte Artikel sein, die den meisten Käufern gefallen, und zwar in den passenden Größen und Farben.
Bevor REI seine Suchergebnisse für die Verfügbarkeit optimierte, war die Nummer zwei auf der Liste der Fahrradshorts die sehr beliebte Pearl iZUMi Shorts. Das scheint vernünftig zu sein, aber als ein Kunde von der Liste auf die Artikeldetails klickte, stellte er fest, dass leider nur eine Größe XXL in einer Farbe verfügbar war.
Da XXL nur für eine begrenzte Anzahl von Käufern geeignet ist, war dieser Artikel, der so weit oben in den Suchergebnissen erschien, ein Nachteil für die Kunden und das Unternehmen.
Zu dieser Zeit wurde die Reihenfolge der Produkte auf einer Suchergebnisseite durch Geschäftsregeln und Kundensignale bestimmt. Diese Signale (Klicks, Add-to-cart und Konversionen) identifizierten beliebte Produkte, die in den Suchergebnissen ganz oben erscheinen sollten. Beliebte Produkte neigen aber auch dazu, schnell vergriffen zu sein. Dies führte zu dem Problem, dass Artikel mit geringer Verfügbarkeit, begrenzten Größen und Farben, die nicht unbedingt zum durchschnittlichen REI-Käufer passten, hohe Werte bei den Modellen und damit eine Spitzenposition in den Suchergebnissen erhielten.
Als weder die Erhöhung der Bedeutung von Add-to-Cart und Conversions noch die Beschleunigung des zeitlichen Abklingens dieser Signale das gewünschte Ergebnis erzielten, nämlich die Senkung des Scores für diese Produkte mit begrenztem Angebot, schlossen sich die Business Intelligence- und Search-Teams von REI den Bemühungen an, die Relevanz zu verbessern.
Entwerfen einer Lösung
REI hatte zuvor weder ein hauseigenes Datenprodukt direkt in die digitale Infrastruktur integriert, noch die Ergebnisse eines Data-Science-Modells direkt den Kunden präsentiert. Zuvor gab es immer eine menschliche Ebene für die Interpretation zwischen dem Output eines Modells und dem Kunden.
Auf diesem Neuland legten Jake Pratt und das Data-Science-Team bei der Entwicklung Wert auf Einfachheit, Transparenz und Erklärbarkeit. Diese Philosophie ermöglichte es ihnen, Berechnungen für manuelle Tests schnell abzuschätzen und Vertrauen in die Ergebnisse des Modells aufzubauen. Die Einfachheit ermöglichte es ihnen auch, mit den begrenzten Ressourcen der Data-Science- und Engineering-Teams von REI schnell zu iterieren.
Ein Nachteil bei der Entwicklung der Einfachheit war die frühe Entscheidung, Batch- statt Echtzeit-Inferenzen zu verwenden. Da die Ergebnisse nachts erstellt und einmal täglich in den Suchindex aufgenommen wurden, waren sie nicht so agil und reaktionsschnell wie bei der Echtzeitsuche.
Daten aus mehreren Systemen zusammenführen
Die erforderlichen Daten mussten aus mehreren operativen Systemen zusammengeführt werden. Dazu gehörten Bestandsdaten aus dem ERP-System, Verkaufs- und Retourendaten aus den POS- und Auftragsverwaltungssystemen, Produktattribute und Planungsdaten aus dem Stammdatensystem sowie Clickstream- und Leistungsdaten aus den Webdaten. Wie so oft wurden dabei auch einige unsaubere Daten aufgedeckt, die nicht gut zusammenpassten. Daher war eine Bereinigung, Vorbereitung und Zusammenführung erforderlich, damit alles richtig funktionierte.
Der größte Teil des Projekts wurde mit SQL im Data Warehouse durchgeführt, aber das Modell stützte sich stark auf Python und den Analyse-Stack von REI.
Wie messen Sie die Verfügbarkeit?
Die meisten Einzelhändler messen ihren Bestand als Summe der auf Lager befindlichen SKUs, aber das würde für das Erlebnis, das REI präsentieren wollte, nicht ausreichen.
Während die Verfügbarkeit auf SKU-Ebene gemessen werden konnte, werden die Suchergebnisse auf Produktebene angezeigt. Die Lösung musste eine Möglichkeit bieten, die SKUs nach Produkt zu aggregieren und bestimmte Attribute des Inventars zu berücksichtigen, die REI als wichtig erachtet, um die Mehrheit seiner Kunden zu bedienen.
REI hat festgestellt, dass diese drei Attribute die allgemeine Produktverfügbarkeit am besten definieren:
- Verfügbare Größen
- Farbauswahl verfügbar
- Verbleibende SKUs von der Gesamtzahl der ursprünglich verfügbaren SKUs
Um herauszufinden, welche Größenvielfalt für ein Produkt verfügbar sein sollte, damit es in den Suchergebnissen weit oben rangiert, stützte sich das Data Science Team auf ein Modell, das es zuvor für sein Merchandising-Team erstellt hatte. Dieses Modell konnte dem Merchandising-Team zum Beispiel sagen, dass bei einem bestimmten Einkaufsbudget für Fahrradhelme wie viel für die Bevorratung jeder Größe dieses Helms ausgegeben werden sollte. Es wurde ein einfaches statistisches Modell verwendet, das die Verkäufe der letzten zwei Jahre und die Daten zu den Lagerbeständen berücksichtigte, um festzustellen, welche Verkäufe durch fehlende Bestände verloren gegangen waren. Diese Methode beantwortete die Frage: „Wenn der Bestand unendlich wäre, wie viel würde von jeder Größe verkauft werden?“
Bei dem Größenmodell wurde deutlich, dass mittlere und große Größen am meisten gefragt waren, so dass sie höher gewichtet wurden als die kleinen und extra großen Größen.
Die Farbe war etwas schwieriger, da die Kunden beim Kauf einer anderen Farbe flexibler sind als bei einer anderen Größe. Jemand, dem ein Helm in einer kleinen Größe passt, wird kein XL kaufen, wenn das die einzige vorrätige Größe ist. Er kauft vielleicht ein rotes Hemd, wenn sein bevorzugtes Blau nicht verfügbar ist. Das macht die Beantwortung der oben gestellten Frage nach dem unendlichen Bestand schwieriger, weil die Auswahlmöglichkeiten bei einem Ausverkauf weniger eindeutig sind.
Das Team stützte sich bei der Verteilung der Farben der verkauften Produkte auf die Verkaufsdaten der letzten zwei Jahre, die zeigten, dass Schwarz, Grau und neutrale Farben beliebt sind, während Neontöne weniger gefragt waren.
Der letzte Faktor, der in das Modell aufgenommen wurde, war die Messung der Kundenauswahl. „Was dies definiert, ist im Wesentlichen das, was wir das saisonale Sortiment nennen“, erklärt Jake Pratt. „Ein Händler entscheidet für jede Saison, was er kauft, wo er es verkauft, usw. Wir verwenden diese Informationen zusammen mit einer Menge Logik, die wir für Sonderfälle einbauen mussten, um zu bestimmen, wie hoch der Nenner sein sollte, d.h. wie hoch der Anteil der SKUs an der Gesamtzahl sein sollte.“
Auf diese Weise repräsentieren die Suchergebnisse besser den Bestand, von dem die sachkundigen Einkäufer von REI dachten, dass er auf der Verkaufsfläche verfügbar sein sollte.
Nehmen Sie alles zusammen und was bekommen Sie?
Die Verfügbarkeit jeder SKU wird mit einer Eins (verfügbar) oder einer Null (nicht verfügbar) angegeben. Es gibt jedoch mehrere Geschäftsregeln, die dieses binäre Maß beeinflussen. Zum Beispiel können einige Artikel, wie Boote oder Treibstoff, nicht an bestimmte Orte oder überhaupt nicht geliefert werden.
Die Kombination der binären SKU-Verfügbarkeit mit den drei zuvor beschriebenen Faktoren in einem einfachen Algorithmus ergibt einen gewichteten Produktverfügbarkeitswert (WPA).
In dem obigen Beispiel sind vier von insgesamt sechs möglichen SKUs verfügbar, so dass der WPA (4/6) ohne zusätzliche Faktoren 0,66 betragen würde. Wenn die Gewichtung von Größe, Farbe und Kundenwunsch in die Berechnungen einbezogen wird, sinkt der WPA des Produkts auf 0,56. Dies ist logisch, da der mittelgroße Helm in einer Farbvariante nicht erhältlich ist und die große Größe in der anderen Farbe nicht erhältlich ist. Da diese Größen der Mehrheit der Bevölkerung passen, würde diese eingeschränkte Verfügbarkeit mehr Käufer betreffen, die diese Produkte als „nicht verfügbar“ betrachten würden, da sie nicht in ihrer Größe erhältlich sind.
Mit einem niedrigeren WPA wird das Produkt in den Suchergebnissen weiter unten angezeigt, als wenn die zusätzlichen Faktoren nicht in die Relevanz einbezogen werden. Das ist genau das Ergebnis, das REI erzielen wollte.
Integration der Lösung in die Suche
Nach dem erfolgreichen Aufbau des Modells wurde das Suchteam unter der Leitung von Lead Software Engineer Josh Groppe vor einige Herausforderungen gestellt:
- Wie sollte das Modell bei der Berechnung der Suchrelevanz berücksichtigt werden?
- Wie können die Auswirkungen der Änderungen gemessen werden?
REI integriert die Produktfindungs-Suchfunktionen von Fusion mit FindTuner von Innovent Solutions, um Geschäfts- und Merchandising-Regeln zu verwalten. Die Formel zur Bestimmung der Relevanz verwendet Signale, die aus den Clickstream-Daten der Nutzer aggregiert werden. Vor der Integration der WPA wurde diese Formel verwendet: (Document Score * Signals Boost)+ Business Score
Die Implementierung des WPA-Scores dämpft den vorherigen Score proportional zur Verfügbarkeit des Produkts und die Produkte werden in den Suchergebnissen entsprechend neu sortiert.
Messung der Auswirkungen
Um den wahren Wert dieser Änderung zu verstehen, mussten neben der Messung von Abweichungen bei den KPIs mithilfe von A/B-Tests auch die Vorteile für das Kundenerlebnis gemessen werden.
Der Nutzen für die Nutzer wurde mit einer Methode gemessen, die REI „Shadow Querying“ nennt. Die Schattenabfrage funktioniert so, dass für jede Suchanfrage eines Käufers hinter den Kulissen zwei Anfragen erstellt werden. Die erste Anfrage liefert dem Benutzer die Ergebnisse. Die zweite Anfrage wird über Mechanismen gesendet, die das neue Modell beinhalten. Jede Abweichung in den beiden Ergebnismengen wird aufgezeichnet und analysiert.
Mit der erfolgreichen Integration des neuen Modells wandert ein Produkt mit geringer Verfügbarkeit nun von einem Top-Ergebnis auf eine viel weiter unten liegende Seite.
Gelernte Lektionen
In dieser Phase hat REI ein paar wichtige Dinge aus diesem Projekt gelernt. Die erste ist, dass Datenhygiene eine große Herausforderung ist. Das Projekt deckte die Probleme auf, die REI bei der Datenverfügbarkeit außerhalb der Suche hatte. Allein diese Entdeckung war von enormem Wert.
Eine weitere Lektion ist, dass bei einem Modell, das Größe und Farbe in die Verfügbarkeit einbezieht, Produkte, die nur eine SKU haben, wie Zelte, aus dem A/B-Test entfernt werden sollten, da sie die Ergebnisse verwässern würden. Produkte mit nur einer SKU sind entweder verfügbar oder nicht, so dass sie nicht durch den Verfügbarkeitsalgorithmus laufen müssen.
Vor allem aber, so Luke Warwick, „seien Sie beharrlich. Die Einführung neuer Modelle in Ihren Relevanzalgorithmus wird auf dem Weg dorthin auf Herausforderungen stoßen, aber Beharrlichkeit wird Ihnen helfen, diese zu überwinden und Ihren Kunden letztendlich den Wert zu liefern, den sie verdienen.“