Ecommerce Produktentdeckung als Gespräch: Verbesserte Erfahrung durch Signale

Man kann sich die Produktfindung im E-Commerce wie ein Gespräch zwischen einem Käufer und dem Produktfindungssystem vorstellen. Die Signale sind die Niederschrift des Gesprächs, aber die Niederschrift lässt oft potenziell nützliche Informationen aus. Wenn wir uns eine genauere, vollständigere Transkription des Gesprächs ansehen, eröffnen sich uns Möglichkeiten, das Vertrauen des Käufers in das System zu stärken und den Weg zum Ziel zu verkürzen. Wir werden uns einige dieser Möglichkeiten und die Arten von Signalen ansehen, die sie erleichtern.
Zielpublikum
Merchandiser, Suchentwickler und -architekten, Datenwissenschaftler, Führungskräfte im E-Commerce
Teilnehmer nehmen mit
Erfahren Sie, wie andere Signale als die typischen Impression/Klick/Karte/Kauf-Ereignisse genutzt werden können, um ein ansprechenderes Produkterlebnis zu schaffen.
Sprecher
Eric Redman, leitender Sucharchitekt, Digitaler Handel, Lucidworks
[Eric Redman]
Hallo, mein Name ist Eric Redman, und heute werde ich über Produktentdeckungssignale sprechen. Wir beginnen damit, uns ein wenig an die Signaltheorie zu erinnern, und dann, das verspreche ich Ihnen, kommen wir zu einigen Ideen für praktische Anwendungen, an die wir vielleicht nicht denken würden, wenn wir nicht zur Theorie zurückkehren und uns an den großen Rahmen der Signaltheorie erinnern würden.
Und die Signaltheorie ist der Grund, warum wir das Wort Signale verwenden. Wir haben es uns nicht nur im elektronischen Handel ausgedacht.
Lassen Sie mich also mit der Idee der Informationsasymmetrie beginnen. Die Idee der Informationsasymmetrie und der Signaltheorie ist, dass dies die Motivation für Signale ist. Eine Partei signalisiert einer anderen, weil die beiden Parteien nicht dieselben Informationen haben. Im E-Commerce weiß der Käufer beispielsweise mehr über sein Ziel, das er zu erreichen versucht, als der Einzelhändler, und der Einzelhändler weiß mehr über seinen Produktkatalog und die Qualität seiner Produkte und darüber, was andere Käufer getan haben, als der Käufer.
Es besteht also eine Informationsasymmetrie, und sie signalisieren sich gegenseitig. In der Theorie wird versucht, diese Informationsasymmetrie zu berücksichtigen, damit sie sich gegenseitig helfen können. Auf diesem Foto haben wir diese grüne Orchideenbiene und es stellt sich heraus, dass es eine Menge grüner Orchideenbienen gibt und dass sie eigentlich verschiedene Arten sind. Sie können sich dadurch unterscheiden, dass eine Bienenart eine bestimmte Art von Orchideen bevorzugt. Sie sammeln also den Duft dieser Orchidee in Beuteln an ihren Hinterbeinen und geben diesen Duft dann während des Paarungsrituals weiter, so dass andere Bienen die Informationsasymmetrie überwinden können: Ist das eine andere Bienenart oder ist das die gleiche wie ich?
Und dieser Duft ist das Signal, das ihnen hilft, die Hürde der Asymmetrie zu überwinden. Und diese Idee der Information, sorry, der Signaltheorie und der Informationsasymmetrie, taucht überall in verschiedenen Disziplinen auf, z.B. in der Evolutionsbiologie, die wir gerade berühren, in der Wirtschaft und so weiter.
Ein weiteres Konzept, das in der Signaltheorie auftaucht, ist die Idee der kostspieligen Signale. Also eine Theorie innerhalb einer Theorie, wenn Sie so wollen, oder verwandte Theorien.
Die Theorie der kostspieligen Signale besagt, dass ein Signal, das schwierig zu produzieren, d.h. kostspielig ist, für einen unehrlichen Signalgeber noch kostspieliger ist. Die Theorie besagt also, dass die Empfänger von Signalen dazu neigen, teuren Signalen mehr zu vertrauen als leicht zu produzierenden Signalen. Und im E-Commerce werden wir darüber noch ein wenig sprechen. Es gibt definitiv unterschiedliche Kosten für die Erzeugung von Signalen und ich werde speziell auf Käufer eingehen, die teure Signale erzeugen.
Nun gut, wir haben über die Signaltheorie gesprochen und die Idee, dass sie durch Informationsasymmetrie motiviert ist und dass es kostspielige Signale gibt, die Vertrauen schaffen. Und jetzt möchte ich daran erinnern, dass Signale in einem Umfeld auftreten, sie sind nicht isoliert. Und ich glaube, wir denken zu oft isoliert über ein Signal nach, z.B.: Was bedeutet dieses einzelne Signal oder ein Stück Daten? Wie können wir darauf reagieren?
Aber eigentlich müssen wir alle Signale in dem Umfeld berücksichtigen, in dem sie auftreten, um wirklich den besten Sinn aus den Signalen zu ziehen. Übertragen wir das also auf das Umfeld des E-Commerce und kommen wir nun zu einigen umsetzbaren Erkenntnissen, zu Dingen, die wir mit diesen Ideen tatsächlich tun können.
In der E-Commerce-Umgebung machen wir also den Fehler, dass wir versuchen, ein einzelnes Signal zu interpretieren. Ein Beispiel ist die Frage, welche Gewichtung wir einem Einkaufswagen zuweisen sollten. Oft haben wir einige Eingaben in ein Modell, und wir gewichten Klicks, Warenkörbe und Käufe, aber ich behaupte, dass es nicht so einfach ist. Ein Einkaufswagen verdient vielleicht mehr Gewicht als ein anderer, denn was passiert, wenn das Produkt, das in den Einkaufswagen gelegt und dann gekauft wurde, später zurückgegeben oder einfach aus dem Einkaufswagen entfernt wird? Was ist, wenn der Käufer dieses Produkt schon einmal hergestellt hat? Vielleicht sollte das ein anderes Gewicht haben als der erste Kauf dieses Produkts. Was befindet sich noch im Warenkorb, wenn wir das Produkt in den Warenkorb legen?
Und an welcher Position wurde das Produkt in einem Suchergebnis gefunden, bevor es in den Warenkorb gelegt wurde. Vielleicht gibt es da etwas, auf das wir achten sollten. Vielleicht ist es ein teureres Signal, wenn jemand erst nach unten scrollen und etwas finden muss, bevor er es in den Warenkorb legt.
Lassen Sie uns also über hartnäckige Einkäufer sprechen. Versuchen Sie nicht, das nachzuschlagen, ich habe mir diese Bezeichnung ausgedacht. Was meine ich also mit einem hartnäckigen Käufer? Ich werde auf der nächsten Folie näher darauf eingehen, aber das ist der Käufer, der nicht aufgibt. Sie geben sich wirklich Mühe. Was können wir also mit den kostspieligen Signalen tun, die diese hartnäckigen Käufer erzeugen? Nun, eine Sache ist vielleicht, bessere semantische Modelle zu trainieren. Ich will nicht sagen „vielleicht“, aber wir können auf jeden Fall das Training semantischer Modelle verbessern, wie z.B. das Modell, das wir in Never Null bei Lucidworks verwenden. Wir könnten möglicherweise die Wiedererkennung verbessern oder sogar eine Produktklassifizierung ergänzen, denn diese hartnäckigen Käufer verraten uns etwas. Was sagen sie uns also?
Wenn ein Shopper, wie ein hartnäckiger Shopper, sucht und nicht findet, was ihm gefällt. Sie haben die Suche abgebrochen, sie haben das Stöbern abgebrochen, aber sie geben nicht auf, sie versuchen es weiter. Und schließlich kaufen sie etwas ein. Woran können wir also erkennen, dass dies ein kostspieliges Signal der Relevanz ist?
Denn wenn wir diese Signale zusammenfassen, d.h., nehmen wir nur das Beispiel des Suchabbruchs, dann nehmen wir alle Kunden, die eine Suche abgebrochen haben, und dann haben wir vielleicht noch einige andere Regeln darüber, wie viel Zeit vergeht und welche Dinge zwischen dem Abbruch der Suche und dem Kauf eines Produkts passieren. Wenn wir all diese Signale zusammennehmen, sind dies Stimmen für das, was bei der Suche hätte erscheinen sollen, oder mit anderen Worten Stimmen für die Relevanz.
Hier also ein Beispiel. Nehmen wir an, ich suche nach Freizeit-Sneakern und schaue mir dieses eine Produkt an und igitt, es gefällt mir nicht, aber ich bin ein hartnäckiger Käufer, ich gebe diesen Händler nicht auf. Vielleicht bin ich diesem Händler aus irgendeinem Grund treu oder ich habe von etwas gehört, das er im Angebot hat, und bin zu dem Schluss gekommen, dass ich hier einfach nicht richtig suche. Also versuche ich eine andere Suche. Ich entspanne meine Suche und suche einfach nur nach Sneakers.
Und jetzt sehe ich, okay, ich sehe ein Produkt, das mich interessieren könnte, und ich kaufe es ein. Nehmen wir also an, dass dieses Signal im Laufe eines Monats von 100 Käufern genutzt wurde. Das ist ein ziemlich starkes Signal und ein kostspieliges Signal, denn diese hundert Suchenden mussten sich ziemlich anstrengen, um zu diesem Punkt zu gelangen und zusätzliche Arbeit zu leisten. Das ist also ein kostspieliges Signal, das darauf hindeutet, dass dieses bestimmte Paar Schuhe, dieses Produkt, nach Meinung dieser Nutzer als Freizeit-Sneaker eingestuft werden sollte.
Das sollten wir also berücksichtigen, wenn wir Modelle für das Ranking trainieren. Aber wir könnten uns auch überlegen, ob dies uns helfen kann, Produkte auf der Grundlage dieser kostspieligen Signale von Käufern zu klassifizieren.
Was sind also die Schlussfolgerungen? Hartnäckige Shopper-Muster können also in Protokollen identifiziert werden. Wir können diese Muster erkennen und sie können komplexer sein als das einfache Beispiel, das ich gerade gegeben habe. Und die Signale in ihrer Gesamtheit sind wie Stimmen für Relevanz, Stimmen für Relevanz, in einem bestimmten Kontext, wie einer Suchanfrage oder einer Kategorie, was auch immer. Es gibt also einige potenzielle Verwendungsmöglichkeiten für diese Signale, die ich gerade erforsche. Und zwar, wie ich bereits erwähnt habe, zur Verbesserung der Ausbildung semantischer Modelle.
Wir untersuchen also, wie wir die Signale dieser hartnäckigen Käufer gewichten, ihnen etwas mehr Gewicht verleihen und die Dinge in diese Richtung lenken können. Vielleicht können wir auf der Grundlage dieser Signale, die wir von den hartnäckigen Käufern erhalten, Produkte zu den Suchergebnissen in den Suchkategorien hinzufügen, um die Erinnerung an die Suche und das Stöbern zu verbessern. Und damit verbunden könnten wir dies hinter den Kulissen nutzen, um Kataloge zu erweitern oder die Klassifizierung von Produkten auf der Grundlage dieser Art von Signalen zu verbessern.
Okay, kontrafaktisch. Ein interessantes Wort, das sich so anhört, als ob ich etwas Zeit damit verbringen müsste, es zu lernen, aber eigentlich bedeutet kontrafaktisch einfach, dass man die Sache betrachtet, die nicht passiert ist. Wir versuchen also, Vorhersagen darüber zu treffen, wie die Welt aussähe, wenn das, was nicht passiert ist, passiert wäre. Die Motivation hier ist also, dass wir Protokolle von Signalen aus bestehenden Modellen verwenden wollen. Also Ihre Signale von Ihrem Produktentdeckungssystem, wie auch immer es heute funktioniert. Wir wollen ein neues und verbessertes Modell trainieren. Aber wir wollen einen Weg finden, wie wir dieses neue Modell trainieren können, ohne die aktuellen Käufer zu beeinträchtigen. Wir probieren also nicht nur neue Modelle aus.
Und es gibt ein Problem mit dem Training, ein neues Modell aus einem alten Modell und Sie neigen dazu, einfach zum Verhalten des alten Modells zurückzukehren, es sei denn, Sie gehen die Probleme an, über die ich auf der nächsten Folie sprechen werde. Und drittens suchen wir immer nach Möglichkeiten, das Kaltstartproblem oder die Kaltstartvorurteile gegenüber neuen Produkten zu entschärfen. Sie haben keine Signale, wie können wir damit umgehen?
Also kontrafaktisch, und hier spreche ich über ein Prinzip namens Counterfactual Risk Minimization oder CRM. Das Bild eines Buches über kontrafaktische Vorstellungskraft in der Geschichte soll Sie daran erinnern, dass es sich hierbei nicht um ein hochtrabendes Konzept handelt. Einige der Algorithmen sind, wie üblich, anfangs etwas schwer zu verstehen, aber die Idee ist, wie hätte etwas abgeschnitten, wenn es anstelle des aktuellen Rankingsystems eingesetzt worden wäre.
Das Problem dabei ist jedoch, dass diese Protokolle des bestehenden Systems die Verzerrungen des aktuellen Modells widerspiegeln. Sie haben also vielleicht ein Modell, das nicht auf Positionsverzerrungen oder andere Arten von Verzerrungen eingeht. Wie können wir also ein neues Modell auf diesen Signalen trainieren und gleichzeitig das Problem der Verzerrung, insbesondere der Positionsverzerrung, angehen?
Und auch die Tatsache, dass die Protokolle des aktuellen Systems uns nur etwas über Neigungen sagen können, die mit dem zu tun haben, was das aktuelle System gezeigt hat oder wie sich das aktuelle System verhalten hat. Dieses Problem ist also ein Problem der partiellen Information und bereitet uns allerlei Kopfzerbrechen. Es hat auch mit Selektionsverzerrungen zu tun.
Nehmen wir also ein Beispiel. Ich stöbere nach Herrenhemden und weil ich ein hartnäckiger Käufer bin, lande ich auf Seite vier und sehe dieses Hemd, das mir gefällt oder das ich in den Warenkorb legen möchte, und es ist neu. Vielleicht ist es deshalb auf Seite vier. Wie können wir nun diesem Produkt bei seinem Kaltstartproblem helfen? Wie viele Menschen werden hartnäckig sein und dann auf Seite vier kommen und dieses Hemd bemerken?
Nun, eine Idee ist, dass wir ein ähnliches Hemd auf Seite eins haben, das Signale aufweist. Ich weiß, dass das Hemd kein großartiges Beispiel für Ähnlichkeit ist, der Preis ist ziemlich unterschiedlich, aber nehmen wir einfach an, dass es sehr ähnlich ist. Wenn wir dann feststellen, dass diese beiden Produkte ähnlich sind, können wir, sagen wir mal, dem neuen Produkt einen angemessenen Boost geben, der auf einer gewissen Gewichtung der Signale basiert, die mit diesem ähnlichen Produkt hier verbunden sind.
Vielleicht verwenden wir also eine semantische Ähnlichkeit, die mit der Beschreibung der Hemden zu tun hat, der textlichen Beschreibung, oder vielleicht eine visuelle Ähnlichkeit, oder vielleicht beides, und wir können die Signale des ähnlichen Produkts verwenden, das häufig beobachtet wird oder häufig auf der ersten Seite vertreten ist. Und vielleicht gewichten wir diese, so dass wir diese Signale ein wenig abwerten, aber das ist eine Möglichkeit, diesem Hemd einen Anfang zu geben, damit es nicht für immer auf Seite vier vergraben bleibt.
Für die kontrafaktischen Modelle gibt es eine spezielle Idee oder ein Prinzip, das wir als kontrafaktische Risikominimierung bezeichnen. Dabei geht es darum, neue Modelle zu trainieren und gleichzeitig die Verzerrungen des bestehenden Modells zu beseitigen, falls das ein Wort ist. Und um dies zu erreichen, gibt es einige Techniken der kontrafaktischen Risikominimierung. Eine davon ist, dass wir ein Konzept für die Wahrscheinlichkeit oder die Wahrscheinlichkeit, dass ein Produkt beobachtet wird, haben müssen, wenn man bedenkt, wie dieses Produkt eingestuft wird und wie es reagiert. Es könnte also sein, dass das bestehende Modell – und das passiert ständig – dem nicht wirklich Beachtung schenkt. Es kümmert sich nicht darum, herauszufinden, was diese Verzerrung im System ist.
Daher ist die Schätzung von Positionsverzerrungen in einem bestehenden Aufzeichnungssystem ein wichtiger Bestandteil des CRM. Nun, wir können dieses Konzept herausnehmen. Wir müssen nicht alle Elemente von CRM befolgen. Wir können diese eine Idee herausnehmen und sie auch auf andere Weise anwenden. Ein Beispiel dafür wäre, wenn wir Trainingsdaten für ein semantisches Modell erzeugen, sagen wir. Wenn wir uns die Mühe gemacht haben, eine zuverlässige Schätzung des Einflusses oder der Verzerrung auf der Grundlage der Position eines Produkts in einer Auflistung vorzunehmen, dann können wir die Daten aus den Protokollen nehmen und Trainingsdaten erstellen, die weniger verzerrt sind, um sie in unsere semantischen Modelle einzuspeisen. Diese Idee der Beobachtungsneigung ist also das, worüber ich hier spreche.
Und schließlich können wir mit Hilfe semantischer Modelle versuchen, die Leistung eines häufig beobachteten Produkts mit einem neuen Produkt zu verknüpfen, um das Problem des Kaltstarts, mit dem wir oft konfrontiert sind, zu entschärfen. Navigationssignale. Hier geht es um die Idee, dass wir richtigerweise eine Menge Aufmerksamkeit auf Engagement- und Konversionssignale richten, die mit Produkten, Klicks, Warenkörben, Käufen, Entfernen aus dem Warenkorb und solchen Dingen zu tun haben. Aber ich behaupte hier, dass auch Navigationssignale wie die Auswahl von Menüpunkten und Verfeinerungen und so weiter wichtig sind. Und das können wir uns zunutze machen. Wir werden darüber sprechen, wie wir das bewerkstelligen können.
Hier ein Beispiel für das Durchsuchen einer Kategorie, Filter, das sind eigentlich Luftfilter für Öfen und so weiter. Ich habe also diese Suche durchgeführt und zeige Ihnen hier in zwei Spalten die Verfeinerungen, die mir angezeigt wurden. Eigentlich ist es eine lange Spalte, aber ich habe sie teilweise abgeschnitten, um Ihnen zu zeigen, wie viele es sind, und ich konnte sie nicht alle unterbringen. Ich zeige Ihnen nur einen Teil davon, aber es waren 19 Facetten in dieser Antwort.
Und Junge, das ist eine Menge Scrollen, um zu sehen, welche Auswahlmöglichkeiten es gibt, um die Ergebnisse einzugrenzen. Und das ist natürlich wichtig, wenn Sie viele Produkte haben. Sie sehen an der Anzahl der Facetten hier, dass wir Hunderte von Filtern haben, die Sie berücksichtigen müssen.
Betrachten wir also, wie diese Facetten verwendet werden, bevor es zu einem Engagement oder einer Konversion kommt, wie z.B. das Hinzufügen zum Warenkorb. Betrachten wir dies als ein Votum für die Wichtigkeit oder Nützlichkeit der jeweiligen Facette, die angewandt wurde, und erwägen wir, diese Facetten an die Spitze der Liste zu setzen. Wir könnten sogar einige dieser Facetten herausfiltern, wenn wir feststellen, dass sie einfach nicht genutzt werden. Diese Art von Signal können wir also in unseren Protokollen identifizieren, wenn Sie ein Suchmuster sehen, und Sie können die Aktionen in dieser Such-Sitzung verfolgen, aber auch Dinge, die innerhalb dieser Kategorie passiert sind, und Signale für Engagement und Konversion finden, die nach der Anwendung bestimmter Verfeinerungen auftreten, und überprüfen, ob Sie diese Verfeinerung nicht verlassen haben und so weiter.
Das ist also ein Signal für die Nützlichkeit dieser Facette, aber diese Art der Interaktion leidet wahrscheinlich unter der gleichen Art von Positionsverzerrung, wie wir sie bei Produktauflistungen haben. Wenn das derzeitige System die Facetten in einer festen Reihenfolge präsentiert, sagen wir mal alphabetisch, dann könnte es sein, dass die A-, B- und C-Facetten sehr viel häufiger genutzt werden als die anderen. Wir brauchen also eine Möglichkeit, diese Art von Verzerrung der Position zu berücksichtigen und diese Signale angemessen zu gewichten, damit wir nicht nur wiederholen, was bereits vorhanden ist. Was ich jetzt untersuche, ist die Frage, wie sich die Neueinstufung der Facetten tatsächlich auswirkt. Es ist großartig, wenn wir versuchen, die Facetten, die für unsere Kunden am nützlichsten sind, ganz nach oben zu bringen. Das beseitigt einige Reibungsverluste, so dass sie sich nicht so sehr anstrengen müssen, um das zu finden, was sie brauchen, aber lassen Sie uns die tatsächlichen Auswirkungen davon messen. Es ist also wichtig, herauszufinden, wie man das macht und wie man Verzerrungen berücksichtigen kann.
Okay, das sind drei Ideen, wie die Signaltheorie uns helfen kann, verschiedene Wege zu beschreiten und Erfahrungen zu verbessern, an die wir vielleicht nicht gedacht hätten. Diese Artikel sind für mich faszinierend und haben mit den Dingen zu tun, über die wir gerade gesprochen haben. Ich hoffe also, dass Sie einige davon auch interessant finden werden. Ich danke Ihnen.