Normalisierung von Autorennamen
Das Filtern von Ergebnissen auf der Grundlage von Dokument-Metadaten ist eine wichtige Funktion eines jeden Suchdienstes. Das Feld Autor ist einer der am häufigsten verwendeten Filter in unserem Korpus, aber unsere Repositories verfügen nicht über ein Standardformat für die Speicherung dieser Informationen. Wir haben eine Lösung entwickelt, die das Feld Autor zum Zeitpunkt der Indexierung auf den ermittelten offiziellen Namen setzt, so dass die Filter einem Standardformat folgen, um die Suche für die Benutzer zu erleichtern.
Unsere Bemühungen um die Normalisierung von Autoreninformationen können uns Anregungen geben, wie wir etwas Ähnliches mit anderen Datentypen machen können.
Referent:
Michelle Gregorio, Anwendungsadministratorin, Luft- und Raumfahrt
Matthew Vu, Web Application Developer Specialist, Luft- und Raumfahrt