Die Suche macht Geschichte
Diejenigen unter Ihnen, die den Blog von Steve Arnold nicht regelmäßig lesen, haben vielleicht diesen Artikel über Solr/Lucene im CollectionsSearchCenter verpasst, dem neuen Online-Portal des Smithsonian Instituion , das eine einfache Suche in mehr als 4,6 Millionen Museums-, Archiv-, Bibliotheks- und Forschungsbeständen und -sammlungen des Smithsonian ermöglicht, darunter fast eine halbe Million Bilder. Auf dem ResourceShelf-Blog finden Sie einen schönen Bericht des Smithsonian:
Bei der Implementierung dieses neuen Collections Search Center prüfte das Smithsonian eine Reihe von kommerziellen und Open-Source-Produkten. Zu den funktionalen Anforderungen gehörten die Unterstützung einer facettierten Metadatensuche, eine boolesche/einfache Suchlogik, die Suche nach Synonymen/Stämmen, die Suche in der Nähe, eine anpassbare Relevanzeinstufung und die Möglichkeit, Hervorhebungen anzuzeigen. Dieses System muss eine breite Palette von Dokumenten und Objekten aus Bibliotheken, Archiven und Museen unterstützen. Schließlich entschied sich das Smithsonian für die Open-Source-Indexierungssoftware Lucene/Solr.
Die Lucene/Solr-Suchmaschine bietet dem Smithsonian eine flexible und skalierbare Indexierungsumgebung zur Unterstützung der schnell wachsenden Online-Sammlungen, die im neuen Suchzentrum angeboten werden. Das Smithsonian hat die Online-Anzeige durch Programmierung in einer Java-Umgebung verfeinert und verbessert. MARC-Datensätze und SQL-Daten aus mehr als 40 Datenquellen und Datenbanken wurden extrahiert, in ein gemeinsames Datenformat überführt und in den Lucene/Solr-Index eingepflegt.
Im Zeitalter der Smartphones (lesen Sie dies auf Ihrem iPhone?) gibt es auch ein mobiles Portal, so dass Sie mit derselben URL „die Geschichte in der Hand halten“ können (entschuldigen Sie das Melodrama): http://collections.si.edu/
Wie viele Regierungs- und Forschungseinrichtungen hat auch das Smithsonian einen umfassenden Bedarf an der Indizierung und Erschließung eines sehr breiten Spektrums von Daten über die Suche. In diesem Fall soll es der Aufarbeitung der Geschichte dienen; in anderen Regierungsbehörden gibt es natürlich viele andere Anwendungsfälle. In jedem Fall ist die Nutzung von Open Source in der Bundesregierung bereits in vollem Gange.
Und falls Sie es noch nicht wussten, können Sie das Team des Smithsonian auf der kommenden Lucene Revolution Konferenz in Boston am 7. und 8. Oktober über ihre Solr-Implementierung sprechen hören (an der wir von Lucid Imagination mit Stolz beteiligt waren).(Frühbucheranmeldungen sind noch bis zum 10. Septembermöglich ).