Box.net wechselt zu Solr – 10x schnellere Suche, Indizierung von 1 Mio. Dokumenten/Tag

Box.net, das Cloud-basierte Content-Management-System mit Sitz hier im Silicon Valley, hat kürzlich den Schalter umgelegt und ist für seine Dokumentensuche auf Solr / Lucene umgestiegen. Das ist in mehrfacher Hinsicht eine interessante Entwicklung. Box.net hat 360 Millionen Dokumente online und fügt jeden Tag etwa 1 Million Dokumente hinzu (alle neuen Dokumente werden indiziert, sobald sie eintreffen).

Erstens, wie Box.net VP of Technology Sam Ghods in seinem Blogbeitrag vor ein paar Tagen feststellt:

…sollte Ihnen sofort die rasante Geschwindigkeit von Solr auffallen. Schnelle Suchergebnisse sind in weniger als einer halben Sekunde verfügbar, und vollständige Suchergebnisse brauchen nicht viel länger. Zweitens erfolgt die Volltextindizierung für alle Ihre neu hochgeladenen Dateien jetzt in weniger als 20 Minuten, so dass Sie die Dokumente noch schneller finden können. Außerdem sind wir dazu übergegangen, das Apache Tika-Projekt für die Textextraktion zu verwenden, was eine extrem genaue Indizierung ermöglicht. Erwarten Sie, dass sich diese Geschwindigkeiten im Laufe der Zeit noch weiter erhöhen werden, da wir die Architektur iterieren und verbessern.

Und am wichtigsten ist, dass die neue Suchplattform nicht nur in Bezug auf die schiere Datenmenge, die sie indiziert, skalierbar ist, sondern auch in Bezug auf die anspruchsvollen Funktionen, die wir darauf aufbauen können. Wir freuen uns darauf, in den nächsten Monaten einige erweiterte Suchoptionen zu entwickeln und einzuführen.

Ein vielleicht noch wichtigerer Aspekt der Geschichte ist die immer breitere Verfügbarkeit von Alternativen für Unternehmen, die sich auf Microsoft-Technologien und Content-Management-Strategien konzentrieren. Zusammen mit unserer heutigen Ankündigung von Lucidworks Enterprise Release 1.8 mit Unterstützung für die Indizierung von Sharepoint ACL sieht die Bandbreite der verfügbaren Lösungen ziemlich gut aus.

Share the knowledge

You Might Also Like

Die Geschichte von Cyber 5 2025 dreht sich um Veränderung: Mobile und KI-gestützte natürlichsprachliche Suche definieren das Weihnachtsgeschäft neu

Der Zeitraum vom Black Friday bis zum Cyber Monday gibt Aufschluss darüber,...

Read More

Einführung von Lucidworks Dynamic Index

Lucidworks Dynamic Index™ ist eine Personalisierungs-Engine zur Abfragezeit, die jedem Kunden sofort...

Read More

Lucidworks zum Leader ernannt: Was das für die Suche, KI und Ihr Unternehmen bedeutet

Die Anerkennung von Lucidworks als Leader signalisiert, dass Unternehmenssuche und KI heute...

Read More

Quick Links