Lucene und Solr: das Java der Daten
Unter den jüngsten Technologie-Neuigkeiten (abgesehen von Windows 7 und der vorhersehbar entzückenden Apple-Riposte) sind zwei Punkte erwähnenswert, nämlich die Vorschau auf Sharepoint 2010 und die Neuigkeiten rund um die Syndizierung von Twitter durch Bing und Google. Es gibt ein einziges unterschwelliges Thema, wie Alex Williams von readwriteweb/enterprise es ausdrückt:
Wikis, Micro-Blogs und Collaboration-Technologien erhalten viel Aufmerksamkeit für ihren Einsatz im Unternehmen, aber ein Bedürfnis bleibt konstant:
Suche.
Wer auch immer die Suchschlacht gewinnt, wird mit vielen Preisen und großen Gewinnen im Unternehmen nach Hause gehen.
Williams spricht weiter über Suchfunktionen, die sich von CMS-Anbieter zu Anbieter unterscheiden, aber die Beobachtung gilt für die Unternehmens- und die Webwelt gleichermaßen. Je besser/schneller Sie Menschen mit Inhalten zusammenbringen können, desto mehr sind Ihre Inhalte wert.
In den Unternehmen erweist sich Social/Web 2.0 nicht nur als ebenso mächtig bei der Überwindung von Arbeitsgrenzen wie der Blackberry es war. Die soziale Technologie hat die Welt der Inhalte in großem Stil in Brand gesetzt – nicht nur, weil mehr Inhalte schneller verfügbar sind, sondern auch, weil die Inhalte immer vielfältiger werden. Die gleichzeitige Bewältigung von Vielfalt und Volumen bedeutet, dass die Entwickler von Suchanwendungen eine Suchanwendungsentwicklung mit immer größerer Tiefe und Flexibilität benötigen. Eine Kritik an Lucene und Solr, die ich vor allem von etablierten Suchanbietern höre, lautet: „Das ist doch nur ein Toolkit“. Das geht völlig an der Sache vorbei: Die Suche ist nicht nur ein Dienst oder eine Lösung – sie ist eine Plattform für die Anwendungsentwicklung.
In seinen Anfängen entwickelte sich Java als eine Möglichkeit, Anwendungen zu schreiben und die Heterogenität des zugrunde liegenden Netzwerks und Transaktionsraums zu überwinden. Schließlich reifte es zu den verteilten und serverseitigen Inkarnationen, in denen es wohl die meiste Produktivität bietet (wie bei seinem Microsoft-Doppelgänger Dot-net).
Dieser Übergang ist bei der Suche nun in vollem Gange. So wie Java über J2EE zu JEE und seinen SOA-Nachfolgern erblühte, so erblüht Lucene durch Solr. Durch die Bereitstellung einer tiefgreifenden, flexiblen und stabilen Plattform für die Anwendungsentwicklung können Ressourcensilos auf konsistente und leistungsstarke Weise angegangen werden und immer mehr Wert freisetzen.
Paketierte Suchanwendungen bieten viele Optionen für die Navigation in bestehenden Datenbeziehungen, aber Unzulänglichkeiten in den Such- und Abfrage-APIs erschweren es, diese Grenzen zu überschreiten – und schränken Lösungen ein, die eine Logik in die Suche einführen müssen, die über das hinausgeht, was bereits vorhanden ist. Eine neue Sache, die Sie mit Lucene und Solr leichter tun können, ist die Verwendung der neuen numerischen Suche , um eigene Geschäftsregeln für Bereiche in Daten zu kodieren. Da die Daten im Allgemeinen unstrukturiert sind und sich ständig ändern, ist die Transparenz dieser APIs ein wichtiger Vorteil, der in Paketlösungen nicht vorhanden ist.
Paketanwendungen – ob Legacy-Suchlösungen oder Back-Office-ERP – haben ihren Platz, aber wo Unternehmen sich von der Konkurrenz abheben müssen, schreiben sie ihre eigenen Anwendungen. Und mit der ganzen Kraft und Innovation von Open Source entwickelt sich die Suche von einem strukturierten, eingeschränkten Problem, das sich eng an bestehende Geschäftsprozesse hält, zu einem Problem, das selbst zu einem anpassungsfähigen Treiber von Geschäftsprozessen wird.