Heavy Metal, Zend_Lucene, und Solr
Wir werden oft gefragt: „Was können Sie uns über den Wechsel von [HIER KOMMERZIELLEN SUCHSOFTWAREANBIETER EINFÜGEN] zu Solr/Lucene erzählen?“ Wir haben an verschiedenen Stellen auf unterschiedliche Weise darüber gesprochen (einer hier und ein anderer hier, und mehr hier). Natürlich gibt es unabhängig vom Anwendungsfall oder der Umgebung einige gute Dinge zu beachten, aber in vielerlei Hinsicht ist die Entwicklung von Suchanwendungen eher mit der Zoologie als mit der Physik vergleichbar: Es gibt eine unendliche Vielfalt an Arten, und eine genaue Beobachtung und Analyse der natürlich vielfältigen Welt lohnt die Mühe. Ein interessanter Beitrag von David Buchmann von der europäischen agilen Entwicklungswerkstatt Liip über ein Projekt, bei dem sie von der Google Search Appliance auf Zend_Lucene umgestiegen sind. Bemerkenswerte Auszüge:
… wir haben binäre Dokumente wie PDF, Word und so weiter. Es gab keine Möglichkeit, die Metainformationen für diese Dokumente festzulegen. requiredfields=gsahintview:group1|-gsahintview sollte einen Filter auslösen, der besagt, dass wir entweder die Metainformationen mit einem bestimmten Wert oder überhaupt keine Metainformationen haben. Google hat jedoch bestätigt, dass diese Kombination von Filterausdrücken nicht möglich ist. … Der Support von Google war ein sehr positiver Aspekt. Sie haben schnell und unbürokratisch geantwortet und waren motiviert zu helfen. Sie schienen kompetent zu sein – wenn sie also keine Alternativen vorschlugen, sondern einfach sagten, dass es diese Funktion nicht gibt, gab es wohl wirklich keine Alternative für unsere Funktionswünsche.
Seufz. Geschlossene Quellen sind schwer, wenn sie mit Metall ummantelt sind. Eine weitere Beobachtung:
Zend_Lucene hat sich für uns ganz gut bewährt, obwohl ich heute wahrscheinlich Apache Solr verwenden würde, um Arbeit zu sparen, insbesondere beim Lesen von Dokumenten und beim Stemming.
Ich bin immer wieder erstaunt über Fälle, in denen sich Entwickler für Lucene entscheiden, dann aber zu Solr zurückkehren. Natürlich glauben wir, dass Lucidworks Enterprise diese Entscheidung noch weiter vereinfachen kann, da es eine Möglichkeit bietet, bessere Solr-Anwendungen schneller zu entwickeln.
Lesen Sie den ganzen Beitrag hier. Es kommt natürlich auf den Einzelfall an, aber ich denke, Sie werden die Erkenntnisse nützlich finden.