Lucene Solr Hardware-Roadmap
Trotz der breiten Akzeptanz der Apache Lucene- und Solr-Technologien in einer Vielzahl von Umgebungen und Inhaltstypen sind wir zu dem Schluss gekommen, dass es einen Bereich gibt, in dem die Community-Entwicklung und die kommerziellen Erweiterungen zu kurz gekommen sind: die Suche in gedrucktem, physischem Papier.
Aus diesem Grund geben wir von Lucid Imagination heute unsere Absicht bekannt, Lucene Paper Distribution zu entwickeln, eine neue Reihe von Bibliotheken für Bibliotheken, private Sammlungen, Regierungsorganisationen, Museen, Gerichte, Anwälte und Bürobedarfsfirmen, die immer noch eine Menge Material von toten Bäumen haben, das mit Tinte bedeckt und in diskrete, gebundene Bände mit Seitenzahlen und all dem guten Zeug gebunden ist.
Lucene Paper Distribution, das wir voraussichtlich in genau einem Jahr veröffentlichen werden, wird dem kleinen Teil der Bevölkerung helfen, der ohne Netzwerke, Software, Browser oder andere alltägliche Annehmlichkeiten, die bereits von modernen Lucene/Solr-Anwendungen beherrscht werden, suchen muss. Benutzer von Lucene Paper Distribution werden von neuen Analysatoren profitieren, die Folgendes analysieren können: Papier aus 100% Baumwolle und traditionelles Zellstoffpapier, serifenartige und serifenlose Schriftarten, Seitenzahlen sowohl am oberen als auch am unteren Rand der Seite und sowohl Sprechblasen als auch Gedankenblasen in Comics und Graphic Novels ab 1937. Wir erwarten auch Dateiextraktoren für gute und schlechte Schreibschrift, 8,5×11 Zoll, Rechtsformat und A4-Papier für den europäischen Markt.
Bei der Entwicklung der Lucene Paper Distributionen stehen viele wichtige Entscheidungen an. Ein großes Computerunternehmen hat angeboten, die Bibliotheken in COBOL zu entwickeln und den Code zu spenden; wir haben aber auch Beiträge von Teams bei Georgia Pacific, Hammermil und Smith Corona. Es wird eine Weile dauern, diese auszusortieren, aber bis zum 1. April 2011 sollten wir ein vollständiges Paket haben.
Lucene Paper Edition wird viele Dinge tun, um die Grenzen der Suche zu erweitern, aber es gibt einige Einschränkungen. Wir werden nicht in der Lage sein, Ihnen zu sagen, in welcher Ausgabe von Spider-Man Peter Parker Mary Jane ursprünglich um ihr erstes Date gebeten hat, wie die Lemmatisierung bei den fehlenden 18 Minuten der Watergate-Tonbandabschriften helfen könnte, warum sich jemand Texte von Madonna oder Elton John merkt, die Bedeutung der Fibonacci-Zahlen im Kochel-Katalog von Mozarts Werken, wie man obskure T-Shirts von Entwicklerkongressen der 1990er Jahre lesen kann, warum die Erfinder von OS BSD ihren Plan, es BFD zu nennen, aufgegeben haben oder was die letzten drei Worte von Carols Inschrift in Ihrem Highschool-Jahrbuch waren.
Ein letzter Hinweis: Es gibt viele weitere Anwendungsfälle, die Sie vielleicht kennen, in denen Lucene Paper Distribution sinnvoll eingesetzt werden kann. Bitte senden Sie uns diese als Kommentare zu diesem Blogbeitrag. Einsendeschluss: 1. April 2010.