Top Blog-Beiträge des Jahres 2015

2015 war ein erfolgreiches Jahr für unseren Blog mit ständig neuen Beiträgen zu einer breiten Palette von Themen, die von…

2015 war ein erfolgreiches Jahr für unseren Blog mit ständig neuen Beiträgen zu einer breiten Palette von Themen, die von den klugen Köpfen hier bei Lucidworks verfasst wurden. Hier sind unsere zehn beliebtesten Blogbeiträge aus dem vergangenen Jahr:

#10. Fokus auf Suchqualität bei Lucene/Solr Revolution 2015

Mit Ted Sullivans Zusammenfassung von Revolution 2015 beginnt unser Countdown:

Ich bin gerade von der Lucene/Solr Revolution 2015 in Austin zurückgekommen und war sehr begeistert. Auf der Konferenz gab es dieses Jahr viele spannende Vorträge, aber besonders spannend fand ich den Fokus auf die Suchqualität (Genauigkeit und Relevanz), auf das Problem, aus den Abfragen auf die Absicht der Nutzer zu schließen, das Nutzerverhalten zu verfolgen und dies zur Verbesserung der Relevanz usw. zu nutzen. … Was mich wirklich beeindruckt hat, waren die verschiedenen Methoden, mit denen die Leute das gleiche Grundproblem lösen – was will der Benutzer finden?

#9. Apache Solr 5.0 Höhepunkte

Der Beitrag von Anshum Gupta, in dem er die besten Aspekte des neuen Solr beschreibt, belegte den neunten Platz:

Das mit Spannung erwartete Apache Lucene und Solr 5.0 wurde soeben veröffentlicht. Sie enthält eine Vielzahl neuer Funktionen, Stabilitätsverbesserungen und Fehlerbehebungen. Es wurden große Anstrengungen unternommen, um Solr benutzerfreundlicher zu machen, vor allem durch die Einführung von APIs und das Verbergen von Implementierungsdetails für Benutzer, die das nicht wissen müssen. Solr 4.10 wurde mit Skripten zum Starten, Stoppen und Neustarten der Solr-Instanz veröffentlicht, 5.0 geht in Bezug auf die Möglichkeiten dieser Skripte noch weiter. Die Skripte kopieren jetzt z.B. ein Configset bei der Erstellung einer Sammlung, so dass das Original nicht verändert wird. Außerdem gibt es ein Skript zur Indizierung von Dokumenten und die Möglichkeit, Sammlungen in Solr zu löschen. Das ist zum Beispiel alles, was Sie tun müssen, um SolrCloud zu starten, lucidworks.com zu indizieren, zu durchsuchen, was indiziert wurde, und die Sammlung zu löschen.

Lesen Sie den vollständigen Beitrag.

#8. Solr auf Docker

Maritjn Kosters Anleitung zur Ausführung von Solr in einem Docker-Container:

Der Einstieg in Solr ist jetzt noch einfacher: Sie können Solr auf Docker mit einem einzigen Befehl ausführen: $ docker run –name my_solr -d -p 8983:8983 -t solr

Lesen Sie den vollständigen Beitrag.

#7. Open-Source-Hadoop-Konnektoren für Solr

Cassandra Targets Beitrag zur Ankündigung unserer Open-Source-Version von Hadoop-Konnektoren:

Lucidworks freut sich, Ihnen mitteilen zu können, dass mehrere unserer Konnektoren für die Indizierung von Inhalten aus Hadoop in Solr jetzt Open Source sind. Wir haben sechs davon, mit Unterstützung für Spark, Hive, Pig, HBase, Storm und HDFS, die alle auf Github verfügbar sind. Alle funktionieren mit Solr 5.x und enthalten Optionen für Kerberos-gesicherte Umgebungen, falls erforderlich. Repo: https://github.com/Lucidworks/

Lesen Sie den vollständigen Beitrag.

#6. Solr als Apache Spark SQL-Datenquelle

Tim Potter’s Anleitung zur Verwendung von Solr als Apache Spark SQL DataSource:

Die DataSource-API bietet eine saubere Abstraktionsschicht für Spark-Entwickler zum Lesen und Schreiben strukturierter Daten von/zu einer externen Datenquelle. In diesem ersten Beitrag beschreibe ich, wie Sie Daten aus Solr in Spark lesen können. Im nächsten Beitrag beschreibe ich, wie Sie strukturierte Daten von Spark in Solr schreiben können.

Lesen Sie den vollständigen Beitrag.

#5. Hey, Sie haben Ihre Facetten in meinen Statistiken! Sie haben Ihre Facetten in meinen Statistiken!

Hoss’s Komplettlösung für Facetten und Statistiken in Solr:

Solr unterstützt grundlegende „Field Facets“ schon sehr lange. Solr unterstützt auch „Feldstatistiken“ über numerische Felder schon (fast) genauso lange. Aber ab Solr 5.0 (aufbauend auf der großartigen Arbeit, die zur Unterstützung von Distributed Pivot Faceting in Solr geleistet wurde) wird es nun möglich sein, Field Stats für jedes Constraint eines Pivot Facets zu berechnen. Heute möchte ich Ihnen erklären, was das bedeutet und wie es für Sie nützlich sein könnte.

Lesen Sie den vollständigen Beitrag.

#4. Das neue ‚bin/post‘-Dienstprogramm von Solr 5

Erik Hatchers Führung durch das neue Dienstprogramm ‚bin/post‘ von Solr 5:

Dies ist der erste Teil einer dreiteiligen Serie, in der wir Ihnen zeigen, wie Sie mit ein paar einfachen Befehlen eine echte Anwendung erstellen können. Die drei Teile sind die Eingabe von Daten in Solr mit bin/post, die Visualisierung von Suchergebnissen: /browse und darüber hinaus, die realistische Zusammenstellung: example/files – ein konkretes nützliches domänenspezifisches Beispiel für bin/post und /browse.

Lesen Sie den vollständigen Beitrag.

#3. Solr Vorschläger

Erick Ericksons erklärender Beitrag über die Verwendung des Suggesters von Solr:

Wie würde es Ihnen gefallen, wenn Ihr Benutzer „Energie“ eingibt und Vorschläge erhält wie: Energa Gedania Gdansk, Energies of God, United States Secretary of Energy, Kinetic energy. Die Solr/Lucene Suggester-Komponente kann dies schnell genug erledigen, um auch sehr anspruchsvollen Situationen gerecht zu werden. … Dank der unglaublichen Arbeit einiger Lucene-Committer gibt es seit einiger Zeit einen neuen Suggerator in der Stadt. Etwa mit Solr 4.7 oder so wurde die Unterstützung in Solr eingeführt, so dass Sie diese in solrconfig.xml konfigurieren konnten.

Lesen Sie den vollständigen Beitrag.

#2. Indizierungsleistung in Solr 5.2

Tim Potter lässt Apache Solr 5.2 durch das Solr Scale Toolkit laufen – und vergleicht es mit Solr 4.8.1 mit verblüffenden Ergebnissen – und es ist unser zweitbester Beitrag:

Mit Solr 4.8.1, das in EC2 läuft, konnte ich 130 Mio. Dokumente in einer Sammlung mit 10 Shards und einem Replikationsfaktor von 2 in 3.727 Sekunden (~62 Minuten) mit zehn r3.2xlarge-Instanzen indizieren; Einzelheiten zu dem Datensatz finden Sie in meinem vorherigen Blogbeitrag. Dies entspricht einem durchschnittlichen Durchsatz von 34.881 Dokumenten/Sekunde. Heute, unter Verwendung desselben Datensatzes und derselben Konfiguration, mit Solr 5.2.0, wurde der Auftrag in 1.704 Sekunden (~28 Minuten) abgeschlossen, was einem durchschnittlichen Durchsatz von 76.291 Dokumenten/Sek. entspricht. Um Anomalien auszuschließen, habe ich diese Ergebnisse beim Testen der Release Candidates für 5.2 mehrmals reproduziert. Der einzige nennenswerte Unterschied zwischen den beiden Tests ist, dass Lucene und Solr ein Jahr lang verbessert wurden!

Lesen Sie den vollständigen Beitrag.

#1. Solr mit Basisauthentifizierung absichern

Und der beliebteste Beitrag des Jahres 2015 war Noble Pauls Tutorial über die Absicherung von Solr mit der neuen Sicherheits-API von 5.2:

Bis zur Version 5.2 verfügte Solr über keine speziellen Sicherheitsfunktionen. Wenn Sie Ihre Solr-Installation sichern wollten, mussten Sie auf externe Tools und Lösungen zurückgreifen, die proprietär und in Ihrem Unternehmen vielleicht nicht so bekannt waren. Mit Solr 5.2 wurde eine Sicherheits-API eingeführt und Solr 5.3 wird über voll funktionsfähige Authentifizierungs- und Autorisierungs-Plugins verfügen, die Basic Authentication und „Berechtigungsregeln“ verwenden, die vollständig von ZooKeeper gesteuert werden.

Lesen Sie den vollständigen Beitrag.

Auf ein neues Jahr voller fantastischer Bloggerfreuden! Verpassen Sie keinen Beitrag mehr, indem Sie unseren Blog über Facebook, Twitter, LinkedIn oder über einen altmodischen Feed abonnieren .

You Might Also Like

Vom Suchunternehmen zum praktischen KI-Pionier: Unsere Vision für 2025 und darüber hinaus

CEO Mike Sinoway gibt Einblicke in die Zukunft der KI und stellt...

Read More

Wenn KI schief geht: Fehlschläge in der realen Welt und wie man sie vermeidet

Lassen Sie nicht zu, dass Ihr KI-Chatbot einen 50.000 Dollar teuren Tahoe...

Read More

Lucidworks Kernpakete: Branchenoptimierte KI-Such- und Personalisierungslösungen

Entdecken Sie unsere umfassenden Core Packages, die Analytics Studio, Commerce Studio und...

Read More

Quick Links