Taming Text ist veröffentlicht!

Ein neues spannendes Buch mit dem eingängigen Titel Taming Text von Grant S. Ingersoll (ebenfalls Apache Lucene Committer), Thomas S. Morton und Andrew L. Farris wurde gerade von Manning veröffentlicht.

Die Textverarbeitung ist für Unternehmen unerlässlich geworden, um im digitalen Zeitalter wettbewerbsfähig zu bleiben, da die Menge an unstrukturierten Online-Inhalten mit der Zeit exponentiell wächst. Doch Text ist auch eine chaotische und daher schwierige Wissenschaft: Die Komplexität und die Nuancen der menschlichen Sprache folgen nicht ein paar einfachen, leicht kodifizierbaren Regeln und sind auch heute noch nicht vollständig verstanden.

Das Buch beschreibt Suchtechniken, einschließlich Tokenisierung, Indizierung, Vorschlag und Rechtschreibkorrektur. Es behandelt auch Fuzzy String Matching, Named Entity Extraktion (Personen, Orte, Dinge), Clustering, Klassifizierung, Tagging und ein System zur Beantwortung von Fragen (denken Sie an Jeopardy).

You Might Also Like

Wie Lenovo die Suche zu einem strategischen Wachstumstreiber in der KI-Ära machte

Erfahren Sie, wie Lenovo mit Lucidworks die Suche in einen strategischen Wachstumstreiber...

Read More

Der Stand der generativen KI 2025: 3 Fragen, um Ihre Bereitschaft für agenturische KI zu verstehen

Wie gut sind Unternehmen auf agentenbasierte KI vorbereitet? Die Daten von Lucidworks...

Read More

Wir geben unsere Gewinner des Superstars of Search Award 2025 bekannt: Mouser, TE, und Coppel

Wir feiern 3 unglaubliche Lucidworks-Kunden, die ihre Sucherfahrung verändert und hervorragende Geschäftsergebnisse...

Read More

Quick Links