Taming Text ist veröffentlicht!

Ein neues spannendes Buch mit dem eingängigen Titel Taming Text von Grant S. Ingersoll (ebenfalls Apache Lucene Committer), Thomas S. Morton und Andrew L. Farris wurde gerade von Manning veröffentlicht.

Die Textverarbeitung ist für Unternehmen unerlässlich geworden, um im digitalen Zeitalter wettbewerbsfähig zu bleiben, da die Menge an unstrukturierten Online-Inhalten mit der Zeit exponentiell wächst. Doch Text ist auch eine chaotische und daher schwierige Wissenschaft: Die Komplexität und die Nuancen der menschlichen Sprache folgen nicht ein paar einfachen, leicht kodifizierbaren Regeln und sind auch heute noch nicht vollständig verstanden.

Das Buch beschreibt Suchtechniken, einschließlich Tokenisierung, Indizierung, Vorschlag und Rechtschreibkorrektur. Es behandelt auch Fuzzy String Matching, Named Entity Extraktion (Personen, Orte, Dinge), Clustering, Klassifizierung, Tagging und ein System zur Beantwortung von Fragen (denken Sie an Jeopardy).

You Might Also Like

Wie ein Elektronikriese Ingenieure dort trifft, wo sie sind – mit 44 Millionen Produkten im Katalog

Lernen Sie Mohammad Mahboob kennen: Ein Direktor der Suchplattform, der 44 Millionen...

Read More

Geschützt: Von der Suche zu Lösungen: Wie KI-Agenten den digitalen Handel im Jahr 2025 antreiben können

Es gibt keinen Textauszug, da dies ein geschützter Beitrag ist.

Read More

Individuelle KI-Agenten erstellen, ohne eine einzige Zeile Code zu schreiben? Ja, das haben wir getan.

Endlich eine Low-Code-KI-Plattform (wirklich kein Code), mit der die Menschen, die Ihre...

Read More

Quick Links