Taming Text ist veröffentlicht!

Ein neues spannendes Buch mit dem eingängigen Titel Taming Text von Grant S. Ingersoll (ebenfalls Apache Lucene Committer), Thomas S. Morton und Andrew L. Farris wurde gerade von Manning veröffentlicht.

Die Textverarbeitung ist für Unternehmen unerlässlich geworden, um im digitalen Zeitalter wettbewerbsfähig zu bleiben, da die Menge an unstrukturierten Online-Inhalten mit der Zeit exponentiell wächst. Doch Text ist auch eine chaotische und daher schwierige Wissenschaft: Die Komplexität und die Nuancen der menschlichen Sprache folgen nicht ein paar einfachen, leicht kodifizierbaren Regeln und sind auch heute noch nicht vollständig verstanden.

Das Buch beschreibt Suchtechniken, einschließlich Tokenisierung, Indizierung, Vorschlag und Rechtschreibkorrektur. Es behandelt auch Fuzzy String Matching, Named Entity Extraktion (Personen, Orte, Dinge), Clustering, Klassifizierung, Tagging und ein System zur Beantwortung von Fragen (denken Sie an Jeopardy).

Teilen Sie das Wissen

You Might Also Like

Die Unternehmenssuche ist nicht mehr nur eine Funktion – sie entwickelt sich zur KI-Infrastrukturebene

Da Unternehmen in generative KI, Retrieval-Augmented Generation (RAG), KI-Assistenten und KI-Agenten investieren,...

Read More

Hören Sie auf, sich durch die Suche nach Teilenummern Einnahmen entgehen zu lassen

B2B-Commerce-Teams haben die letzten Jahre damit verbracht, die Suche mit KI, semantischem...

Read More

Moderne Sucherlebnisse sind zu langsam in der Einführung

Die Erwartungen an digitale Erlebnisse haben sich grundlegend geändert. Geschäftsinteressenten wünschen sich...

Read More

Quick Links