Taming Text ist veröffentlicht!

Ein neues spannendes Buch mit dem eingängigen Titel Taming Text von Grant S. Ingersoll (ebenfalls Apache Lucene Committer), Thomas S. Morton und Andrew L. Farris wurde gerade von Manning veröffentlicht.

Die Textverarbeitung ist für Unternehmen unerlässlich geworden, um im digitalen Zeitalter wettbewerbsfähig zu bleiben, da die Menge an unstrukturierten Online-Inhalten mit der Zeit exponentiell wächst. Doch Text ist auch eine chaotische und daher schwierige Wissenschaft: Die Komplexität und die Nuancen der menschlichen Sprache folgen nicht ein paar einfachen, leicht kodifizierbaren Regeln und sind auch heute noch nicht vollständig verstanden.

Das Buch beschreibt Suchtechniken, einschließlich Tokenisierung, Indizierung, Vorschlag und Rechtschreibkorrektur. Es behandelt auch Fuzzy String Matching, Named Entity Extraktion (Personen, Orte, Dinge), Clustering, Klassifizierung, Tagging und ein System zur Beantwortung von Fragen (denken Sie an Jeopardy).

Share the knowledge

You Might Also Like

Die Geschichte von MCP und ACP: Woher kommen diese Ideen und wer treibt ihre Einführung voran?

Im vergangenen Jahr haben zwei Akronyme das KI-Handbuch für Unternehmen neu geschrieben:...

Read More

KI-Suche bringt alles durcheinander. Was B2B-Marketingleiter als erstes tun sollten.

Die generative KI hat nicht nur die Suche verändert. Sie hat verändert,...

Read More

Wird ACP der „neue Checkout-Button“ werden? Was Unternehmen wissen müssen

Im digitalen Handel gibt es alle paar Jahrzehnte eine einzige Innovation, die...

Read More

Quick Links