Taming Text ist veröffentlicht!

Ein neues spannendes Buch mit dem eingängigen Titel Taming Text von Grant S. Ingersoll (ebenfalls Apache Lucene Committer), Thomas S. Morton und Andrew L. Farris wurde gerade von Manning veröffentlicht.

Die Textverarbeitung ist für Unternehmen unerlässlich geworden, um im digitalen Zeitalter wettbewerbsfähig zu bleiben, da die Menge an unstrukturierten Online-Inhalten mit der Zeit exponentiell wächst. Doch Text ist auch eine chaotische und daher schwierige Wissenschaft: Die Komplexität und die Nuancen der menschlichen Sprache folgen nicht ein paar einfachen, leicht kodifizierbaren Regeln und sind auch heute noch nicht vollständig verstanden.

Das Buch beschreibt Suchtechniken, einschließlich Tokenisierung, Indizierung, Vorschlag und Rechtschreibkorrektur. Es behandelt auch Fuzzy String Matching, Named Entity Extraktion (Personen, Orte, Dinge), Clustering, Klassifizierung, Tagging und ein System zur Beantwortung von Fragen (denken Sie an Jeopardy).

Share the knowledge

You Might Also Like

Warum die besten Unternehmen der Welt Lucidworks für die Suche wählen und warum das jetzt wichtig ist

Die Suche hat sich in aller Stille zu einem der strategischsten Systeme...

Read More

Menschen können menschlich sein, Lucidworks kümmert sich um den Rest

Das moderne digitale Erlebnis muss für die Menschen so gestaltet werden, wie...

Read More

Die Geschichte von Cyber 5 2025 dreht sich um Veränderung: Mobile und KI-gestützte natürlichsprachliche Suche definieren das Weihnachtsgeschäft neu

Der Zeitraum vom Black Friday bis zum Cyber Monday gibt Aufschluss darüber,...

Read More

Quick Links