Suche nach Ersthelfern: Interview mit Forensic Logic CTO Ron Mayer
Die Suche hat zweifellos eine herausragende Rolle bei der nationalen Sicherheit gespielt, mit vielen Diskussionen über viele Kanäle an der Informationsgrenze, ob es nun darum geht, die Nadel im Heuhaufen in den sozialen Medien zu finden oder die Schreibweisen verschiedener „Personen von Interesse“ in verschiedenen Mitteilungen zu vergleichen. Aber die Suche spielt eine nicht minder wichtige Rolle in Fragen der inneren Sicherheit, bis hin zur lokalen Ebene.
Der jüngste Beitrag auf Steve Arnolds Beyond Search lenkt das Augenmerk auf Ron Mayer von Forensic Logic, einem Unternehmen, das sich auf Technologien für die Strafverfolgung und insbesondere auf die Anwendung der Open-Source-Suche Lucene/Solr spezialisiert hat.
In vielerlei Hinsicht sind die Probleme, mit denen die Suche in der Strafverfolgung konfrontiert ist, eng mit Anwendungsfällen aus anderen Bereichen verknüpft. Hier sind ein paar Auszüge aus dem Interview:
Es gibt viele Faktoren, die dazu beitragen, wie relevant eine Suche für einen Nutzer der Strafverfolgungsbehörden ist. Natürlich spielen traditionelle Faktoren der Textsuche wie die Dichte der Schlüsselwörter und die exakte Übereinstimmung der Suchbegriffe eine Rolle. Es ist wichtig, wie lange ein Vorfall zurückliegt (ein kürzlich begangenes ähnliches Verbrechen ist interessanter als ein lange zurückliegendes ähnliches Verbrechen). Und auch der Ort ist wichtig. Die meisten Polizeibeamten sind wahrscheinlich eher an Verbrechen interessiert, die in ihrem Zuständigkeitsbereich oder in benachbarten Zuständigkeitsbereichen geschehen. … Auch die Qualität der Daten macht die Sache interessant. Opfer haben oft vage Beschreibungen von Tätern, und Verdächtige lügen. Wir versuchen, unser System so zu programmieren, dass eine Suche nach „einem großen, dünnen, männlichen Teenager“ mit einem Vorfall übereinstimmt, bei dem „ein 17-jähriger Junge von 1,83 m und 150 kg“ erwähnt wird.
Für diejenigen unter Ihnen, die sich in den 1980er Jahren wegen der Gefahr von Überfällen zweimal überlegen mussten, New York City zu besuchen:
Die Informationstechnologie hat sich in der Strafverfolgung stetig weiterentwickelt, wie z.B. bei CompStat der Stadt New York. …Wir haben uns mit der CompStat-Gruppe des NYPD getroffen, und sie hat uns zu einer Reihe von Funktionen in unserer Software inspiriert, u.a. zur Erstellung der CompStat-Berichte für einige unserer Kunden. Eines der größten Probleme im Bereich der Strafverfolgungsdaten ist heute die Zusammenführung von Daten aus verschiedenen Quellen und die sinnvolle Nutzung dieser Daten. Bei diesen Quellen kann es sich um verschiedene Systeme innerhalb einer einzelnen Behörde handeln, wie z.B. Aktenverwaltung und CAD-Systeme (Computer Aided Dispatch) und interne E-Mail-Listen der Behörde – oder um Gruppen von Städten, die Daten untereinander austauschen – oder um Bundesbehörden, die Daten mit staatlichen und lokalen Behörden austauschen. … Der Ort, an dem die Flexibilität von Solr/Lucene für uns wirklich glänzte, ist unser Produkt, das strukturierte, halbstrukturierte und völlig unstrukturierte Daten zusammenführt.
Da die öffentliche Sicherheit auf dem Spiel steht, ist die Herausforderung, eng gruppierte Ergebnisse schnell an die Spitze einer Ergebnisliste zu bringen, umso größer.
Möchten Sie mehr erfahren? Ron Mayer wird auf der Lucene Revolution 2011, die am 25. und 26. Mai in San Francisco stattfindet, über Highly Relevant Search Result Ranking for Law Enforcement sprechen.