Eine neue Technologie, die eine schnellere Reaktion auf Kriminal Berichte ermöglicht

IMC, März 2018

Wenn ein Vorfall auftritt, gibt es eine große Menge an Informationen und Daten, die von Strafverfolgungsbehörden (Leash) verarbeitet werden muss. Um eine schnellere Reaktion auf diese Informationen zu ermöglichen, besteht eines der INSPEC2T Projektziele darin, die von den Bürgern in ihren Kriminal Berichten vorgelegten Informationen zu korrelieren. Diese Informationen enthalten geographische, textuelle und können auch Multimedia-Informationen (Bilder, Video oder Ton). Ein Teil der Bemühungen von IMC als technischer Partner des INSPEC2T-Projekts ist es, semantische Analysetechniken und-Werkzeuge anzuwenden, um die Textinformationen mit einem Ziel zu analysieren, Berichte zu korrelieren. Die Korrelation könnte mehrere Berichte über die gleiche Vorfall Beschreibung, die gleiche verdächtige Beschreibung oder ähnliche Merkmale in beiden verbinden. Dadurch können sichere Portal Betreiber schnell übermittelte Inhalte identifizieren und diese entweder in einer Vorfall Datei gruppieren oder mit älteren Vorfällen verbinden, um zusätzliche Informationen über den Verdächtigen oder den Vorfall bereitzustellen.

Funktionsweise von semantischen Analysetechniken

Ausgehend von einfachen Keyword-und Pattern-Matching ein Bericht enthält "Tall man, dunkle Haare, Tätowierungen" könnte die eine, die enthält "Mann mit Tätowierungen und dunkles Haar" verwandt werden. Darüber hinaus wird durch die Verwendung von Ort und Zeit (insbesondere räumliche und zeitliche Nähe) in Bezug auf die Beschreibung selbst zu einer potenziellen Korrelation dieser Berichte führen. Da jede Person eine andere Herangehensweise an die geschriebene Sprache hat, können die oben genannten Beschreibungen in einem "pro gleichen Wort" Abstand verglichen werden. Bedeutung, wie viele Wörter übereinstimmen über die Gesamtwörter der Beschreibung. Das könnte uns zu einer abstrakteren Berichts Korrelationsmethode führen, ohne die Notwendigkeit, jedes Wort in der Beschreibung zu identifizieren und gleichzeitig Ebenen der Ähnlichkeit festzulegen, um mögliche Korrelationen zu identifizieren.

Die folgende Abbildung zeigt die beiden unterschiedlichen Prozesse.

Die Entwicklung der fallbasierten Argumentation (CRB) Methodik

Während der Systementwicklung und-Prüfung wurde eine höhere Ebene der Textanalyse mit Hilfe der Natural Language Processing (NLP) erreicht. NLP hilft uns, nicht nur die Text Ähnlichkeit, sondern auch die Schlüsselwörter der Nachricht zu identifizieren. In einer vereinfachten Version, NLP identifiziert die wichtigsten/sinnvolle Keywords (oder Sätze von Keywords) in den Phrasen. Grundlegende NLP-Komponenten sind das Lexikon und die Ontologien. Beide erfordern einen erhöhten Aufwand zu erstellen und zu füllen, um einen größeren Pool von identifizierten Keywords und Genauigkeit haben. Da NLP ein Zwischenschritt ist, mussten jede Änderung, Optimierung oder Korrektur in allen verschiedenen Ontologien und Sprachen aktualisiert werden. Diese kontinuierliche parallele Arbeit schuf unterschiedliche Verarbeitung für das gleiche Verfahren. Dies kann durch die Verwendung eines kleineren Teils der NLP-Analyse gemildert werden.

Schließlich ist die fallbasierte Argumentation (CBR) eine kontinuierliche Methode zum Lesen von/correlating, die auf vielen der oben genannten Tools basiert, um Informationen aus Text zu extrahieren. Dieser Prozess kann in der unten dargestellten Reihenfolge beschrieben werden, die aus abrufen, wieder verwenden, überarbeiten und Speichern von Daten besteht, auf die eine Korrekturphase folgt. In der Korrekturphase werden die erfolgreichen Ergebnisse zur Wiederverwendung gespeichert und parallel zur Überarbeitung der archivierten (bereits verarbeiteten) durch die neuen Regeln.

Störende Faktoren wurden im Prozess der Verwendung solcher Techniken in der INSPEC2T Bericht Korrelation identifiziert.  Einer von Ihnen ist mit verschiedenen Sprachen in der Text-Beschreibung der Berichte, die eine große Anstrengung erfordert, Sie zu identifizieren und zu pflegen NLP-Mechanismen mit pro Sprache Wörterbücher und Ontologien.  Eine zweite ist die Geschwindigkeit der Verarbeitung, da in Echtzeit eingereichte Berichte erfordern Echtzeit-Ergebnisse, um schneller zu handeln.

INSPEC2T's Pilottests haben gezeigt, dass die vom CBR-Mechanismus bereitgestellte Intelligenz dem Operator möglicherweise helfen kann, den Informations Überlauf zu überstehen (sortieren und suchen zwischen Hunderten von Berichten), indem er Hinweise zu möglichen Bericht Übereinstimmungen erhält. Dies ist tatsächlich die Schaffung intelligenter Entscheidungen in den Prozess der Gruppierung von Berichten unter einem Vorfall, wodurch Vorteile sowohl in der Reaktionsgeschwindigkeit, sondern auch in der Wirksamkeit der Community Policing.

IMC es Blog konzentriert sich auf und illustriert einige technische Aspekte der INSPEC2T Lösung gegeben IMC technische Expertise. Bitte beachten Sie, dass das INSPEC2T-Konsortium sicherstellt, dass die Datenschutz Rechte und die Grundrechte anderer Nutzer jederzeit respektiert werden. Wir werden eine vollständige Analyse der INSPEC2T rechtlichen und ethischen Anforderungen in einem zukünftigen Blog-Eintrag.

×
Show

Tweets