Een nieuwe technologie om een snellere reactie op criminaliteit rapporten mogelijk te maken

IMC, maart 2018

Wanneer een incident zich voordoet, is er een enorme hoeveelheid informatie en gegevens die moet worden verwerkt door wetshandhavingsinstanties (de). Om een snellere reactie op deze informatie, een van de INSPEC2T projectdoel stellingen is het correleren van informatie die door de burgers in hun criminaliteit verslagen. Deze informatie bevat geografische, tekstuele en kan ook multimedia-informatie (beelden, video of geluid) bevatten. Een deel van de inspanningen van IMC als technische partner van het INSPEC2T project is het toepassen van semantische analysetechnieken en hulpmiddelen om de tekstuele informatie te analyseren met een doelstelling om rapporten te correleren. De correlatie kan meerdere rapporten met betrekking tot dezelfde incident beschrijving, dezelfde verdachte beschrijving of vergelijkbare kenmerken in beide. Hierdoor kunnen beveiligde Portal-operators snel de ingediende inhoud identificeren en ze groeperen in een incidentbestand of deze koppelen aan oudere incidenten, en aanvullende informatie verstrekken over de verdachte of het incident.

Hoe semantische analysetechnieken werken

Vanaf eenvoudige trefwoord en patroon matching een rapport bevat "lange man, donker haar, tatoeages" kan worden gerelateerd aan degene die "man met tatoeages en donker haar" bevat. Bovendien, door het gebruik van locatie en tijd (met name nabijheid in locatie en tijd) met betrekking tot de beschrijving zelf zal leiden tot een mogelijke correlatie van deze rapporten. Aangezien elke persoon heeft een andere benadering van geschreven taal, de hierboven genoemde beschrijvingen kunnen worden vergeleken in een "per hetzelfde woord" afstand. Betekenis, hoeveel woorden overeenkomen met de totale woorden van de beschrijving. Dat kan ons leiden tot een meer abstracte rapport correlatie methode zonder de noodzaak om elk woord in de beschrijving te identificeren en ook om niveaus van gelijkenis vast te stellen om mogelijke correlaties te identificeren.

De onderstaande figuur illustreert de twee verschillende processen.

De ontwikkeling van de zaak gebaseerd redeneren (CRB) methodologie

Tijdens de ontwikkeling en het testen van het systeem, werd een hoger niveau van tekstuele analyse bereikt door natuurlijke taalverwerking (NLP) te gebruiken. NLP helpt ons om niet alleen de tekst gelijkenis te identificeren, maar ook de trefwoorden van het bericht. In een simplistische versie, NLP identificeert de belangrijkste/zinvolle zoekwoorden (of sets van trefwoorden) in de zinnen. Basis NLP componenten zijn het lexicon en de ontologieën. Beide vereisen een verhoogde inspanning te creëren en te bevolken om een grotere pool van geïdentificeerde zoekwoorden en nauwkeurigheid hebben. Aangezien NLP een tussenstap is, moest elke verandering, optimalisering of correctie in alle verschillende ontologieën en talen worden bijgewerkt. Dergelijke het ononderbroken parallelle werk leidde tot verschillende verwerking voor de zelfde procedure. Dit kan worden verzacht met behulp van een kleiner deel van de NLP-analyse.

Tot slot is de geval gebaseerde redenering (CBR) een ononderbroken methode om/correlating te lezen die op veel van de bovengenoemde hulpmiddelen gebaseerd is om informatie uit tekst te halen. Dit proces kan worden beschreven in de onderstaande volgorde die bestaat uit het ophalen, hergebruiken, herzien en behouden van gegevens die wordt gevolgd door een correctie fase. In de correctie fase worden de succesvolle resultaten opgeslagen voor hergebruik en parallel aan de herziening van de gearchiveerde (reeds verwerkt) door de nieuwe regels.

Verstorende factoren zijn geïdentificeerd in het proces van het gebruik van dergelijke technieken in de INSPEC2T verslag correlatie.  Één van hen heeft verschillende talen in de tekstbeschrijving van de rapporten, die een grote inspanning vereist om hen te identificeren en NLP mechanismen met per taal woordenboek en ontologieën te handhaven.  Een tweede is de snelheid van de verwerking, als real-time ingediende rapporten vereisen real-time resultaten om sneller te handelen.

INSPEC2T's pilot testen bleek dat de intelligentie die door het CBR mechanisme kan eventueel helpen de exploitant om de informatie overflow overleven (sorteren en zoeken tussen honderden rapporten) door het ontvangen van hints over mogelijke verslag wedstrijden. Dit is eigenlijk het creëren van slimmere beslissingen in het proces van het groeperen van rapporten onder een incident, het creëren van voordelen, zowel in de reactiesnelheid, maar ook in de effectiviteit van de communautaire politie.

IMC blog richt zich op en illustreert een aantal technische aspecten van de INSPEC2T oplossing gegeven IMC technische expertise. Houd er rekening mee dat het INSPEC2T consortium ervoor zal zorgen dat de privacy rechten en de fundamentele rechten van andere gebruikers te allen tijde worden geëerbiedigd. Wij zullen een volledige analyse van de INSPEC2T wettelijke en ethische vereisten in een toekomstig blogbericht verstrekken.

×
Show

Tweets