Una nueva tecnología para permitir una reacción más rápida a los informes de la delincuencia

IMC, marzo de 2018

Cuando ocurre un incidente, hay una gran cantidad de información y datos que deben ser procesados por las agencias de aplicación de la ley (leas). Para permitir una reacción más rápida a esta información, uno de los objetivos del proyecto INSPEC2T es correlacionar la información presentada por los ciudadanos en sus informes de delitos. Esta información contiene datos geográficos, textuales y también puede contener información multimedia (imágenes, vídeo o sonido). Parte del esfuerzo de IMC como socio técnico del proyecto INSPEC2T es aplicar técnicas y herramientas de análisis semántico para analizar la información textual con el objetivo de correlacionar los reportes. La correlación podría conectar varios informes con respecto a la misma descripción del incidente, la misma descripción sospechosa o características similares en ambos. Esto permite a los operadores de portales seguros identificar rápidamente el contenido enviado y agruparlos en un archivo de incidentes o conectarlos a incidentes más antiguos, proporcionando información adicional sobre el sospechoso o el incidente.

Cómo funcionan las técnicas de análisis semántico

A partir de una palabra clave simple y el patrón de coincidencia de un informe contiene "hombre alto, pelo oscuro, tatuajes" podría estar relacionado con el que contiene "el hombre con tatuajes y pelo oscuro". Además, mediante el uso de la ubicación y el tiempo (específicamente la proximidad en la ubicación y el tiempo) en relación con la propia descripción conducirá a una correlación potencial de estos informes. Puesto que cada persona tiene un acercamiento diferente al lenguaje escrito, las descripciones antes mencionadas pueden ser comparadas en una distancia "por la misma palabra". Significado, cuántas palabras coinciden con las palabras totales de la descripción. Esto podría llevarnos a un informe más abstracto método de correlación sin la necesidad de identificar cada palabra en la descripción y también establecer niveles de similitud para identificar posibles correlaciones.

La figura a continuación ilustra los dos procesos diferentes.

El desarrollo de la metodología del razonamiento basado en casos (CRB)

Durante el desarrollo del sistema y las pruebas, se alcanzó un mayor nivel de análisis textual mediante el uso del procesamiento del lenguaje natural (PNL). La PNL nos está ayudando a identificar no sólo la similitud del texto, sino también las palabras clave del mensaje. En una versión simplista, la PNL identifica las palabras clave más importantes/significativas (o conjuntos de palabras clave) en las frases. Los componentes básicos de la PNL son el léxico y las ontologías. Ambos requieren un mayor esfuerzo para crear y poblar con el fin de tener un pool más grande de palabras clave y precisión identificadas. Dado que la PNL es un paso intermedio, cada cambio, optimización o corrección tuvo que ser actualizado en todas las diferentes ontologías e idiomas. Tal trabajo paralelo continuo creó diverso proceso para el mismo procedimiento. Esto puede ser mitigado usando una porción más pequeña de análisis de la PNL.

Por último, el razonamiento basado en casos (CBR) es un método continuo para la lectura de/correlating que se basa en muchas de las herramientas anteriores para extraer información del texto. Este proceso se puede describir en la secuencia ilustrada a continuación, que consiste en recuperar, reutilizar, revisar y retener los datos seguidos de una fase de corrección. En la fase de corrección, los resultados exitosos se almacenan para su reutilización y en paralelo revisando los archivados (ya procesados) a través de las nuevas reglas.

Los factores que interrumpen se han identificado en el proceso de usar tales técnicas en la correlación del informe de INSPEC2T.  Uno de ellos está teniendo diferentes idiomas en la descripción del texto de los informes, que requiere un gran esfuerzo para identificarlos y mantener los mecanismos de la PNL con los diccionarios de idiomas y ontologías.  Una segunda es la velocidad de procesamiento, ya que los informes enviados en tiempo real requieren resultados en tiempo real para actuar con mayor rapidez.

Las pruebas piloto de INSPEC2T's demostraron que la inteligencia proporcionada por el mecanismo de CBR puede posiblemente ayudar al operador a sobrevivir el desbordamiento de información (clasificar y buscar entre cientos de reportes) al recibir sugerencias acerca de posibles partidos de informe. Esto es en realidad la creación de decisiones más inteligentes en el proceso de agrupación de informes en un incidente, la creación de ventajas tanto en la velocidad de reacción, pero también en la eficacia de la policía comunitaria.

El blog de IMC se centra en e ilustra algunos aspectos técnicos de la solución INSPEC2T dada la experiencia técnica de IMC. Tenga en cuenta que el consorcio INSPEC2T se asegurará de que los derechos de privacidad y los derechos fundamentales de otros usuarios serán respetados en todo momento. Le proporcionaremos un análisis completo de los requisitos legales y éticos de INSPEC2T en una futura entrada en el blog.

×
Show

Tweets