Las comisarías españolas implantarán el primer sistema del mundo capaz de detectar mentiras gracias a la inteligencia artificial

El modelo analiza las combinaciones de palabras más comunes cuando se miente ante un policía

Un ciudadano acude a una comisaría a presentar una denuncia. Un agente le atiende y mientras va escribiendo en un ordenador lo que el denunciante le cuenta, con sus mismas palabras.

El inspector Miguel Camacho, licenciado en Matemáticas y Estadística, leía en 2012 en una comisaría del centro de Granada las declaraciones de robos con violencia en la calle. Era su primer destino como policía después de la academia. Algunas denuncias le parecían falsas, sobre todo las vinculadas a teléfonos móviles caros. «Pero yo entonces era muy ingenuo», dice. Camacho no concebía que alguien acudiera a la policía a denunciar algo que no había ocurrido para cobrar, por ejemplo, un seguro.

Dos años después, Camacho recibió una beca Fulbright y fue a la UCLA en Los Ángeles (EE UU) a trabajar en su doctorado sobre policía predictiva. Al regresar, ya en un destino nuevo en Madrid, cayó en que la inteligencia artificial podía automatizar la detección de denuncias falsas a partir de las palabras más usadas por los denunciantes. El policía reunió a coste cero un grupo de investigadores y funcionarios para desarrollar el modelo: «No sé cómo no se me ocurrió antes algo tan obvio», explica.

El resultado es un sistema llamado VeriPol, que analiza y calcula las combinaciones de palabras más comunes cuando se miente ante un policía. El modelo usa el procesamiento de lenguaje natural y la inteligencia artificial para descubrir las palabras que nos delatan y la probabilidad de falsedad de una denuncia.

Las palabras delatoras surgieron del análisis de los textos de 1.122 denuncias de 2015: 534 verdaderas y 588 falsas. Las denuncias estudiadas son solo de casos de robo con violencia en la calle o tirones. Para evitar cualquier error, los investigadores seleccionaron casos ya cerrados: porque había habido una detención o porque los denunciantes habían admitido su mentira.

El modelo analiza las combinaciones de palabras más comunes cuando se miente ante un policía

El sistema está explicado en un artículo científico publicado en marzo en la revista Knowledge-Based SystemsAplicando detección automática de lenguaje engañoso basado en texto a los informes policiales.

Junto al inspector Camacho, los autores son los informáticos Lara Quijano, de la Universidad Autónoma de Madrid, Federico Liberatore, de la Complutense, y el matemático José Camacho, de la Universidad de Cardiff (Reino Unido) y hermano de Miguel. VeriPol es el primer modelo del mundo que ha sido validado para su uso oficial. Y será el primero en aplicarse en un cuerpo de policía.

Mejor que un humano

La habilidad de Veripol ya se ha puesto en práctica: es capaz de predecir con un 91% de acierto si una denuncia es falsa. Sobre el mismo cuerpo de denuncias, un policía experto detecta alrededor de un 75%.

Las palabras delatoras revelan un retrato perfecto de la lógica e ingenuidad que hay detrás de nuestros engaños, incluso ante la policía. Alguien puede pensar que su mentira es única. Pero no. En realidad es obvio: todas tienen unos patrones tan evidentes que un algoritmo es perfecto para captarlos.

Las denuncias verdaderas aportan, en general, más detalles. En las falsas, el denunciante aspira a eliminar los detalles. ¿Cuál es el mejor modo de hacerlo?  Uno de los mejores predictores de falsedad es la palabra «día». No porque los robos sean a plena luz, sino porque fueron «hace unos días», «un día» o «hace dos o tres días», no «ayer» o «el jueves».

Otras palabras que sirven para detectar denuncias falsas son «tirones» desde «atrás» o por la «espalda», de la «mochila» o «bolso», o de algo que la víctima llevara en el «hombro». Los ataques falsos suelen ser de alguien que lleva «casco» y va vestido de «negro» (los malos siempre van de negro). Los hechos falsos suelen ocurrir por detrás porque salva al denunciante de tener que dar detalles.

VeriPol es el primer modelo del mundo validado por documentos oficiales

Otras palabras relacionadas con falsedades en las denuncias son «seguro», «abogado», «móvil», «Apple», «iPhone», «compañía» o «contrato». Las descripciones en las denuncias falsas no se centran en los hechos, sino en el objeto, su valor y el motivo oculto por el que vamos a la policía.

Los investigadores descubrieron que suelen ser más ciertas las denuncias de robos cerca de la «portería» de casa o en el «rellano». La gente que va con una denuncia falsa pretende alejarla de su hogar, de sus conocidos.

VeriPol también analiza los recursos gramaticales y sintácticos más usados. Los pronombres personales y demostrativos, e incluso los verbos «ser» y «estar» aparecen más en denuncias verdaderas. Los mentirosos, en cambio, son poco dados a concretar con pronombres específicos como «yo», «él» o «este» y «aquel». En las falsas, de nuevo, la vaguedad predomina: «Los informes verdaderos están más centrados en contar la historia del delito y las interacciones de la víctima y el agresor», dice el artículo.

La sintaxis también delata

La sintaxis también es transparente con las mentiras. Los sintagmas introducidos por el adverbio «apenas» -por ejemplo en «apenas pudo verle» o «apenas recuerda»- indican falsedad. También un alto número de negaciones se relaciona con mentira: aparecen en frases como «no puede dar más datos», «no ha sufrido heridas», «no pudo ver», «no puede reconocer».

Las denuncias verdaderas se centran en el fondo en la acción, mientras que las falsas buscan describir objetos, que es lo único que el denunciante ha visto. Las denuncias reales tienen por ejemplo un alto grado de palabras que describen cualidades y acciones específicas: «barba», «cara», «pelo», «centímetros», «delgado», «constitución», «edad», «hombre», «gritar», «pelear», «empezar a».

La gente que presenta una denuncia falsa pretende alejarla de su hogar, de sus conocidos

Las denuncias falsas suelen ser más cortas. Esto no implica que un rasgo de todas las mentiras sea la brevedad. Una reseña falsa en Tripadvisor puede intentar ofrecer largas descripciones para paliar la falta de sinceridad. Cada modelo debe buscar su contexto.

Ninguna de todas estas palabras o construcciones por sí solas implica falsedad. Su combinación y persistencia entre el número de palabras totales son las que indican la probabilidad de falsedad. El algoritmo percibe mejor el peso de esos matices que un humano. Cuando entre en vigor, el modelo sin embargo no decidirá nada. Solo será una herramienta más que la policía judicial sume a su percepción. «El algoritmo es como un comisario viejo con mucha experiencia que está ahí al lado y que ayuda a la policía y les dice lo que le suena a verdadero o falso», dice la investigadora Lara Quijano.

Según la investigación, no hay datos generales sobre el porcentaje de denuncias falsas, pero alguna comisaría lo cifra en un 57% del total, según cuenta la investigación. Una denuncia falsa es un delito que la policía traslada a un juez y puede suponer antecedentes para el denunciante. Si además se le une un delito de estafa a, por ejemplo, una compañía de seguros, puede haber responsabilidad penal. VeriPol puede disuadir a algunos de mentir en sus denuncias. Pero siempre habrá alguien que se crea capaz de ganar a la máquina porque conoce el truco. De hecho, Veripol no pilla alrededor de un 10% de denuncias falsas, perol es solo una herramienta más en manos de la policía, no la única. Y las combinaciones y actualizaciones del algoritmo son inextricables.