Aplican inteligencia artificial para proteger información confidencial

Vivimos tiempos de espionaje masivo y permanente, un escenario que según la última publicación de wikileaks, deja muy pocos espacios de confidencialidad en el flujo de intercambio de información que realizamos de manera electrónica.

Intercambiamos información personal de manera cotidiana, a ritmos vertiginosos y sin reflexión alguna, y más allá de lo peligroso que resulta, lo cierto es que mucha de esa información es importante para realizar investigaciones que pueden ser de gran utilidad. Por ejemplo, los datos de pacientes almacenados en historiales médicos son fundamentales para realizar investigación médica y las operaciones bancarias constituyen la base de los análisis financieros, con los cuales se evitan en múltiples ocasiones entrar en severas crisis económicas.

Pero dado que la privacidad es importante y un derecho que debemos proteger, los documentos que contienen esos datos personales deben protegerse antes de ser enviados a los investigadores. Utilizar mecanismos de protección adecuados es, por tanto, esencial para garantizar la privacidad o el anonimato de los individuos.

https://cdn.lopezdoriga.com/wp-content/uploads/2015/07/espiox2.jpg

En este contexto, el investigador David Sánchez del grupo de investigación CRISES-Cátedra UNESCO de Privacidad de Datos, del departamento de Ingeniería Informática y Matemáticas de la Universidad Rovira i Virgili (URV), junto a la investigadora Montserrat Batet del grupo de investigación KISON de la Universitat Oberta Catalunya (UOC), han diseñado un sistema que detecta y oculta de forma automática la información confidencial de documentos de texto.

Aunque la legislación de la Unión Europea es muy estricta en cuanto a la cesión de datos personales sin consentimiento de los implicados, en otros países, como Estados Unidos, es habitual que se requieran y faciliten documentos privados en asuntos judiciales, bajas laborales, seguros, etc. Ahora bien, en todos los casos, se debe garantizar que los documentos facilitados no revelan información confidencial que pueda utilizarse, por ejemplo, con fines discriminatorios.

Hasta ahora, la protección de documentos confidenciales requería de uno o varios expertos que, manualmente, identificaban y eliminaban palabras, sintagmas o frases que podían revelar información sensible o potencialmente discriminatoria. En este proceso se tienen en consideración términos sensibles, como el nombre de una enfermedad contagiosa, y conjuntos de términos que permitirían deducir los anteriores indirectamente, como, por ejemplo, combinaciones de medicamentos o tratamientos que se aplican solo en una enfermedad concreta. Trabajar con estos elementos es una tarea ardua y, por su complejidad, no siempre infalible.

El método que han desarrollado automatiza todo el proceso, lo que permite manejar y proteger de manera eficiente el gran volumen de datos que se utilizan actualmente en investigación. Para ello, el sistema analiza la información disponible en internet, que es la que un tercero podría utilizar como base de conocimiento para deducir información confidencial de un documento protegido. Seguidamente protege aquellos términos que podrían facilitar tales deducciones.

_____

_____

https://www.mundomarketing.com/wp-content/uploads/2016/04/espionaje.jpg

El nuevo sistema, cuyos detalles se publican en la revista Engineering Applications of Artificial Intelligence, permite que los documentos se puedan enviar a terceros sin comprometer la privacidad y manteniendo el anonimato de las entidades (personas, organizaciones, etc.) a las que hacen referencia.

Las pruebas han demostrado que el nuevo método es más exhaustivo y ofrece una precisión equiparable a la de un experto humano. Además, a diferencia de los expertos, el sistema no se limita a eliminar términos peligrosos, sino que, en la medida de lo posible, intenta reemplazarlos por conceptos más generales que resulten más ambiguos.

Por ejemplo, en lugar de especificar que un paciente tiene una neumonía, indicaría que sufre una enfermedad del sistema respiratorio. Con esto se consigue que el documento protegido sea más comprensible y más útil en los análisis posteriores.

De momento, el método se ha implementado en un prototipo de software que se ha probado con documentos clínicos en inglés. Se prevé que en un futuro próximo pueda aplicarse en otros ámbitos de conocimiento y pueda establecerse como una herramienta de uso profesional de especial utilidad para la investigación.

Con información de Science Direct y Agencia SINC.

Previo

Lo que hay que entender sobre la despenalización de la marihuana medicinal

Siguiente

Tabasqueñas ganan medallas de oro en concurso de robótica

Sin comentarios

Deja un comentario