Este proceso se hace manteniendo el sentido original de los textos. En el caso de localizaciones físicas, por ejemplo, estas se cambian por otras cercanas, mientras que el sistema también es capaz de detectar palabras más generales y más concretas dentro de un mismo campo semántico.
Amazon ha desarrollado una técnica que permite analizar textos con lenguaje natural protegiendo la seguridad y la privacidad de los usuarios mediante un sistema que sustituye las palabras originales, reescribiendo las oraciones pero manteniendo el significado.
Según un estudio elaborado por el Instituto Tecnológico de Massachusetts (MIT), la mayor parte de las técnicas de anonimización actuales están expuestas a ataques en los que los cibercriminales comparen la información con datos de otras fuentes, identificando así a las personas.
La nueva técnica desarrollada por Amazon, conocida como 'Mad Libs', evita introducir ruido en las bases de datos y en su lugar sustituye las palabras del texto original por otras, reescribiéndolo pero conservando su significado, como explica la compañía estadounidense en un comunicado.
'Mad Libs' renueva los sistemas de anonimización actuales a través de lo que la compañía ha llamado 'privacidad diferencial métrica'. En lugar de cambiar siempre en el mismo grado las palabras, el nuevo sistema modifica el texto en mayor o menor grado según el parecido entre su base de datos y el texto del usuario.
Este proceso se hace manteniendo el sentido original de los textos. En el caso de localizaciones físicas, por ejemplo, estas se cambian por otras cercanas, mientras que el sistema también es capaz de detectar palabras más generales y más concretas dentro de un mismo campo semántico.
Los investigadores de Amazon ya han puesto a prueba esta tecnología y aseguran haber conseguido con ella unos resultados hasta 20 veces mejores de lo esperado a nivel de privacidad.
EUROPA PRESS
Comparte esta noticia