Aunque pixeles tu foto en Internet, este algoritmo te reconoce en segundos

Investigadores de la Universidad de Texas y Cornell han ideado un algoritmo que es capaz de identificar un rostro humano pixelado y borroso con una precisión del 80%.

Es una práctica habitual: pixelar imágenes que se suben a internet para proteger su contenido o, sencillamente, ocultar la identidad de los aparecen en dicha imagen (o ocultar datos especiales, como por ejemplo matrículas o números de serie). No obstante, parece que pixelar una imagen no es, para nada, un método fiable si se quiere proteger la información que contiene o preservar la identidad de las personas que aparecen, al menos en esta nueva época en la que el machine learning se está convirtiendo en el nuevo dorado, buzzword aparte.

Resulta que los investigadores de la Universidad de Texas y Cornell han creado un algoritmo que básicamente viene a demostrar que, pixelar una imagen es una forma bastante insegura a la hora de proteger información. Los avances en deep learning y machine learning están convirtiendo métodos que hasta ahora se habían considerado eficientes en totalmente obsoletos. Y solo han tenido aplicar algunos principios de estas tecnologías para identificar de forma positiva el contenido de una imagen pixelada.

De hecho, en las imágenes utilizadas para sus pruebas, el sistema ideado por estos investigadores era capaz de identificar un rostro pixelado con un 70% de precisión (probabilidad que sube hasta el 83% en cinco intentos), frente al 0,19% de probabilidad que tiene un humano en la misma prueba. Se han utilizando imágenes pixeladas extraídas de YouTube cruzadas con imágenes disponibles al público

No convierte una imagen pixelada en nítida como en CSI, simplemente identifica el contenido

¿Y cómo funciona? Se han utilizado imagines pixeladas extraídas de YouTube cruzadas con imágenes disponibles al público para intentar identificar lo que se esconde detrás de los píxeles. Eso sí, el algoritmo no produce una imagen sin pixelar a partir de una pixelada (como sí sucede en ficciones como CSI).

Simplemente identifica lo que ve en la foto basándose en información que ya conoce y en diferentes muestras, y es capaz de identificar contenido de imágenes borrosas y pixeladas, además de poder saltarse el cifrado de imágenes P3, un tipo de codificación JPEG seguro para ocultar información.

Parece que después de todo, incluso las imágenes pixeladas no son garantía de privacidad.