Pixelization: ovvero come NON nascondere un testo

Pixelization: ovvero come NON nascondere un testo

input-output
Benvenuto su Input/Output: la blogletter in cui ogni martedì commento la notizia che mi ha più colpito del mondo tech.

Pubblicando articoli nel web mi è capitato diverse volte di dover nascondere dati sensibili e password prima della pubblicazione. Normalmente in questi casi applicavo una bella sfocatura sopra la porzione di testo da nascondere ed ero sicuro che in questo modo i dati sarebbero stati illeggibili.

Mi sbagliavo.

Il nome tecnico con cui è chiamata questa tecnica di censura di un'immagine mediante l'applicazione di una sfocatura è chiamata Pixelization. Idealmente questo processo dovrebbe essere distruttivo per cui non ci sarebbe alcun modo di recuperare l'informazione originaria.

Infatti tipicamente per offuscare l'immagine viene usato un algoritmo di tipo Box Blur. Che a grandi linee ha un funzionamento di questo tipo:

  • l'immagine viene scomposta in matrici (blocchi) di pixel
  • per ogni matrice (blocco) viene calcolato il valore medio dei pixel che la compongono
  • tutti i valori della matrice (blocco) vengono sostituiti con il valore medio calcolato


Box Blur applicato ad un emoji scomponendola in 4 blocchi

Sfortunatamente però, questo processo di offuscamento del testo è deterministico, per cui "pixellando" lo stesso testo (e usando le stesse impostazioni), si ottiene sempre e comunque lo stesso risultato. Di conseguenza è stato possibile creare un algoritmo in grado di decifrare il testo offuscato che è stato pubblicato su GitHub con il nome di Depix.


Testo recuperato utilizzando Depix

Tutta questa storia per dire che d'ora in poi, se devo offuscare del testo in un'immagine, userò un bel rettangolone nero fatto con paint. Ma anche quello potrebbe non essere banale come sembra...


Grazie per aver letto questo articolo della rubrica Input/Output.
Ad ogni input, tipicamente, corrisponde un output. E solo esponendosi ad input diversi si possono tirare fuori idee non convenzionali. Proprio per questo ogni martedì prendo in input una curiosità legata al mondo tecnologico per ragionare su nuove idee da tirare fuori in output.

Fonte