Peut-on anonymiser les données?

Est-ce suffisant de supprimer "les données personnelles" de l'ensemble des données? Et pouvons-nous nous cacher dans la mer de données qui nous entoure?

Les gouvernements et les entreprises soutiennent qu'une anonymisation des données efficace est possible. Pourtant à partir du moment où l'on y regarde plus près, on commence à écarter cette possibilité.

Prenons un exemple fictionnel: une femme nommée Renata qui vit à Rio de Janeiro.

Bien sûr, si quelqu'un connaît le nom de Renata, il peut facilement l'identifier. Mais si quelqu'un ne connaît pas son nom mais sait qu'elle vit à Rio de Janeiro, que c'est une femme, qu'elle est née le 7 juillet 1994, qu'elle aime le café, et qu'elle passe du temps au café de l'Université et qu'elle est rousse, elle pourra alors être identifiée sans que l'on sache son nom.

"Anonymiser les données" veut dire retirer de l'ensemble des données n'importe quelle donnée personnelle qui pourrait identifier un individu. Mais comme le montre l'exemple de Renata, l'identification reste possible en combinant des traces de données individuelles pour fabriquer un profil.

Retirer les 'données personnelles' de l'ensemble des données n'est pas suffisant, car une identification dépend du nombre de traces de données disponible, et de la relation entre cet ensemble particulier de données avec d'autres données.   

Le nombre de données actuellement disponibles nous concernant, combiné aux avancées dans l'analyse de données, ont augmenté de manière significative la probabilité qu'un individu a d'être identifié à partir de données anonymisées.

Peut-on se cacher dans une mer de données?

La notion de 'se cacher dans une mer de données' est dépendante de l'idée que le tri et l'analyse des données serait effectué par des humains. Ce n'est évidemment pas la cas, car l'analyse des données est gérée par des ordinateurs qui sont capables de traiter de très grand volume de données pour y trouver des modèles et des corrélations, et pour fabriquer des conclusions et des prédictions.

Lire la suite:

Traces numériques: contenu et métadonnée

Quel niveau de contrôle avons-nous sur nos données?