Articles

Big Data et droit, une question de pouvoir et de position dominante

Alors que la loi Informatique et libertés de 1978 est née suite à une controverse sur un projet mené par l’Etat, le Règlement général sur la protection des données (RGPD) est né suite à la constatation du pouvoir grandissant des GAFAM ou des « Big Tech[1] », face au « Big Data », les mégas bases de données que ces entreprises constituent sur leurs utilisateurs.

Définition du Big Data

Le Big Data désigne le fait de détenir d’importants volumes de données, peu important que les données soient structurées ou non. Le Big Data se caractérise par la règle des 3V :

  • le Volume : le Big Data implique la collecte de gigantesques volumes de données brutes,
  • la Variété : le Big Data est composé de données hétérogènes, structurées ou non,
  • la Vitesse : les données sont générées à « grande vitesse » voire en continue, ce qui implique de les traiter rapidement, voire en temps réel.

Sont ajoutées parfois 2 ou 3 autres V, ayant trait à la gestion des données issues du Big Data plutôt qu’à sa définition propre :

  • la Véracité : par défaut, les données comportent du « bruit », des informations incomplètes voire erronées.
  • Cela renvoie à la Volatilité, c’est-à-dire la « durée de vie » des données générées, autrement dit, pendant combien de temps elles sont valides.
  • la Validité ou Valeur : les données doivent être « propres » pour être exploitables. Elles doivent être exactes et avoir été collectées de manière licite. Cela renvoie aux notions de véracité et volatilité de la donnée.

Sans cadre légal, le Big Data est mis en place de manière « sauvage » via par exemple des outils de web scraping[2], qui est une pratique répandue de growth hacking[3]. On collecte des données parce qu’on peut techniquement le faire, sans définir préalablement ce à quoi elles pourront servir.

La donnée, élément sociopolitique conférant le pouvoir aux entreprises qui la détienne

Les Big Tech ont acquis un pouvoir sans précédent grâce au Big Data. Les Big Tech peuvent anticiper la demande, voire « créer » les besoins des individus. La donnée collectée massivement est devenue un élément sociopolitique qui confère le pouvoir à ceux qui la détienne. Le scandale le plus connu est celui touchant Facebook : les données personnelles de millions d’utilisateurs de Facebook ont été collectées sans leur consentement par la société britannique Cambridge Analytica, pour être utilisées principalement à des fins de publicité politique.

C’est ce que le RGPD s’emploie à réguler en imposant aux entreprises des obligations pour assurer la licéité d’un traitement.

Toutefois, ces obligations ne suffisent pas à limiter le pouvoir des Big Tech. Les données peuvent toujours être collectées de manière licite, avec le consentement des utilisateurs, enclins à se départir d’une partie de leur vie privée au profit d’un outil gratuit, présentant des avantages indéniables en termes d’efficacité et d’ergonomie, en un mot « user-friendly ». En conséquence, le pouvoir de ces entreprises reste plus fort que jamais, pouvoir encore accru avec la pandémie et les restrictions de déplacement imposées.

Le Digital Services Act et le Digital Markets Act

C’est dans ce contexte que deux projets de règlements européens[1] sont en cours de discussion afin de réguler les services et marchés numériques et limiter le pouvoir d’entreprises en position dominante, avec un arsenal d’outils conférant aux autorités de la concurrence la capacité d’agir plus rapidement et de frapper plus fort. Le Digital Services Act vise à lutter contre la dissémination des contenus illicites lorsque le Digital Markets Act vise à garantir que les marchés numériques restent innovants et ouverts à la concurrence avec des relations commerciales loyales et équilibrées vis-à-vis des gros acteurs du marché.

Il s’agit de rééquilibrer la dynamique de puissance du Big Data et faire pencher la balance de l’autre côté. Ces projets doivent faire l’objet de débats au Parlement Européen puis au Conseil de l’Union Européenne selon la procédure législative ordinaire.

Credit photo : YBSLECC BY-SA 4.0

Marie Hélène Gostiaux

Notes
[1] Les « Big Tech » font référence aux « Big Five » à savoir Google, Apple, Facebook, Amazon et Microsoft.  
[2] Le « web scraping » est une pratique qui consiste à extraire le contenu de sites Web via un logiciel ou un script, pour collecter automatiquement les données présentes sur des annuaires ou sites spécialisés.
[3] Le « growth hacking » peut se définir comme un ensemble de techniques marketing au service d’une stratégie permettant d’assurer à l’entreprise une croissance forte et à faible coût.