Page 3 - C2I big data
P. 3
On peut trouver un commencement de réponse à la problématique du stockage dans le cloud computing. Les
données, au lieu d'être stockées sur un disque dur, clé USB ou mémoire d’ordinateur, sont disponibles sur des
serveurs distants et accessibles par internet.
On peut alors s’interroger sur le sens de la récolte de l’information. En somme, il s’agit de million, de milliard
d’informations de nature multiple qui sont collectées. Dans quel but ? L’objectif est d’analyser le consommateur.
Seront donc analysées nos tendances de consommation, habitudes d’achats, attitudes religieuses, politiques etc.
L’être humain n’est pas le seul à être étudié. En effet, le climat et l’environnement le sont aussi par exemple. Les Big
data sont donc utilisées par les « géants du web » tels que Google, Facebook, WhatsApp (racheté par Facebook), etc.
Les entreprises aussi les utilisent afin de mieux cibler le consommateur. Elles réduisent les risques en ayant une
meilleure connaissance de son client et de ses habitudes, préférences, etc. Cela lui permet par la suite de prendre de
meilleures décisions et plus rapidement dû à une bonne connaissance de son client. Plus l’entreprise anticipe le
comportement de ses clients plus elle est compétitive.
L’information décisionnelle est à présent un critère primordial probablement plus important que la règle des 3V.
Cela consiste en l’utilisation de stratégies descriptives sur des données de masse qui ont permis d’évaluer un
phénomène et détecter une tendance. De plus, certaines données volumineuses mais limitées d’un point de vue
quantitatif permettent de faire des analyses prédictives. L’analyse prédictive permet d’exploiter les immenses
quantités de données collectées par des entreprises auprès de leurs clients, des réseaux sociaux, des applications
etc. Cela repose sur des statistiques, d'extraction de connaissances à partir de données et de la théorie des jeux qui
analysent des faits présents et passés pour faire des hypothèses prédictives sur des événements futurs. Les
algorithmes vont trouver des modèles dans les données, ce qui permet de déterminer à l’avance certains
phénomènes comportementaux. On verra d’ailleurs par la suite comment le système judiciaire va l’utiliser.
Cela nous mène à une question, les données de quelques natures qu’elles soient peuvent-elles toutes être traitées ?
2. Données personnelles
1
Les données à caractère personnel sont définies en droit français comme (article 2 de la loi informatique et liberté
2
et l’article 4 dans le règlement général sur la protection des données ) « Toute information identifiante directement
ou indirectement une personne physique (ex. nom, numéro de téléphone, photographie, date de naissance,
empreinte digitale...) ». Néanmoins, la loi a prévu des exceptions pour le traitement « mis en œuvre pour l’exercice
d’activités exclusivement personnelles ».
Les données directement personnelles sont celles qui se rattachent aux qualités d’une personne tels que son nom,
prénom, son image, ses données biométriques. A l’inverse, les données indirectement personnelles sont des
1 Loi Informatique et Liberté (LIL)
2 Règlement Général sur la Protection des Données (RGPD)
3