BigData

Différents enjeux

Enjeux sociétaux

Un enjeu immédiat, évoqué ci-dessus, est la capture par des entités que vous ne connaissez pas (et qui ne vous demandent pas explicitement votre avis) d’informations personnelles sur lesquelles vous n’avez aucun contrôle. Souvent d’ailleurs, les données fournies semblent anodines : quelques éléments de contact (nom, adresse, date de naissance), associées à un achat. C’est l’agrégation et le cumul d’informations que vous fournissez par différentes sources (messages, navigation, recherche, discussion, achats) qui finit par constituer votre « profil », redoutablement complet, et très probablement ineffaçable. Le respect de la vie privée, le droit à l’oubli, et quelques autres droits fondamentaux sont potentiellement mis en cause par le processus de constitution de ces datamasses dont, rappelons-le, un des objectifs semble bien être de répertorier les utilisateurs du Web comme un catalogue de produits revendables.

Enjeux : science et techniques

Le Big data est-il une rupture en termes techniques et scientifiques ? Le débat est ouvert. Il est certain que les problèmes soulevés par la gestion de volumes sans précédent a fortement stimulé des domaines comme le stockage et le calcul distribué, l’analyse automatique de texte, l’extraction de connaissances et, au sens large, la fouille de données. Mais dans certains cas (stockage et accès aux données par exemple) les solutions adoptées ressemblent à une régression : la « parallélisation » massive et la nécessité de tolérer les pannes multiples, qui apparaissent inévitablement dans des infrastructures conçues pour « passer à l’échelle » au moindre coût, ont pour contrepartie un appauvrissement des algorithmes ou de la finesse de gestion qui étaient devenus la norme dans les systèmes centralisés. Dans d’autres cas, il est clair que la motivation d’analyser des données massives et souvent hétérogènes est un encouragement à l’émergence de nouvelles recherches porteuses d’innovation. Quoi qu’il en soit, le Big data est maintenant un domaine privilégié par les financeurs de toutes sortes pour la création de projets, de structures, de débouchés technologiques, le tout considéré comme stratégique.

Enjeux : formation et métiers

Finalement, quel est l’impact sur la formation et les futurs métiers ? L’institut Mc Kinsey Global, estime que les besoins en analyse de masses de données induiront, aux États-Unis, le recrutement de 140 000 à 190 000 spécialistes d’ici à 2018. En termes de compétences, les technologies de la datamasse nécessitent la maîtrise d’outils mathématiques et statistiques de très haut niveau. Des compétences dans le domaine de l’informatique, et notamment en programmation, sont également requises.

Les gouvernements estiment donc qu’il existe une nécessité forte de former d’urgence à ce nouveau métier, dont la spécialité a d’ores et déjà été baptisée science des données. La création de nouvelles filières sur ce sujet est attendue et explicitement encouragée, comme l’indique le rapport intitulé « L’émergence d’une nouvelle filière de formation : data scientists » coordonné par Serge Abiteboul de l’Académie des sciences.

Contact

APIK Consulting
Siege social
rue des 4 chemins
Le Clos des Vignes
69220 Corcelles en Beaujolais
Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.