TOOLinux

Le journal du Libre

57 fois plus de données que de grains de sable dans le monde

jeudi 13 décembre 2012

Seulement 0,5 % des données disponibles dans le monde sont analysées. Le volume de données nécessitant d’être protégées croît plus vite que l’univers numérique lui-même, mais les niveaux de protection ne suivent pas. Le volume de données générées par des machines devrait être multiplié par 15 d’ici 2020.

Les investissements et dépenses dans l’infrastructure IT (matériels, logiciels, services, télécommunications et humains) de l’univers numérique va progresser que 40 % entre 2012 et 2020. Les investissements dans des postes ciblés comme le stockage, la gestion et la sécurité des données ou encore le Big Data et le Cloud Computing progresseront bien plus vite.

De grandes quantités de données utiles sont perdues : la promesse du Big Data tient à l’extraction de valeur à partir de vastes ensembles de données inexploitées. Toutefois, la majorité des nouvelles données est largement constituée de fichiers sans marquage et de données non structurées. Ce qui signifie que l’on sait peu de choses à leur sujet.

En 2012, 23 % (643 exaoctets) de l’univers numérique pourrait être utile au Big Data s’il était marqué et analysé. Toutefois, seulement 3 % des données potentiellement utiles sont effectivement marquées ; une part encore plus faible est analysée (0,5 %).

La quantité de données utiles progresse avec la croissance de l’univers numérique. À l’horizon 2020, 33 % de l’univers numérique (plus de 13 000 exaoctets) aura une valeur pour les applications Big Data s’il est marqué et analysé.

Une vaste part de l’univers numérique n’est pas protégée : la quantité de données ayant besoin d’être protégées croît plus rapidement que l’univers numérique lui-même.

- Moins d’un tiers de l’univers numérique nécessitait une protection en 2010, mais cette proportion dépassera 40 % en 2020.
- En 2012, alors qu’environ 35 % de l’information disponible nécessitait une forme de protection, moins de 20 % en est effectivement dotée.
- Le niveau de protection varie selon les régions, avec bien moins de protection dans les marchés émergents.

Le Cloud Computing jouant un rôle croissant dans la gestion du Big Data, le nombre de serveurs dans le monde devrait être multiplié par 10, et la quantité d’informations gérées directement dans les centres de calcul des entreprises devrait progresser d’un facteur 14.

Le type des données stockées dans le Cloud se transformera radicalement au cours des prochaines années. D’ici 2020, IDC prévoit que 46,7 % des données stockées dans le Cloud seront liés aux loisirs. Le reste sera constitué de données de surveillance, de données médicales, et d’informations créées par les ordinateurs, les téléphones, et les appareils électroniques grand public.

La quantité d’informations stockées dans l’univers numérique à propos d’utilisateurs individuels dépasse la quantité de données qu’ils créent eux-mêmes.

L’Europe de l’Ouest est la région qui investit actuellement le plus pour gérer l’univers numérique, dépensant 2,49 $ par Go. Les États-Unis arrivent en seconde position avec 1,77 $ par Go, suivis par la Chine avec 1,31 $ par Go, et par l’Inde avec 0,87 $ par Go.

L’infrastructure de l’univers numérique devenant de plus en plus connectée, l’information va se délocaliser de plus en plus de la région où elle est consommée. À l’horizon 2020, IDC estime que près de 40 % des données seront concernées par la virtualisation, c’est-à-dire qu’entre sa création et sa consommation, un octet sera stocké ou traité sur le Cloud.