Plan du site  
pixel
pixel

Articles - Étudiants SUPINFO

Stockage et Analyse de données Massives

Par Lucas MARTINI Publié le 03/08/2018 à 16:40:29 Noter cet article:
(0 votes)
Avis favorable du comité de lecture

Présentation :

De partout où nous nous trouvons chaque jours nous envoyons et recevons des milliers de données sous différentes formes. Ces données nous n’y faisons même plus attention mais elles deviennent de plus en plus importantes. Ces données décrivent souvent nos faits et gestes, ce que nous pensons, ce que nous recherchons, ce que nous aimerions avoir ou faire…. En bref ces données reflètent et décrivent notre personnalité et notre mode de vie. Vous ne vous en rendez peut être pas compte mais dès l’instant ou vous avez sur vous un téléphone ou un quelconque appareil connecté à internet directement ou indirectement des données vous correspondant sont enregistrés ou partagé. Que ce soit grâce à votre smartphone, montre connecté, ordinateur, gps ou autres vos partagé des quantités énorme de données. Ne serait-ce qu’en navigant sur internet ou sur des sites vos fait et gestes sont analysés de manière à savoir la nature de votre recherche, ou vous avez cliquez et pourquoi, ou vos yeux se sont portés. Toutes ces données sont donc collectées, stockées sous forme de données massives, puis ces dernières seront analysées afin d’en tirer certaines conclusion et prendre des décisions.

Cet article va simplement effleurer ce vaste sujet qui est le traitement et l’analyse de données massives.

Pour pouvoir stocker ces quantité massives de données nous utilisons le Big Data. Nous pouvons caractériser le big data comme étant un flux de données important et de toutes sortent. Ces données ne sont pas formatés c’est-à-dire qu’elles ne sont pas dans un format conventionnel. Ces données peuvent être du texte, des sources audio, des images, des vidéos ou même une position gps … De nos jours d’innombrables entreprises utilisent le big data afin d’étudier le comportement de ses utilisateur ou potentiels clients. Ces derniers vont donc stocker les données en matière de recherche ou même préférences des clients, pour pouvoir ensuite les analyser. Ces données de masse permettent de mieux comprendre et cerner les besoins des utilisateurs en analysant leurs faits et gestes sur internet. L’entreprise arrive alors à prévoir de nouvelles tendances ou même à corréler les données pour en récolter des informations importantes pouvant influencer les futures ventes. Comme nous l’avons dit une entreprise peut traiter ces données pour mieux cibler un consommateur ou prendre certaines décision en fonction des attirances de ses clients envers certains produits cela s’appelle le « l’informatique Décisionnel » ou « Business intelligence ».

Qu’est-ce que le Big Data :

Le big data est tout simplement le fait de stocker massivement des données de toutes sortent (données complexes structurées ou non). Ces données peuvent être ensuite traité et exploiter par l’entreprise pour aider l’entreprise à mieux comprendre ses consommateurs comme dit précédemment. Mais avant tout le principale but du big data est de stocker un maximum d’informations de toutes sortes et venant de toutes parts. Pour ensuite pouvoir grâce à certains procédés comme « l’informatique décisionnelle » ou « Business intelligence » utilisé ces données de manière intelligente afin de faire avancer et évoluer l’entreprise. L’analyse de ces données peut être un réel atout pour l’entreprise car certaines décisions peuvent permettre directement ou non de faire accroitre le chiffre d’affaire de cette dernière.

D’où proviennent les données exactement ?

Les données proviennent tout simplement du Web par exemple grâce au Web Mining, exploration et recherche de données à travers le web. Ces données peuvent provenir de différents compte crées sur différents réseau sociaux, ce peut être également des images (image mining) ou encore d’un éventuel sondage ou questionnaire. Ces données peuvent être aussi des attirances politiques ou autre préférences que vous auriez éventuellement dévoilées sur twitter, Facebook ou autre. Il y a aussi le fait que nos smartphone sont en permanence relié à internet, les échanges sont donc multiples et constant. De nombreuses applications ou jeux partages vos informations en temps réels (adresse mail par exemple) ou même votre position si toutes fois vous avez accepté qu’elle soit utilisée.

Données structurés et non structurés : Quel est la différence ?

Les données non-structurées : ce sont toutes les données de type texte comme par exemple des mails, des documents Word ou encore même des images, des vidéos, des fichiers audio… Ce sont toutes les données dont le format ne permet pas que ces dernières soient traitées facilement.

Les données structurées quant à elles sont tout le contraire des données non-structurées, elles sont formater de façons à rendre plus facile leur traitement ainsi que leur manipulation. Ce sont par exemple des documents Excel.

Ou sont stocker les données ?

Les données une fois récoltées peuvent être stocké sur une base de données comme « Hadoop » par exemple. Hadoop est une base de données principalement utilisé pour le big data, elle permet de géré et de stocker des données qui sont principalement non-structurées. De plus, certains Framework peuvent s’ajouter à Hadoop pour permettre de mieux gérer et de mieux interroger la base grâce à des requêtes NOSQL. Ce qui facilite grandement la gestion de cette dernière.

Si vous récupérez des données qui sont quant à elles structurées, vous pouvez très bien les mettre dans un Data Warehouse (entrepôt de données). Le fait de les mettre dans un Data warehouse (base de données utilisant uniquement des données structurées) va vous permettre d’ordonner et d’analysé sous toutes les coutures vos données, ce qui vous permettra de trouver d’éventuel corrélation entre ces dernières. Nous entrons alors dans la phase analyse de données et informatique décisionnel. Ou autrement dit ce sont vos analyses qui vont permettre à l’entreprise de prendre certaines décisions et choix stratégique et tous cela grâce à l’analyse de vos donnée. Ce qui peut être très intéressant pour votre entreprise.

Le Big Data ? A quoi sert-il concrètement ?

De manière général le big data sert simplement à stocker, traiter et analyser un nombre de données important. Ce traitement et cette analyse peut être grandement favorable à une entreprise si il est réalisé correctement. De nos jours plus de 53 % des entreprises ont adoptés le big data. Ce dernier fait désormais partie intégrante du Business IT.

Les avantages et inconvénient !

Le big data dans les entreprises est une réelle source d’informations élémentaire a l’évolution et a la pérennité d’une entreprise. Les possibilités du big data sont vraiment énorme. La collecte, la gestion et le traitement des données en fait un outil surpuissant et qui s’avère très utiles lorsque les données sont utilisé et traité correctement.

En revanche si la gestion et le traitement de ces données est négligé ou mal géré, cela peut s’avérer être une solution onéreuse qui ne vous apportera rien. Car les flux de données stocké sont tellement importants que le cout de stockage de ces données peut vite devenir un réel inconvénient pour l’entreprise. Sans compter les multiples risques et failles de sécurités qui peuvent voir le jour et dont vos données pourrait etre victimes.

Conclusion

Cet article vous a présenté succinctement comment les données sont récoltées, stockées puis analysées. Comme nous l’avons vu certaines de vos données sont analysées pour permettre de mieux cibler les futurs clients et faire en sorte que leurs offres correspondent d’avantage avec la demande.

De nos jours les données sont omniprésentes et servent à toutes sortent de processus que ce soit pour le simple stockage de ces dernière ou que ce soit pour l’analyse et la corrélation d’informations alors pensez a bien les utiliser.

A propos de SUPINFO | Contacts & adresses | Enseigner à SUPINFO | Presse | Conditions d'utilisation & Copyright | Respect de la vie privée | Investir
Logo de la société Cisco, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société IBM, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Sun-Oracle, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Apple, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Sybase, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Novell, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Intel, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Accenture, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société SAP, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Prometric, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo de la société Toeic, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management Logo du IT Academy Program par Microsoft, partenaire pédagogique de SUPINFO, la Grande École de l'informatique, du numérique et du management

SUPINFO International University
Ecole d'Informatique - IT School
École Supérieure d'Informatique de Paris, leader en France
La Grande Ecole de l'informatique, du numérique et du management
Fondée en 1965, reconnue par l'État. Titre Bac+5 certifié au niveau I.
SUPINFO International University is globally operated by EDUCINVEST Belgium - Avenue Louise, 534 - 1050 Brussels