CM – Top 6 des tendances en matière de données et d’analyses pour 2022

0

Page d’accueil VentureBeat.cls-1{fill:#ed2025;}.SiteLogo__v{fill:#ffffff;}

Écoutez les DSI, les CTO et d’autres cadres supérieurs et cadres supérieurs sur les stratégies de données et d’IA lors du Sommet sur l’avenir du travail du 12 janvier 2022. En savoir plus

Pendant des décennies, gérer les données signifiait essentiellement les collecter, les stocker et, occasionnellement, y accéder. Tout cela a changé ces dernières années, alors que les entreprises recherchent les informations critiques pouvant être extraites des quantités massives de données générées, consultées et stockées dans une myriade d’emplacements, des centres de données d’entreprise au cloud et à la périphérie. Étant donné que l’analyse des données – aidée par des technologies modernes telles que l’intelligence artificielle (IA) et l’apprentissage automatique – est devenue une capacité incontournable et en 2022, l’importance sera amplifiée. Les entreprises doivent analyser rapidement les données, pour la plupart non structurées, pour trouver les informations qui permettront de prendre des décisions commerciales. Ils doivent également créer un environnement de données moderne dans lequel cela se produise.

Vous trouverez ci-dessous quelques tendances en matière de gestion des données qui se manifesteront en 2022.

Il existe deux approches pour l’analyse des données d’entreprise. La première consiste à extraire les données d’applications métier telles que le CRM et l’ERP et à les importer dans un entrepôt de données pour alimenter les outils de BI. Désormais, ces entrepôts de données migrent vers le cloud, avec des technologies comme Snowflake. Cette approche est bien comprise, car les données ont un schéma cohérent.

La deuxième approche consiste à prendre toutes les données brutes et à les importer directement dans un lac de données, sans nécessiter de pré-traitement. C’est attrayant car tout type de données peut être canalisé dans un lac de données, et c’est pourquoi Amazon S3 est devenu un immense lac de données. Le problème est que certaines données sont plus faciles à traiter que d’autres. Par exemple, les fichiers journaux, les données génomiques, l’audio, la vidéo, les fichiers image et autres ne s’intègrent pas parfaitement dans les entrepôts de données car ils manquent d’une structure cohérente, ce qui signifie qu’il est difficile de rechercher dans les données. Pour cette raison, les lacs de données finissent par devenir des marais de données : il est trop difficile de rechercher, d’extraire et d’analyser ce dont vous avez besoin.

La grande tendance actuelle et une tendance continue des données pour 2022 est l’émergence de maisons de lac de données, rendues populaires par DataBricks, pour créer des lacs de données avec des données semi-structurées qui ont une certaine cohérence sémantique. Par exemple, un fichier Excel est comme une base de données même s’il n’en est pas une, donc les maisons de lac de données tirent parti du schéma cohérent de données semi-structurées. Bien que cela fonctionne pour les fichiers .csv, les fichiers Parquet et d’autres données semi-structurées, cela ne résout toujours pas le problème des données non structurées, car ces données n’ont pas de structure commune évidente. Vous avez besoin d’un moyen d’indexer et d’inférer une structure commune pour les données non structurées, afin qu’elles puissent être optimisées pour l’analyse de données. Cette optimisation des données non structurées pour l’analyse est un grand domaine d’innovation, d’autant plus qu’au moins 80% des données mondiales sont aujourd’hui non structurées.

Dans un effort pour démocratiser la science des données, les fournisseurs de cloud développeront et publieront davantage d’applications d’apprentissage automatique et d’autres outils de base tels que des workflows d’apprentissage automatique spécifiques à un domaine. Il s’agit d’une tendance fondamentale, car, au fil du temps, le niveau de ce que les individus auront besoin de coder va diminuer. Cela ouvrira l’apprentissage automatique à de nombreux autres postes : certains de ces scientifiques citoyens seront au sein de l’informatique centrale, et d’autres vivront dans des secteurs d’activité. Amazon Sagemaker Canvas n’est qu’un exemple des outils low-code/no-code que nous verrons davantage en 2022. La science citoyenne est assez naissante, mais c’est certainement la direction que prend le marché et une tendance à venir en matière de données pour 2022. Les plates-formes de données et les solutions de gestion des données qui offrent aux utilisateurs une simplicité semblable à celle d’un consommateur pour rechercher, extraire et utiliser des données gagneront en importance.

Le Big Data est presque trop volumineux et crée des marais de données difficiles à exploiter. Trouver avec précision les bonnes données en place, quel que soit l’endroit où elles ont été créées et les ingérer pour l’analyse des données, change la donne, car cela vous fera gagner beaucoup de temps et d’efforts manuels tout en fournissant une analyse plus pertinente. Ainsi, à la place du Big Data, une nouvelle tendance sera le développement d’analyses dites de « bonnes données ».

Certains pronostiqueurs disent que le lac de données cloud sera l’endroit ultime où les données seront collectées et traitées pour différentes activités de recherche. Alors que les lacs de données cloud gagneront assurément du terrain, les données s’accumulent partout : à la périphérie, dans le cloud et dans le stockage sur site. Cela nécessite, dans certains cas, la nécessité de traiter et d’analyser les données là où elles se trouvent, plutôt que de les déplacer vers un emplacement central, car c’est plus rapide et moins cher de le faire. Comment pouvez-vous non seulement rechercher des données à la périphérie, mais également en traiter une grande partie localement, avant même de les envoyer vers le cloud ? Vous pouvez utiliser des outils d’analyse basés sur le cloud pour des projets plus importants et plus complexes. Nous verrons plus de « clouds de périphérie », où le calcul arrive à la périphérie du centre de données au lieu des données qui vont dans le cloud.

Une fabrique de données est une architecture qui offre une visibilité sur les données et la possibilité de déplacer, de répliquer et d’accéder aux données à travers le stockage hybride et les ressources cloud. Grâce à des analyses en temps quasi réel, il permet aux propriétaires de données de contrôler l’emplacement de leurs données dans les nuages ​​et le stockage afin que les données puissent résider au bon endroit au bon moment. Les responsables informatiques et de stockage choisiront des architectures de matrice de données pour déverrouiller les données du stockage et permettre une gestion centrée sur les données et centrée sur le stockage. Par exemple, au lieu de stocker toutes les images médicales sur le même NAS, les professionnels du stockage peuvent utiliser les analyses et les commentaires des utilisateurs pour segmenter ces fichiers, par exemple en copiant des images médicales pour y accéder par apprentissage automatique dans une étude clinique ou en déplaçant des données critiques vers un stockage cloud immuable. pour se défendre contre les ransomwares.

De nombreuses organisations disposent aujourd’hui d’un environnement cloud hybride dans lequel la majeure partie des données est stockée et sauvegardée dans des centres de données privés sur plusieurs systèmes de fournisseurs. À mesure que les données (fichiers) non structurées ont augmenté de façon exponentielle, le cloud est utilisé comme niveau de stockage secondaire ou tertiaire. Il peut être difficile de voir à travers les silos pour gérer les coûts, garantir les performances et gérer les risques. En conséquence, les responsables informatiques se rendent compte que l’extraction de valeur des données à travers les clouds et les environnements sur site est un défi formidable. Les stratégies multicloud fonctionnent mieux lorsque les organisations utilisent différents clouds pour différents cas d’utilisation et ensembles de données. Cependant, cela entraîne un autre problème : le déplacement de données est très coûteux lorsque et si vous devez ultérieurement déplacer des données d’un cloud à un autre. Un concept plus récent consiste à tirer le calcul vers des données qui se trouvent à un seul endroit. Ce lieu central pourrait être un centre de colocation avec des liens directs avec les fournisseurs de cloud. Le multicloud évoluera avec différentes stratégies : parfois le calcul vient à vos données, parfois les données résident dans plusieurs clouds.

Les entreprises continuent de subir une pression croissante pour adopter des stratégies de gestion des données qui leur permettront de tirer des informations utiles du tsunami de données pour prendre des décisions commerciales critiques. L’analyse sera au cœur de cet effort, ainsi que la création de structures de données ouvertes et basées sur des normes qui permettront aux organisations de contrôler toutes ces données pour l’analyse et l’action.

DataDecisionMakers est l’endroit où les experts, y compris les techniciens travaillant sur les données, peuvent partager des idées et des innovations liées aux données.

Si vous souhaitez en savoir plus sur les idées de pointe et les informations à jour, les meilleures pratiques et l’avenir des données et de la technologie des données, rejoignez-nous à DataDecisionMakers.

AWS Activate propose des outils gratuits, des formations et plus encore pour les startups afin de vous aider à créer et à faire évoluer rapidement. De plus, vous pouvez recevoir jusqu’à 100 000 $ de crédits Activate.

Nous pouvons collecter des cookies et d’autres informations personnelles à partir de votre interaction avec notre
site Internet.
Pour plus d’informations sur les catégories d’informations personnelles que nous collectons et les finalités que nous utilisons
eux pour,
veuillez consulter notre avis à la collection.

Titre associé :
Les 6 principales tendances en matière de données et d’analyses pour 2022
Alors que le recours à l’analyse des données augmente, les agences se tournent vers les talents, l’automatisation

Keywords:

Analytics,Data analysis,Big data,Analytics, Data analysis, Big data,,

Donnez votre avis et abonnez-vous pour plus d’infos

[gs-fb-comments]

[comment]

[supsystic-newsletter-form id=4]

Vidéo du jour: