Le « Data Stream » ou « Data Streaming » regroupe un ensemble de technologies permettant l’exploitation de données industrielles en temps réel. Plutôt que de stocker et traiter ponctuellement de la data (approche dite de « batch »), le Data Stream propose une acquisition et une analyse continue de l’information. Des outils de « Stream Processing » sont pour cela utilisés afin d’analyser ces flux de données avec des résultats obtenus en quelques minutes, voire quelques secondes. Ces outils reposent notamment sur des briques technologiques issues de l’intelligence artificielle (IA) comme le machine learning (lire fiche dédiée).
Le Data Stream est étroitement lié au Big Data, dont il reprend certains procédés pour traiter de gros volumes de données, ainsi qu’à l’IIoT afin de collecter la data (lire fiches dédiées). Comme pour le Big Data, l’objectif du Data Stream est de « donner du sens » aux données, mais en mettant l’accent sur la réactivité. Ses domaines d’application sont théoriquement très larges et vont de la production à la logistique, en passant par la maintenance ou même l’activité commerciale.
Sources : Smart-Industries, Nextworld.fr
1 – Se lancer dans le Data Stream avec un système d’information (SI) inadapté. Le traitement de la donnée en temps réel nécessite des architectures spécifiques (notamment Lamdba, Kappa ou Datalake) qu’il faut déployer sur un SI performant et dimensionné pour cet usage.
2- Sous-estimer la question de la cybersécurité. Comme pour le Big Data, les volumes de données traitées en Data Stream sont très larges, ce qui augmente d’autant les risques cyber. Le déploiement d’une plateforme de Data Stream requiert en général un renfort de la sécurité du SI.
3 – Privilégier le quantitatif au qualitatif. Pour que le système soit efficace, les flux de données doivent être de bonne qualité. Une analyse qualitative de ces flux est souvent une première étape (identification de doublons, de mesures aberrantes, d’informations manquantes).
1 – Etre plus réactif dans la prise de décision. Par rapport à l’analyse ponctuelle de la donnée, le Stream Data réduit grandement le délai entre la production de la data et son utilisation effective, ce qui permet de réagir plus rapidement.
2 – Gagner en performance opérationnelle. Le temps réel est un atout pour traiter les aléas de l’appareil de production mais aussi ceux de la chaine logistique, comme une rupture d’approvisionnement en matière première. Le Stream Data est donc censé améliorer globalement l’efficacité des opérations.
3 – Ne pas crouler sous le poids de la donnée. Dans certains cas, par exemple avec l’IIoT, stocker des données pour une analyse ultérieure peut s’avérer problématique, car les informations s’accumulent rapidement. Un traitement en temps réel permet de ne pas avoir à stocker l’intégralité de la data.
4 – Améliorer la relation client. Le Stream Data permet de réduire le temps de réponse à une requête de clients et de l’informer en temps réel, par exemple sur la production ou la livraison de sa commande.
1 – L’infrastructure informatique de l’entreprise est-elle suffisamment dimensionnée et performante ? La Data Stream nécessite un SI adapté et une architecture spécifique. Si le SI n’est pas haut niveau, il peut être pertinent de s’orienter vers le cloud.
2 – Est-ce que je dispose déjà de données pour « entrainer » les outils de Data Stream ? Avant d’être performants, les algorithmes doivent « apprendre » en analysant des historiques de données. Si ces informations ne sont pas déjà disponibles, le délai de mise en œuvre sera d’autant rallongé.
3 – Quelle activité de l’entreprise génère le plus de données ? Le déploiement d’une plateforme de Data Stream peut être graduel, en débutant par l’activité produisant le plus de datas (production, logistique, relation client…) avant un éventuel passage à l’échelle.
4 – Quel est le niveau de réactivité des équipes ? Si l’humain n’est pas lui-même réactif, le Data Stream perd tout son intérêt. Un poids hiérarchique trop lourd ou une mauvaise circulation de l’information peuvent ralentir la réponse humaine. Le Data Stream nécessite bien souvent une réorganisation de la prise de décision et de nouveaux supports d’accès à l’information.