Ce Master spécialisé forme des managers experts capables de piloter des projets de science des données en intégrant les enjeux de responsabilité et d'éthique. Destiné à des professionnels ou jeunes diplômés en informatique, mathématiques ou gestion, la formation développe les compétences stratégiques nécessaires pour identifier les opportunités data, analyser la gouvernance SI et formuler des recommandations éclairées. Elle prépare à des rôles de leadership dans la transformation numérique des organisations.
Capacités attestées
* Identifier, comparativement au périmètre d’activité en charge, les éléments clés du diagnostic stratégique comme ceux de la gouvernance du système d’information de l’organisation considérée – qu’elle soit privée, publique ou hybride -, de sorte à définir les objectifs de veille à conduire sur les dimensions technologiques comme non technologiques pertinentes (réglementaires, écologique, éthique, géopolitique..) et ainsi inventorier des opportunités et risques nécessaires aux futurs arbitrages concernant des solutions data et IA * Organiser la veille – ou compléter une veille existante - selon les objectifs définis, en inventoriant les sources d’informations - formelles et informelles - pertinentes et fiables au regard des domaines à couvrir, en sélectionnant les outils d’exploration à mobiliser, en spécifiant les rythmes d’actualisation et les modalités de restitution de manière à structurer et rendre efficace le processus de veille * Investiguer, en termes de veille, non seulement les évolutions en termes de modalités de traitement et d’analyse, afin de répertorier de nouveaux modèles, algorithmes, langages et techniques informatiques, mais aussi le domaine des bases de données disponibles - qu’elles soient externes (dont l’open data) ou internes à la structure -, pour améliorer, compléter, préciser les résultats d’analyses et leur niveau de pertinence en vue d’identifier les opportunités de leur intégration dans la chaîne d’analyse des données (processus data) * Explorer un axe de veille orienté sur les dernières avancées technologiques et scientifiques (quantiques et habilitantes, 6 et 7G, etc…) afin d’anticiper les évolutions des pratiques et des expertises datas avec les possibles incidences sur les besoins en compétences et la pérennité de certains choix technoscientifiques * Evaluer les opportunités et risques écologiques des solutions en science des données envisagées tant sur les phases de production, de modes de gestion de données, et d’usages qui en découleraient afin d’intégrer l’impact écologique comme dimension d’arbitrage * Répertorier les bonnes pratiques et les questionnements en termes d’éthiques afin de s’assurer que les solutions en science des données repérées pour de possibles applications futures respectent les principes de responsabilité sociétales et ne risquent pas d’être à l’origine d’une prise de risques pour l’organisation * Effectuer des recommandations de solutions datas pertinentes et viables pour l’organisation en proposant une synthèse récapitulative des principales opportunités et menaces des options répertoriées tant dans leurs dimensions techniques (SI et Data), organisationnelles mais aussi économiques, environnementales, sociétales, et éthiques afin de proposer les alternatives possibles et les éléments d’arbitrages à la Direction * Etablir le cahier des charges (note de cadrage) fonctionnel et technique de la demande client – interne ou externe - à partir d’une analyse des besoins, reposant sur une approche adaptée des processus métiers, de manière à le reformuler, le valider de sorte à définir le dimensionnement du projet, les technologies à mettre en place, les démarches nécessaires, sa faisabilité (technique, ressources, et « timing »), notamment au regard de l’infrastructure existante du système d’information * Définir, à partir du cahier des charges, des technologies pressenties, et du caractère innovant ou pas de la solution à élaborer, la méthodologie de projet adéquate classique (agile, waterfall, stage gate process, TLS théorie des contraintes Lean Six Sigma,..) ou innovante (design thinking, lean startup,..), pouvant être fonction du projet, des pratiques et des exigences de l’organisation et du secteur, de manière à optimiser la réalisation des livrables du projet en termes de faisabilité, qualité, coûts et délais * Décliner, si le projet est innovant, le processus de l’innovation – dit « pipeline de l’innovation » - nécessitant des phases spécifiques amont (brainstorming, créativité, prototypage, enquête terrain,..) ainsi que les multiples boucles d’itération concernant les différentes étapes de validités de sorte à proposer une solution à même d’offrir le caractère innovant idoine souhaité et conforme au besoin à satisfaire * Identifier, dès les premières phases du projet, les phases de la chaîne de valeur du process générant les impacts écologiques les plus négatifs, de manière à soutenir une éco-conception (réduction de l’obsolescence, IA frugale, plan de nettoyage du Dark data …) la plus pertinente sur la solution en science des données en cours d’élaboration * Répertorier les différents types de risques (technologiques, réglementaires, concurrentiels, ..) pouvant impacter le projet afin d’en définir leur criticité et les actions correctives possibles en mobilisant les méthodologies en contexte opérationnel de type adéquates (AMDEC,…) * Organiser, que ce soit pour un projet innovant ou non, les phases de déroulement d’un projet classique selon la méthodologie définie articulant les étapes –souvent itératives- de collecte, d’exploration, d’exploitation et de mise en production des données et les différentes actions nécessaires (organigramme, organisation planification des taches, chemin critique, définitions des livrables, « work package »),.. afin de garantir une réponse satisfaisante, en temps et en heure, au cahier des charges des clients internes et externes * Animer les équipes et les parties prenantes, dans le respect des valeurs éthiques et inclusive, au travers notamment d’actions de communication cadencées, structurées, mobilisant les tiers requis, usant des outils et des modalités adéquats, de manière à assurer la transparence et la fluidité de l’information propice à l’efficacité de l’organisation du travail et au climat de confiance * Promouvoir l’usage des méthodes d’intelligence collective (mobilisation des profils de personnalités, inclusion, brainstorming, event storming, ..) afin de renforcer l’engagement des parties prenantes, d’améliorer l’appréhension de la diversité des points de vue, de stimuler la créativité, et d’optimiser la prise de décision, contribuant ainsi à l’efficacité du projet et à la qualité du livrable final * Définir, en relation avec d’autres experts des sciences des données, une solution de traitement de données concernant leur acquisition, stockage et mise à disposition, en déployant les différentes étapes de la constitution d’un pipeline de traitement de données compatible avec le SI existant, sur la base d’une analyse de celui-ci, de l’identification des axes de stratégie et de politique Données et SI de l’organisation, comme des besoins métiers afin de permettre une mobilisation des données générant de la valeur * Identifier, en considérant les interdépendances avec les autres problématiques et enjeux de l’entreprise, les données pertinentes pour la solution envisagée, en sélectionnant à la fois les données déjà repérées et disponibles en interne, comme des données externes mobilisables, via des achats, des sources disponibles en open data, ou des partenariats, afin d'accroître la pertinence des analyses qui en seront réalisées * Évaluer la qualité nécessaire des données afin de décider de la mise en œuvre ou non de leur nettoyage (par modification, par imputation, par suppression,..), de sorte à ultimement optimiser la pertinence des résultats obtenus par les analyses effectuées sur ces données * Intégrer les données identifiées dans le système d’information de l’entreprise en arbitrant sur la ou les méthodes adaptées (ETL et ELT), les langages (Python, JavaScript,..), les outils [bases de données relationnelles, bases de données NoSQL - MongoDB, Neo4J,..-], l’utilisation de systèmes distribués de manière à avoir accès facilement et efficacement à l’ensemble des données requises * Mettre en place des processus d’interrogation du Web -sémantique ou non- en tirant partie du fonctionnement sous-jacent des moteurs de recherche textuel ainsi que de la structuration des données disponibles (pages web, web sémantique,..) dans le but d’extraire de l’information exploitable * Mener des évaluations concernant le respect de la sécurité et la confidentialité -issues notamment des réglementations nationales et internationales dont le RGPD-, des infrastructures utilisées, en mettant en œuvre des phases de test, une démonstration des vulnérabilités aux parties prenantes de manière à prodiguer les recommandations nécessaires et leur déploiement le cas échéant * Conceptualiser un problème professionnel en problématique de traitement de données, en définissant, une fois le ou les cas d’usage bien clarifié(s), si la tâche est descriptive ou prescriptive, les méthodes à utiliser, les analyses à mener et les livrables à produire, de sorte à répondre à une sollicitation des Directions de l’organisation, visant à améliorer l’efficacité du SI et de ses données, l’aide à la décision, l’élaboration de nouvelles offres * Etablir un premier inventaire des types de solutions en science des données, adapté au système data existant, en termes de : données, modalités de stockage, modèles statistiques et d’algorithmes d’apprentissage automatique -machine learning, deep learning-, de sorte à adapter au mieux la pertinence de la solution à la nature des données devant être analysées * Evaluer l’intérêt de l’introduction de nouvelles méthodes de data science (IA, Deep learning, technologie de seconde génération quantique, …) en mobilisant les connaissances des fondements de la science des données pour questionner la pertinence des options techniques envisagées et l’intégration de ces dernières au SI existant * Mobiliser les méthodes statistiques afin d’analyser les données disponibles et évaluer les réponses aux questions posées de manière à éviter l’influence des valeurs extrêmes, erronées, manquantes, ou des situations de sur-apprentissage * Élaborer un modèle d’apprentissage automatisé en sélectionnant un algorithme (Deep learning, KNL,…) et la mise en place de jeux de données d’apprentissages, de tests et de validations pour entrainer le modèle et valider ses capacités prédictives * Intégrer dans les solutions techniques envisagées les coûts de fonctionnement des structurations des données et des modalités de traitement de manière à en optimiser l’impact budgétaire et à en réduire l’impact environnemental * Elaborer une estimation de la valorisation économique de la solution data, en mobilisant par exemple le Business Model Canvas –BMC- permettant d’identifier la création de valeur et sa structuration afin de stabiliser la pertinence et la pérennité de la solution, et plus généralement sa contribution aux performances économiques et extra-économiques de l’entreprise * Définir, outre la valorisation économique, différentes catégories d’indicateurs de performances économiques et non économiques permettant de piloter et de spécifier les résultats attendus en termes d’optimisation des ressources (Retour sur investissement –ROI-, coût total de fonctionnement), en termes d’efficacité opérationnelle, en termes de conformité, de satisfaction client,.. de manière à préserver et à atteindre les objectifs de la solution visée * Justifier de la prise en considération des risques et enjeux de conformité (droit, légal) et sécuritaires dans les arbitrages concernant les différentes composantes de la solution responsable de manière à offrir une solution data sécure, fiable et conforme aux lois en vigueur sur la science des données et leur exploitation chez leurs clients (interne – externe) * Préconiser une solution de visualisation des données utilisant les standards actuels, les règles relevant du fonctionnement de la perception visuelle et de la sémiologie graphique, de manière à la rendre inclusive, d’être à même d'en évaluer l'efficacité afin de permettre une restitution qualitative des informations pertinentes aux différentes équipes métiers concernées et d’en améliorer l'impact * Communiquer à l’oral ou à l’écrit de manière efficiente, pertinente, percutante et juste sur une solution data vers des spécialistes et non spécialistes (Flyer, Pitch, présentation Flash BMC, document technique, …. ) de manière à assurer l’engagement et l’intérêt pour la solution tant au niveau des équipes parties prenantes à l’élaboration de la solution, les futurs usagers, les sponsors du projet comme les Directions, actrices de la décision et de promotion