Mise à jour le 16 déc. 2024
60 Crédits ECTS
MASTER 2 INFORMATIQUE / STATISTIQUE ET INFORMATIQUE (SISE)

Résumé

Le Master 2 Statistique et Informatique pour la Science des donnéEs (SISE), du parcours Statistique et Informatique, propose une formation avancée à la data science, avec une forte composante machine learning et statistique d'une part, informatique et En savoir plus

Accéder aux sections de la fiche

Call to actions

Une question sur votre orientation, votre stage, votre insertion professionnelle ?
Contactez le Service d'orientation et stage (COSIE)

Détails

Pré-requis

Niveau(x) de recrutement
BAC+4
Public ciblé
Le Master 2 SISE s'adresse principalement aux titulaires d'une première année de Master dans le domaine de l'informatique, de la statistique, des mathématiques appliquées, ou toute autre formation (Bac+ 4) comportant de solides connaissances en

Spécificités

Stage obligatoire, entre 4 et 6 mois, de la mi-mars jusqu'à  fin septembre.

Présentation

Le Master 2 Statistique et Informatique pour la Science des donnéEs (SISE), du parcours Statistique et Informatique, propose une formation avancée à la data science, avec une forte composante machine learning et statistique d'une part, informatique et technologies big data d'autre part.
 
La complémentarité de ces compétences constitue le socle de la science des données (data science) et de la valorisation des données massives (big data, big data analytics). Les étudiants peuvent se tourner vers les métiers traditionnels de la data science et de la statistique (data scientist, data analyst, ingénieur machine learning, chargés d'études statistiques, consultant data mining, consultant data science, ingénieur score, ...). Ils peuvent également, de par leurs compétences approfondies en informatique  en programmation (R et Python), en technologies big data et leurs applications (ex. hadoop, spark, dataviz, ...), en business intelligence et bases de données (conception et exploitation des entrepôts de données, outils ETL, bases de données NoSql, dataviz, …)  valoriser un profil de data scientist / data analyst dans le sens d'une synergie réelle entre la statistique / machine learning et l'informatique.
 
Le savoir-faire acquis dans les modules consacrés aux spécialisations et applications (text mining, web mining, analyse des réseaux sociaux, valorisation des données de sécurité) leur permet d'être directement opérationnels dans des environnements exigeants. Ils le sont d'autant plus que près de 40% des enseignants du Master SISE sont assurés par des professionnels. Les étudiants sont ainsi au fait des pratiques et préoccupations récentes des entreprises. Ils sont en prise directe avec les évolutions technologiques particulièrement rapides dans le domaine de la data science.
 
Le Master SISE peut accueillir, au titre de la formation continue, des professionnels en reconversion, qui ont déjà travaillé plusieurs années en entreprises et qui souhaitent s'investir dans la data science. Ils peuvent suivre la formation à titre personnel, ou en accord avec leur entreprise, ou dans le cadre d'un congé individuel de formation, ou disposer de tout autre cadre de financement. Les candidats concernés doivent être pleinement disponibles et suivent les mêmes cours que les étudiants en formation initiale.
 
Les étudiants de notre Master de Science des Données participent au programme académique de DataCamp (DataCamp for the Classroom). Ils y ont accès gratuitement au titre du Master SISE. Ce programme s'étale sur un semestre, il leur permet d'approfondir leurs connaissances en R, Python, statistique, data mining et machine learning, data visualisation (Dataviz) (la liste des enseignements est visible sur le site). Le programme DataCamp aboutit à une certification en Data Science.
 
Pour les candidatures extérieures à notre M1 Informatique, un programme de remise à niveau est prévu durant l'été qui précède la rentrée d'octobre. Il débute à la mi-juillet lorsque la première vague de recrutement est terminée. Les thématiques abordées sont personnalisées selon le profil et le niveau académique des candidats (http://tutoriels-data-mining.blogspot.com/p/sise.html). Elle prend la forme de supports de cours à lire, puis des exercices à réaliser, principalement sous R et Python, avec un suivi du responsable de la formation (corrections du travail rendu, commentaires, indications, échanges).
 
Ce programme est obligatoire pour les candidats en reconversion ou en réorientation. Il constitue la condition sine qua non de la réussite de ces profils. Ils doivent avoir le niveau requis pour attaquer directement l'année au même titre que les étudiants provenant de nos filières habituelles à la rentrée d'octobre.

Lieux

Campus Porte des Alpes (PDA)

Responsable(s) de la formation

Admission

Pré-requis

Niveau(x) de recrutement

BAC+4

Formation(s) requise(s)

Un niveau solide, ou tout du moins une appétence certaine, en informatique, statistique et mathématiques appliquées.
Pour les candidatures extérieures à notre M1 Informatique, un programme de remise à niveau est prévu durant l'été qui précède la rentrée d'octobre. Il est obligatoire.
 

Public ciblé

Le Master 2 SISE s'adresse principalement aux titulaires d'une première année de Master dans le domaine de l'informatique, de la statistique, des mathématiques appliquées, ou toute autre formation (Bac+ 4) comportant de solides connaissances en informatique, statistique et mathématique.

Une disposition spécifique est prévue pour les personnes en formation continue qui sont dans une démarche de reconversion. De même, les étudiants ayant au moins un niveau Bac + 4 en réorientation sont le bienvenu également. Tout dépend du niveau académique et de la solidité de la démarche du candidat.

Pour ces deux types de profils (reconversion ou réorientation), un programme de remise à niveau à suivre durant l'été précédent la rentrée a été mis en place. Il est obligatoire pour ces candidats. Il constitue la condition sine qua non de la réussite de ces profils. Les candidats doivent avoir le niveau requis pour attaquer directement l'année au même titre que les étudiants provenant de nos filières habituelles à la rentrée d'octobre.

Modalités de candidature

Les candidatures sont à déposer sur la plateforme eCandidat selon le calendrier de candidature

  • pour les étudiant.es non inscrit.es à l'Université Lumière Lyon 2
  • pour les étudiant.es inscrit.es à l'Université Lumière Lyon 2
  • pour les candidat.es de l’Union Européenne, de l’Espace Économique Européen ou de la Suisse (dossier de "Demande d'accès" via eCandidat)
  • pour les étudiant.es non européen.nes qui résident en France ou dans un pays non équipé de Campus France (dossier de "Demande d'accès" via eCandidat)

Pour les étudiant.es non européen.nes qui résident dans un pays équipé de Campus France : la procédure CEF/Campus France est en ligne sur le site Campus France de votre pays

Programme

Le programme du Master SISE est articulé autour des enseignements fondamentaux, des applications et de la professionnalisation.
 
Les enseignements fondamentaux concernent la maîtrise des méthodes de statistique au sens large, incluant les techniques de modélisation de machine learning et de data mining. L'objectif est que l'apprenant doit comprendre les principes sous-jacents à ces méthodes, leurs mécanismes internes, leur champ d'application. Ils (les enseignements fondamentaux) concernent également l'informatique, qui va largement plus loin que la manipulation des outils. Les étudiants doivent acquérir des compétences fortes dans le développement d'applications de machine learning (développement et déploiement de librairies de calcul, d'applications avec un front-end web, etc.) ; de conception et de gestion des bases de données conventionnelles ou non (NoSQL, lac de données), locales ou dans le cloud ; de manipulation et d'intégration de technologies big data (hadoop, spark, …).

Les applications concernent la mise en œuvre des techniques statistiques et de machine learning dans des contextes et sur des données de nature particulière. Il s'agit notamment du traitement des données non-structurées qui sont pléthores aujourd'hui avec le web, mais aussi des images, des informations en provenance des réseaux sociaux collectées à l'aide d'API spécialisées, des données produits par les outils de la sécurité informatique (fichiers logs, …). Au-delà de la simple déclinaison des méthodes statistiques dans ces domaines, ils permettent de développer des approches et des compétences spécifiques valorisables sur le marché du travail.

La professionnalisation enfin concerne en particulier la mise en situation des étudiants dans le monde professionnel. Ils doivent gérer notamment les manifestations promotionnelles de nos formations durant la partie académique de l'année, entres autres : le forum qui consiste à faire venir les entreprises au contact de nos étudiants ; les journées thématiques (Securiday, Dataday, BI-Day, …) où des professionnels viennent partager leur expérience, avec l'organisation de challenges et d'ateliers sponsorisés, … Les étudiants acquièrent une expérience forte en travaillant dans des situations réelles, avec tous les écueils que cela peut représenter (un intervenant qui se désiste à la dernière minute par ex.).
      • Bases de données NoSQL (TD)
      • Fouille de données massives (TD)
      • NLP - Traitement automatique du langage naturel (TD)
      • Entrepôt de donn avancées (TD)
      • Logiciels - Data visualisation, BI, Cloud, MLOps (TD)
      • Machine learning sous Python (TD)
      • Programmation statistique sous R (TD)
      • Analyse de variance et plans d'expériences (TD)
      • Biostatistique, données catégorielles (TD)
      • Séries temporelles et données séquentielles (TD)
      • Deep learning - Machine learning - Computer Vision (TD)
      • Fouille du web et analyse des réseaux sociaux (TD)
      • Technologies Big Data (TD)
      • Visualisation et analyse des données de sécurité (TD)
      • Anglais (TD)
      • Gestion de projet (CM)
      • Gestion de projet (TD)
      • Recherche d'emploi - Projet professionnel (TD)
      • Séminaires de recherche et ateliers techniques (TD)
      • Stage FC (Stage)
      • Stage FI (Stage)

Stage obligatoire, entre 4 et 6 mois, de la mi-mars jusqu'à fin septembre.

Le stage peut être effectué à l'étranger.

Présentiel

L’année universitaire est subdivisée en deux parties.
 
D’octobre à mars, les étudiants suivent un enseignement académique en présentiel à temps plein, incluant les cours et les évaluations, la plupart sous la forme de projets à réaliser en groupe. Il s'agit d'un choix pédagogique fort. L’opportunité de les faire travailler sur des sujets innovants à haute teneur technologique est très formateur pour nos étudiants.  Les projets leur permettent d’aller au-delà du cadre du cours. Ils donnent lieu à la rédaction d’un rapport et, pour certaines matières, à la réalisation d’une application informatique et inclut une soutenance. Le travail en groupe est motivant et permet une synergie forte entre les étudiants.
 
La très grande majorité des séances ont lieu dans une salle dédiée qui permet de mixer les enseignements théoriques, les travaux dirigés et les applications pratiques sur machine.
 
A partir de la mi-mars, les étudiants effectuent un stage obligatoire d’une durée de 4 à 6 mois, en France ou à l’étranger. La majorité des stages ont lieu dans des entreprises. Néanmoins, les personnes qui se destinent à une poursuite d’études peuvent effectuer leurs stages dans des laboratoires de recherche pour par la suite embrayer avec une thèse de doctorat en machine learning, éventuellement en coopération avec les entreprises sous la forme de thèse CIFRE.
 
Les thèmes de prédilection des stages des étudiants du Master SISE sont principalement la data science, le machine learning et les statistiques, et dans une moindre mesure la business intelligence (informatique décisionnelle).

Et après ?

Niveau de sortie

Année post-bac de sortie

Bac+5

Niveau de sortie

Master

Compétences visées

Activités visées / compétences attestées

Former les apprenants aux fondements et à la pratique de la data science. Fortes compétences en machine learning et ses applications, méthodes statistiques, d'une part ; informatique, programmation, informatique décisionnelle, technologies big data, gestion et manipulation des bases de données, d'autre part. Plus précisément :
  • Mener des projets de data science
  • Concevoir et réaliser des études statistiques
  • Maîtriser les techniques de data mining et de machine learning, ainsi que les technologies big data (hadoop, spark)
  • Savoir conduire des études dans les domaines clés de la data science (text mining, image mining, analyse des réseaux sociaux, traitement des données du web, analyse des données de sécurité informatique, etc.)
  • Savoir valoriser et exploiter des données massives (big data analytics)
  • Maîtriser les outils informatiques de la data science, entres autres les outils de dataviz
  • Maîtriser la programmation statistique avec les outils qui font référence (R, Python)
  • Travailler dans des environnement de big data, en particulier dans le cloud

Connaissances à acquérir

  • Maîtriser les méthodes statistiques, de machine learning et de data mining avancées
  • Savoir manipuler les environnements et les technologies big data (hadoop, spark)
  • Savoir concevoir et manipuler les bases de données conventionnelles (entrepôts de données) et non-conventionnelles (NoSQL)
  • Mener et déployer des projets de machine learning et de data science
  • Gérer des études complètes, partant du recueil des besoins, des données, jusqu'au déploiement des modèles

Débouchés professionnels

Secteurs d'activité ou type d'emploi

Les étudiant.es issu.es du parcours Statistique et Informatique pour la Science des donnéEs (SISE) occupent les métiers traditionnels de la data science, du machine learning, de la statistique, et de ses applications : data scientist, statisticien/ne, ingénieur.e statisticien/ne, , data analyst, ingénieur.e machine learning, ingénieur big data, chargé.e puis directeur/trice d'études, biostatisticien/ienne, chargé.e de traitement data mining.

Les étudiant.es expriment leur savoir-faire dans tous secteurs où la valorisation des données massives prend une dimension importante : banques, assurances, industrie,distribution, collectivités territoriales, protection sociale, instituts d'études. Les sociétés de service informatique ont également investi le domaine de la science des données et expriment un besoin fort en compétences statistiques.

Inscriptions

Coût de la formation

Le montant d’inscription à l’Université Lumière Lyon 2 est composé des droits d’inscription nationaux, plus la contribution Vie Etudiante et de Campus (CVEC). Plus d'informations sur cette page.