Statistique

Description du programme

La statistique concerne l’élaboration et l’emploi de méthodes mathématiques et informatiques pour la collecte, l’analyse et l’interprétation de données visant à soutenir la recherche scientifique, la prise de décision éclairée et la gestion des risques. Elle fait appel à un large éventail d’outils, allant de la théorie des probabilités aux techniques de calcul intensif sur ordinateur. Parmi les principaux domaines de recherche des statisticiens du réseau de l’ISM, notons

  • la modélisation de la dépendance et l’analyse multivariée
  • la modélisation des données de grande dimension
  • l’analyse de survie
  • l’analyse de valeurs extrêmes
  • l’apprentissage machine
  • l’apprentissage statistique
  • la statistique directionnelle
  • la statistique non paramétrique
  • la théorie des processus empiriques
  • le calcul statistique
  • les séries chronologiques
  • les techniques d’enquête
  • l’inférence bayésienne et méthodes MCMC
  • l’inférence causale

La recherche statistique est motivée en grande partie par des collaborations interdisciplinaires. Elle trouve des applications dans de nombreux domaines tels la biologie, les sciences de l’environnement, la finance et l’assurance, les sciences de la santé, l’hydrologie, le marketing et les sciences sociales. Avec l’abondance d’ensembles de données complexes et de grande taille émanant entre autres des médias sociaux et des processus numériques, des transactions financières, de l’astronomie, de la génomique, de la météorologie ou de la mégascience comme le grand collisionneur de hadrons, le traitement et l’analyse de données volumineuses est un enjeu majeur de la statistique moderne.

Membres du programme

Formation

Le programme de statistique fournit aux étudiants gradués l'occasion d'étudier dans ces deux domaines importants de la statistique moderne. Les cours offerts dans ce programme permettront aux étudiants de 2e et 3e cycles de bien se familiariser avec les bases de la statistique mathématique, de la théorie de la décision et la statistique appliquée. De plus, quelques cours sont offerts pour initier les étudiants à des sujets de pointe dans ces domaines.

Ce programme est ouvert à tous les étudiants ayant une base solide en calcul différentiel et intégral, statistique mathématique, analyse numérique ainsi qu'en probabilité (le tout au niveau du 1er cycle). Pour acquérir une bonne formation en théorie de la décision et en statistique mathématique, nous pensons que les étudiants devraient prendre un cours de base en mesure et intégration (pour les étudiants au 3e cycle) et au moins trois cours aux niveaux intermédiaires et avancés.

Cours 2019-20

Automne

Introduction to Directional Statistics

Prof. Ashis SenGupta

MAST 679/881/2

Institution: Concordia University

Statistical Consulting and Data Analysis

Prof. Lisa Kakinami

MAST 678/2, AA

Institution: Concordia University

Techniques d'exploitation de données (data mining)

Ce cours présente certaines des principales techniques d'analyse de grandes bases de données (data mining). Les technologies de l'intelligence d'affaires permettent aux entreprises, entre autres, d'analyser les données recueillies pour leurs opérations afin de mieux comprendre le comportement de leurs clients dans le but d'aider à anticiper la demande, accroître la rétention ou réduire la fraude. Différentes techniques de l'intelligence d'affaires, parmi les plus utilisées en pratique, seront donc présentées et illustrées à partir d'exemples concrets dans différents domaines de gestion.

Prof.

60600

Institution: HEC Montréal

Analyse multidimensionnelle appliquée

Les entreprises croulent littéralement sous le poids des données qu'elles ont à leur disposition. Ces données contiennent potentiellement une quantité importante d'informations pouvant être bénéfiques à l'entreprise si utilisées correctement. Sous le vocable « data mining », on retrouve différentes techniques statistiques utilisées pour explorer et analyser de grands ensembles de données. Ces techniques ont généralement pour but de développer des modèles prévisionnels, de réduire la taille des données, de faire de la segmentation ou bien de découvrir des associations pertinentes. L'analyse multidimensionnelle est à la base de plusieurs techniques de data mining et est utilisée dans plusieurs domaines de gestion dont le marketing. 

Le but du cours analyse multidimensionnelle est de donner aux étudiants(e)s une formation de base en traitement de données multidimensionnelles. Plusieurs techniques statistiques seront présentées et on insistera surtout sur la compréhension intuitive, l'interprétation correcte et l'utilisation pratique de celles-ci. Par conséquent, l'emploi de concepts mathématiques sera réduit à son minimum et ces derniers ne serviront qu'à faciliter la compréhension des méthodes étudiées. Le logiciel SAS sera utilisé mais aucune connaissance préalable de celui-ci n'est requise. Par contre, une connaissance des concepts et méthodes statistiques (population, échantillon, estimation, test d'hypothèse) de base est requise.

Prof.

60602

Institution: HEC Montréal

Apprentissage statistique

Ce cours présente les concepts fondamentaux en analyse de données et apprentissage statistique, ainsi que les bases de la modélisation prédictive.

Ce cours présente les méthodes de base et certaines avancées en apprentissage non-supervisé (par exemple technique de réduction de la dimensionnalité, analyse de regroupement) et supervisé (par exemple modèles paramétriques, arbres et forêts aléatoires, boosting). Des exemples d'application en gestion illustrent l'utilisation de ces méthodes.

Prof. Aurélie Labbe

60603

Institution: HEC Montréal

Statistical Learning - HEC

This course introduces the fundamental concepts in data analysis and statistical learning, as well as the basics of predictive modeling.

This course introduces basic and some advanced methods in unsupervised learning (e.g. dimensionality reduction, cluster analysis) and supervised learning (e.g. parametric model, trees and random forests, boosting). Examples of applications in management illustrate the use of these methods.

 

Prof.

60603A

Institution: HEC Montréal

Modélisation statistique

L'objectif est de fournir aux étudiants les bases de l'inférence statistique ainsi que les outils de modélisation dans un contexte de régression. Les principes théoriques des modèles et d'inférence seront abordés rigoureusement, en mettant l'accent sur les applications à l'aide du logiciel SAS.

Plusieurs modèles de régression seront abordés, tels que la régression multiple, la régression non linéaire, les modèles linéaires généralisés et la régression pour données longitudinales avec effets aléatoires et structures de corrélation. Une introduction à l'analyse de données fonctionnelles sera aussi donnée. Pour chacune de ces méthodes, les principes théoriques de l'inférence, tels que les tests d'hypothèse, statistiques de tests et méthodes d'estimation seront abordés avec rigueur. Une attention particulière sera aussi portée aux applications en gestion à l'aide du logiciel SAS.

Prof.

60604

Institution: HEC Montréal

Logiciels statistiques pour l'analyse des données

L'étudiant apprendra à programmer en SAS et en R afin de nettoyer des jeux de données, de les représenter graphiquement et d'en faire une analyse statistique complexe. En plus de maîtriser le code de base de SAS, l'étudiant apprendra la syntaxe du module ODS qui permet de gérer le contenu des sorties. Il apprendra aussi le langage macro de SAS et s'en servira . afin de créer des fonctions permettant des analyses statistiques supplémentaires. En R, l'étudiant apprendra les bases du langage qui lui serviront à faire une analyse statistique des données .. II ·apprendra aussi à écrire des fonctions permettant l'analyse statistique de données et à construire une librairie de fonctions afin de partager les outils d'analyse qu'il aura codés. R et SAS sont basés sur des langages de programmation différents que l'étudiant devra apprendre à maîtriser.

Prof.

60613

Institution: HEC Montréal

Analyse et inférence statistique

L'objectif principal du cours est de fournir à l'étudiant les notions fondamentales de l’analyse et de l’inférence statistique ainsi que les méthodes statistiques avancées. En plus des concepts théoriques, ce cours mettra particulièrement l'accent sur les applications pratiques de ces méthodes dans des contextes de recherche.

Prof.

60619

Institution: HEC Montréal

Apprentissage automatique I : Large-Scale Analysis and Decision Making

Ce cours porte sur les modèles d'apprentissage automatique (machine learning). En plus des modèles standards nous étudierons aussi les modèles pour analyser les comportements des utilisateurs ainsi que pour la prise de décision.

L'avènement des données massives requiert des outils d'analyses appropriés. L'apprentissage automatique (machine learning) offre ces outils et est incontournable pour modéliser des problèmes dans divers domaines tels que l'intelligence artificielle, la bio-informatique, la finance, le marketing, l'éducation, le transport et la santé. Nous étudierons les modèles d'apprentissage automatique pour l'apprentissage supervisé, non supervisé et comment ils peuvent être étendus aux données massives à l'aide de techniques de calcul à grande échelle (p. ex. grappes d'ordinateurs). Nous étudierons en plus des modèles récents pour les systèmes de recommandations ainsi que pour la prise de décision (apprentissage par renforcement).

Les étudiants auront l'occasion de bonifier leurs connaissances en effectuant un projet requérant l'analyse de données réelles (par exemple venant de leur champ de recherche). À noter : L es étudiants devront déjà connaitre un langage de programmation.

Prof.

80629

Institution: HEC Montréal

Machine Learning for Large-Scale Data Analysis and Decision Making

In this course, we will study machine learning models, a type of statistical analysis that focuses on prediction, for analyzing very large datasets ("big data"). In addition to standard models, we will study models for analyzing user behaviour and for decision making. Massive datasets are now common and require scalable analysis tools.  Machine learning provides such tools and is widely used for modelling problems across many fields including artificial intelligence, bioinformatics, finance, marketing, education, transportation, and health.

In this context, we study how standard machine learning models for supervised (classification, regression) and unsupervised learning (for example, clustering and topic modelling) can be scaled to massive datasets using modern computation techniques (for example, computer clusters). In addition, we will discuss recent models for recommender systems as well as for decision making (including multi-arm bandits and reinforcement learning).

Through a course project students will have the opportunity to gain practical experience with the analysis of datasets from their field(s) of interest. A certain level of familiarity with computer programming will be expected.

Prof.

80629A

Institution: HEC Montréal

Experimental Designs and Statistical Methods for Quantitative Research in Management

This course has four main objectives: 1) to present the major experimental designs used for research in management and in the behavioral sciences; 2) to familiarize students with the statistical methods and software (e.g. PASW, formerly SPSS) used to analyze experimental data; 3) to interpret and present results from the statistical analyses and discuss the validity and limits of the methods; 4) to understand and to critic the methodology and statistical results of published articles in the research fields of the students.

Prof.

80677A

Institution: HEC Montréal

Théorie et applications des méthodes de régression

Régression linéaire. Modèles linéaires généralisés. Méthodes de sélection de variables. Validation de modèles. Modèles mixtes. Équations d'estimation généralisées. Couverture des aspects théoriques et mise en oeuvre pratique avec un logiciel statistique de tous ces modèles et méthodes.

Prof. Thierry Duchesne

STT 7125

Institution: Université Laval

Planification des expériences

Décomposition d'une série chronologique, tendance, saisonnalité, innovations, lissages, processus stationnaires, moyennes mobiles, processus autorégressifs, autocorrélations, bruit blanc, densité spectrale, prévisions optimales, modélisation SARIMA.

Prof. Lajmi Lakhal-Chaieb

STT 7230

Institution: Université Laval

Statistique non paramétrique

Problèmes à deux échantillons : tests de rang pour un paramètre de translation. Problèmes à un échantillon : tests de rang signé pour un paramètre de localisation. Comparaison de k traitements : test de Kruskal-Wallis, table de contingence, tests de Friedman, Cochran, etc. Tests de tendance et tests d'indépendance utilisant les rangs. Introduction au « bootstrap ».

Prof. Ting-Huei Chen

STT 7260

Institution: Université Laval

Séries chronologiques - Laval

Décomposition d'une série chronologique, tendance, saisonnalité, innovations, lissages, processus stationnaires, moyennes mobiles, processus autorégressifs, autocorrélations, bruit blanc, densité spectrale, prévisions optimales, modélisation SARIMA.

Prof.

STT 7635

Institution: Université Laval

Mathematical Statistics I

Distribution theory, stochastic models and multivariate transformations. Families of distributions including location-scale families, exponential families, convolution families, exponential dispersion models and hierarchical models. Concentration inequalities. Characteristic functions. Convergence in probability, almost surely, in Lp and in distribution. Laws of large numbers and Central Limit Theorem. Stochastic simulation.

Prof. David Stephens

MATH 556

Institution: Université McGill

Méthodes d'inférence pour les modèles à chaîne de Markov

Ce cours offre une introduction aux méthodes d’inférence statistique pour les modèles à chaîne de Markov cachée (hidden Markov models), aussi connus sous les appellations modèles à changement de régimes (regime-switching models) ou modèles espace-état (state-space models). Ce cours aborde les techniques de filtrage, de lissage et de prédiction ainsi que l’estimation des paramètres du modèle. Les méthodes suivantes seront notamment étudiées : filtre d’Hamilton, algorithme avant-arrière, filtre de Kalman, filtre particulaire, méthodes de Monte Carlo séquentielles et algorithme espérance-maximisation. Des applications dans les domaines de l’actuariat et des mathématiques financières seront présentées et l’étudiant sera appelé à implanter plusieurs algorithmes à l’aide du logiciel informatique R.

Prof. Maciej Augustyniak

ACT 6280

Institution: Université de Montréal

Analyse statistique multivariée

Étude des distributions échantillonnales classiques: T2 de Hotelling; loi de Wishart; distribution des valeurs et des vecteurs propres; distribution des coefficients de corrélation. Analyse de variance multivariée. Test d'indépendance de plusieurs sous-vecteurs. Test de l'égalité de matrices de covariance. Sujets spéciaux.

Prof. Karim Oualkacha

MAT8081

Institution: Université du Québec à Montréal

Principes de simulation

Nombres pseudo-aléatoires. Principes fondamentaux, méthode d'inversion et méthode du rejet. Lois usuelles univariées discrètes et continues. Vecteurs aléatoires. Techniques de réduction de la variance. Simulation par chaînes de Markov (MCMC). Applications.

Prof. Simon Guillotte

MAT8780

Institution: Université du Québec à Montréal

Modélisation statistique de la dépendance stochastique

Rappel sur les principales notions de statistique mathématique et sur la statistique asymptotique. Introduction à la théorie des copules. Description des modèles de dépendance bidimensionnels et multidimensionnels les plus populaires et exploration exhaustive des propriétés de ces copules. Inférence statistique dans les modèles de copules : estimation de paramètres, copule empirique, tests d'adéquation et tests d'hypothèses composites. La méthode delta fonctionnelle et ses nombreuses applications, notamment en inférence de copules. Survol des avancées récentes, incluant les tests de rupture, l'étude de la dépendance conditionnelle, la modélisation de la dépendance spatiale et l'utilisation de la fonction caractéristique. Les objectifs spécifiques de ce cours sont : de maîtriser la théorie des copules, de connaître les principales méthodes d'inférence concernant les copules, d'être au fait des principaux développements récents, de bien connaître la littérature sur les copules, d'être capable de mettre en oeuvre les méthodes statistiques avec le logiciel Matlab (estimation de la puissance de tests, analyse de jeux de données).

Prof. Jean-François Quessy

MAP6022

Institution: Université du Québec à Trois-Rivières

Géostatistique et tests multiples

Prof. Jean-François Coeurjolly

MAT998K

Institution: Université du Québec à Montréal

Analyse de la variance

Rappels et compléments sur la théorie du modèle linéaire : moindres carrés, théorèmes de Gauss-Markov et de Cochran, inférence. Modèle à effets fixes et aléatoires. Plan incomplet. Plan à mesures répétées.

Prof. Martin Bilodeau

STT 6410

Institution: Université de Montréal

Méthodes asymptotiques

Notions de probabilités. Comportement asymptotique des moments et quantiles échantillonnaux. Normalité asymptotique de transformation; stabilisation de la variance. Loi asymptotique du test du khi-deux. Théorie asymptotique en inférence paramétrique.

Prof. Florian Maire

MAT 6300

Institution: Université de Montréal

Méthodes avancées d'inférence

Principes d'inférence; estimation ponctuelle et distribution des estimateurs, approximation normale, point de selle et « bootstrap »; tests d'hypothèses; robustesse, inférence bayésienne, pseudo- et quasi vraisemblance, estimation non paramétrique.

Prof. François Perron

STT 6100

Institution: Université de Montréal

Séries chronologiques univariées

Méthodes graphiques. Estimation des paramètres d'un processus stationnaire. Inversibilité et prévision. Modèles ARMA, ARIMA et estimations de paramètres. Propriétés des résidus. Séries saisonnières. Données aberrantes.

Prof. Pierre Duchesne

STT 6615

Institution: Université de Montréal

Special topics in Geometric Data Analysis

Modern data analysis methods are expected to handle massive amounts of high dimensional data that are being collected in a variety of domains. The high dimensionality of such data introduces numerous challenges, typically referred to as the curse of dimensionality, which render traditional statisical learning approaches impractical or ineffective for their analysis. To cope with these challenges, significant effort has been focused on developing geometric data analysis approachs that model and capture the inrinsic geometry of processed data, rather than directly modeling their distribution. In this course we will explore such ap- proaches and provide an analytical study of the models and algorithms they use. We will start by considering supervised learning and distinguish classifiers that are based on geometric principles from statistical learning approaches, such as Baysian classification. Next, we will consider the unsupervised learning task of clustering data and contrast density based clustering from partitional and hierarchical clustering methods that rely on metric spaces or graph constructions. Finally, we will consider more fundamental tasks in intrinsic repre- sentation learning, with particular focus on dimensionality reduction and manifold learning methods, such as Isomap, Diffusion Maps, LLE, and tSNE. Time permitting, the course will also include guest talks discussing recent development in related research areas.

The course will be suitable for CS, statistics, and applied math students interested in data science and machine learning.

Classes:

Wednesdays 15h30 – 17h00

Thursdays 15h30 – 17h00

Prof. Guy Wolf

MAT 6480 / STT 6705

Institution: Université du Québec à Montréal

Hiver

Techniques d'exploitation de données (data mining)

Ce cours présente certaines des principales techniques d'analyse de grandes bases de données (data mining). Les technologies de l'intelligence d'affaires permettent aux entreprises, entre autres, d'analyser les données recueillies pour leurs opérations afin de mieux comprendre le comportement de leurs clients dans le but d'aider à anticiper la demande, accroître la rétention ou réduire la fraude. Différentes techniques de l'intelligence d'affaires, parmi les plus utilisées en pratique, seront donc présentées et illustrées à partir d'exemples concrets dans différents domaines de gestion.

Prof.

60600

Institution: HEC Montréal

Analyse multidimensionnelle appliquée

Les entreprises croulent littéralement sous le poids des données qu'elles ont à leur disposition. Ces données contiennent potentiellement une quantité importante d'informations pouvant être bénéfiques à l'entreprise si utilisées correctement. Sous le vocable « data mining », on retrouve différentes techniques statistiques utilisées pour explorer et analyser de grands ensembles de données. Ces techniques ont généralement pour but de développer des modèles prévisionnels, de réduire la taille des données, de faire de la segmentation ou bien de découvrir des associations pertinentes. L'analyse multidimensionnelle est à la base de plusieurs techniques de data mining et est utilisée dans plusieurs domaines de gestion dont le marketing. 

Le but du cours analyse multidimensionnelle est de donner aux étudiants(e)s une formation de base en traitement de données multidimensionnelles. Plusieurs techniques statistiques seront présentées et on insistera surtout sur la compréhension intuitive, l'interprétation correcte et l'utilisation pratique de celles-ci. Par conséquent, l'emploi de concepts mathématiques sera réduit à son minimum et ces derniers ne serviront qu'à faciliter la compréhension des méthodes étudiées. Le logiciel SAS sera utilisé mais aucune connaissance préalable de celui-ci n'est requise. Par contre, une connaissance des concepts et méthodes statistiques (population, échantillon, estimation, test d'hypothèse) de base est requise.

Prof.

60602

Institution: HEC Montréal

Logiciels statistiques pour l'analyse des données

L'étudiant apprendra à programmer en SAS et en R afin de nettoyer des jeux de données, de les représenter graphiquement et d'en faire une analyse statistique complexe. En plus de maîtriser le code de base de SAS, l'étudiant apprendra la syntaxe du module ODS qui permet de gérer le contenu des sorties. Il apprendra aussi le langage macro de SAS et s'en servira . afin de créer des fonctions permettant des analyses statistiques supplémentaires. En R, l'étudiant apprendra les bases du langage qui lui serviront à faire une analyse statistique des données .. II ·apprendra aussi à écrire des fonctions permettant l'analyse statistique de données et à construire une librairie de fonctions afin de partager les outils d'analyse qu'il aura codés. R et SAS sont basés sur des langages de programmation différents que l'étudiant devra apprendre à maîtriser.

Prof.

60613

Institution: HEC Montréal

Analyse et inférence statistique

L'objectif principal du cours est de fournir à l'étudiant les notions fondamentales de l’analyse et de l’inférence statistique ainsi que les méthodes statistiques avancées. En plus des concepts théoriques, ce cours mettra particulièrement l'accent sur les applications pratiques de ces méthodes dans des contextes de recherche.

Prof.

60619

Institution: HEC Montréal

Statistical Analysis and Inference

The goal of this course is to provide basic notions of statistical analysis and inference as well as advanced statistical methods. In addition to the theoretical concepts, this course will focus on the practical applications of these methods.

Thèmes couverts

1) SAS software

2) ANOVA, t-tests

3) Linear models

4) Generalized linear models

5) Likelihood methods

6) Correlated data analysis

7) Non-parametric methods

Prof.

60619A

Institution: HEC Montréal

Statistical Learning

This course is an introduction to statistical learning techniques. Some applications to finance and insurance will be illustrated. Topics covered include:

  • Cross-validation
  • Regression methods (Linear models, Variable selection, Shrinkage)
  • Classification methods (K-nearest neighbors, Linear and quadratic discriminants, Logistic regression, Support vector machines)
  • Decision trees
  • Unsupervised learning (Clustering, Principal component analysis)
  • Neural networks

Prof. Frédéric Godin

MAST 679H, MAST 881H

Institution: Concordia University

Analyse de données textuelles et de réseaux sociaux

L'étudiant découvrira les méthodes qui permettent d'analyser automatiquement un corpus de documents par des algorithmes classiques d'exploitation de données. Les textes étant avant tout destinés à la lecture par des humains, l'information qu'ils recèlent n'est pas structurée de manière appropriée à un traitement automatisé. Nous présenterons dans ce cours diverses techniques spécifiques grâce auxquelles un traitement automatisé des documents est possible.

Après avoir suivi ce cours, l'étudiant saura identifier les paramètres appropriés et utiliser de manière appropriée les principaux logiciels disponibles. Le cours est composé de 6 séances de 3 heures durant lesquelles les techniques sont présentées formellement d'abord, puis par l'entremise d'applications.

Prof.

60621

Institution: HEC Montréal

Méthodes de prévision

Présentation des principales méthodes propres à la prévision nécessaire à la prise de décisions en présence l'incertitude. Grands principes des méthodes de prévision utilisées.

Les étudiants se familiariseront avec l'utilisation des principales techniques telles le lissage, la régression, les séries chronologiques et les réseaux de neurones. Les méthodes d'évaluation et de sélection de modèles, ainsi que les méthodes d'évaluation des erreurs de prévision, sont aussi au programme. Le logiciel R sera utilisé.

Prof.

60638

Institution: HEC Montréal

Forecasting Methods

Presentation of the main forecasting methods necessary for decision making in the presence of uncertainty. General principles of forecasting methods used are outlined.

Students will become familiar with the use of key techniques such as smoothing, regression, time series and neural networks. Methods for model evaluation and selection, as well as methods for estimating forecast errors, are also on the program. The R software will be used.

Prof.

60638A

Institution: HEC Montréal

Machine Learning II : Deep Learning

Deep learning has achieved great success in a variety of fields such as speech recognition, image understanding, and natural language understanding. This course aims to introduce the basic techniques of deep learning and recent progress of deep learning on natural language understanding and graph analysis.

This course aims to introduce the basic techniques of deep learning including feedforward neural networks, convolutional neural networks, and recurrent neural networks. We will also cover recent progress on deep generative models. Finally, we will introduce how to apply these techniques to natural language understanding and graph analysis.

Prof.

80600A

Institution: HEC Montréal

Méthodes avancées en exploitation des données

Ce cours a pour but de présenter et discuter de méthodes avancées et récentes en analyse et exploitation de données. Les concepts théoriques et idées à la base de ces méthodes seront discutés en détails. De plus, les développements récents seront aussi abordés dans l'optique d'identifier des pistes de recherche. L'utilisation pratique de ces méthodes sera aussi traitée en utilisant des exemples provenant de plusieurs domaines de la gestion. À cette fin, le langage R sera l'outil de choix car la plupart des méthodes récentes font leur apparition sous la forme de package R.  À la fin du cours,  l'étudiant devra être en mesure de définir un projet de recherche prometteur s'articulant autour des méthodes vues. À cette fin, le projet individuel (voir la section approche pédagogique) est d'une grande importance.

Prof.

80619

Institution: HEC Montréal

Advanced Statistical Learning

Presentation and discussion of advanced methods in data analysis and exploitation.

The theoretical concepts and ideas underlying these methods will be discussed in detail. In addition, recent developments will also be discussed with a view to identifying future research trails. The practical use of these methods will also be treated using examples from several research areas in management. To this end, the language R will be the tool of choice as the most recent methods appear in R.

Prof.

80619A

Institution: HEC Montréal

Latent Variable Analysis with Applications in Administrative Sciences

Structural equation models and latent variables is a field of data analytics that has undergone substantial developments over the past two decades. These models allow to characterize and relate some factors that are not directly observable. The range of application of such models is very wide in social sciences, including marketing, management, IT and human resources. The course will be divided into several parts, including a review of the concepts of regression, correlation, causal relation, direct / indirect effects and correlation diagrams. We will then discuss some specific types of structural equation models such as exploratory/confirmatory factor analysis and we will study the general formulation of the model, characterized by a path diagram with latent variables. Finally, component-based structural equation models will also be discussed, such as partial least squares (PLS) and GSCA.

All the analyses seen in this course will be carried out using specialized software. For each type of model studied, we will focus on model identification and specification, parameter inference, model fit and interpretation of results through applied examples in administrative sciences.

Prof.

80628A

Institution: HEC Montréal

Analyse de tableaux de fréquence

Tableaux de fréquences à deux variables : proportions, rapport de cotes et risque relatif, tests et mesures d'association, variables ordinales, données appariées. Tableaux de fréquences à trois variables : association marginale et association conditionnelle, paradoxe de Simpson. Modèles linéaires généralisés : régression de Poisson et régression logistique binaire, conditionnelle, ordinale et multinomiale, sélection des variables et mesure de l'ajustement des modèles. Analyse des données à l'aide de logiciels statistiques.

Prof.

STT 6210

Institution: Université Laval

Échantillonnage

Conception d'un questionnaire. Techniques d'échantillonnage simple et stratifié. Méthodes du quotient et de la régression pour l'utilisation d'informations supplémentaires. Techniques d'échantillonnage par grappes, systématique et à plusieurs degrés

Prof. Audrey-Anne Vallée

STT 6220

Institution: Université Laval

Méthodes d'analyse des données

Réduction de la dimensionnalité : par exemple, analyse en composantes principales et analyse canonique des corrélations. Classification non supervisée : classification hiérarchique, non hiérarchique et sur la base de modèles, évaluation de la qualité et choix du nombre de groupes. Classification supervisée : classifieurs linéaires et non linéaires, évaluation de la qualité des classifieurs.

Prof. Anne-Sophie Charest

STT 7335

Institution: Université Laval

Processus aléatoires

Probabilités et espérances conditionnelles. Chaînes de Markov à temps discret et chaînes de Markov à temps continu. Irréductibilité, apériodicité, récurrence, loi stationnaire, ergodicité. Quelques modèles classiques : marches aléatoires, processus de ramifications, processus de Poisson, processus de naissances et de morts, modèles de files d'attente. Introduction au mouvement brownien. L’étudiant qui a déjà suivi le cours de premier cycle STT-4700 ne peut s’inscrire à ce cours.

Prof. Claude Belisle

STT 7700

Institution: Université Laval

Modèles d’équations structurelles

Rappels sur la régression linéaire et l'analyse classique des cheminements. Analyse factorielle confirmatoire. Exploration de l'analyse générale des équations structurelles avec variables latentes et erreurs de mesure. Familiarisation avec un des trois logiciels suivants : LISREL, EQS ou CALIS (procédure de SAS).

Prof. Ting-Huei Chen

STT 7620

Institution: Université Laval

Generalized Linear Models

Modern discrete data analysis. Exponential families, orthogonality, link functions. Inference and model selection using analysis of deviance. Shrinkage (Bayesian, frequentist viewpoints). Smoothing. Residuals. Quasi-likelihood. Sliced inverse regression. Contingency tables: logistic regression, log-linear models. Censored data. Applications to current problems in medicine, biological and physical sciences. GLIM, S, software.

Prof. Johanna Neslehova

MATH 523

Institution: Université McGill

Mathematical Statistics 2

Sampling theory (including large-sample theory). Likelihood functions and information matrices. Hypothesis testing, estimation theory. Regression and correlation theory.

Prof. Masoud Asgharian-Dastenaei

MATH 557

Institution: Université McGill

Analyse de données multivariées

Comparaison de plusieurs populations. Représentations graphiques. Analyse en composantes principales, factorielle, des correspondances, canonique, discriminante. Classification. Mesures de redondance.

Prof. Martin Bilodeau

STT 6515

Institution: Université de Montréal

Données catégorielles

Tableaux de contingence. Mesures d'association. Risque relatif et rapport de cote. Tests exacts et asymptotiques. Régression logistique, de Poisson. Modèles log-linéaires. Tableaux de contingence à plusieurs dimensions. Méthodes non paramétriques.

Prof. Alejandro Murua

STT 6516

Institution: Université de Montréal

Méthodes non paramétriques avancées

Statistiques linéaires de rang. Problèmes de position et de dispersion. Cas d'un ou de deux échantillons. Construction additionnelle de méthodes non paramétriques. Quelques problèmes importants.

Prof. Pierre Duchesne

STT 6230

Institution: Université du Québec à Montréal

Régression

Rappels sur la régression linéaire multiple (inférence, tests, résidus, transformations et colinéarité), moindres carrés généralisés, choix du modèle, méthodes robustes, régression non linéaire, modèles linéaires généralisés.

Prof. Florian Maire

STT 6415

Institution: Université de Montréal

Séminaire de statistique: Modèles et données

Le cours sera autour de 3 thèmes

i) les méthodes avancés d'apprentissage, en particulier les réseaux de neurones, mais aussi les méthodes d'économétrie avancée (pénalisation)

ii) les données qui ne sont pas des "bases de données", comme des images, ou du texte... et de la construction de modèles prédictifs sur ces données

iii) je parlerais aussi de réseaux et de peer-to-peer insurance

Le cours aura lieu le jeudi midi, de 11H à 15H (avec une heure de pause) PK-S1540

Prof. Arthur Charpentier

MAT998H

Institution: Université du Québec à Montréal