Université Pierre et Marie Curie - Laboratoire de Probabilités ...
9 sept. 2008 ... 4 UE Fondamentales M2 ? S1 : L'étudiant doit suivre les 4 UE suivantes : ... NM
216 A. Hillion - W. Pieczynski Traitement d'images .... CBMS-NSF Regional
Conference Series in Applied Mathematics, .... vecteurs aléatoires,
caractérisation, théorème limite central, principe delta, application au coefficient
de ...
part of the document
L.S.T.A. Laboratoire de Statistique Théorique & Appliquée
8ème étage - Aile B- Bureau-8 B 4
175, rue du Chevaleret Boîte 158
75013 PARIS
Tél/Fax. : 01 44 27 85 62
E-mail :
Secrétariat : HYPERLINK "mailto:louise.lamart@upmc.fr" louise.lamart@upmc.fr
Direction: HYPERLINK "mailto:paul.deheuvels@upmc.fr" paul.deheuvels@upmc.fr
Site web: HYPERLINK "http://www.upmc.fr/lsta" www.upmc.fr/lsta
Réunion dinformation en septembre
rez de chaussée, salle OC 8
175 rue du Chevaleret
75013 Paris (métro Chevaleret Ligne 6)
Début des Cours 9 septembre 2008
OBJECTIFS PEDAGOGIQUES, SCIENTIFIQUES ET PROFESSIONNELS DU MASTER
(I) Présentation détaillée de la spécialité
Cette spécialité du Master se situe dans la continuité du DEA de Statistique, quelle remplace à partir de lannée scolaire 2004-2005. Elle est habilitée comme « master européen » en association avec lUniversité Libre de Bruxelles (ULB).
Les règles dobtention du diplôme seront adaptées, compte tenu de la réglementation nationale du Master et du règlement ultérieur de lUniversité, par rapport à celles du DEA.
Objectif essentiel :
Former des chercheurs de haut niveau en statistique, en leur fournissant une double qualification : théorique (par des enseignements adaptés,
), et appliquée (par un stage en entreprise et des formations à la statistique appliquée, où des problèmes concrets sont abordés
).
Débouchés possibles :
préparation dune thèse dans un laboratoire ;
préparation dune thèse en entreprise (contrats CIFRE,
)
emplois industriels dans de nombreux secteurs : instituts financiers ( banque, assurance,
), pharmacie et médecine, industrie et services, entreprises de distribution,
Présentation détaillée :
Le but essentiel de la spécialité Statistique est de former des chercheurs de haut niveau en Statistique, en leur fournissant une double qualification : théorique (par des formations adaptées, cours & enseignements techniques, etc.), et appliquée (par le contact direct, au sein dentreprises et de laboratoires, avec des problèmes concrets de statistique appliquée au plus haut niveau, ces derniers étant développés, notamment, dans le cadre de stages). Les débouchés du Master, spécialité statistique, se situent, entre autres :
Directement à lissue du Master, spécialité Statistique, par un emploi professionnel.
Dans la préparation ultérieure dune thèse de doctorat.
La nature des filières professionnelles concernées par ces débouchés est double, et comprend principalement :
Les emplois industriels faisant appel à des « ingénieurs statisticiens » (bien que traditionnelle pour un statisticien, lappellation dingénieur est ici impropre puisquelle correspond seulement à un niveau général de qualification). Un très vaste ensemble de secteurs sont concernés (Instituts financiers, Banques, Assurances, Industrie des télécommunications, Industrie chimique et pétrolière, Pharmacie et médecine, Entreprises de distribution, Sociétés dinformatique, de Conseil et de gestion, etc.). Une grande partie des emplois correspondants sont pourvus par les étudiants ayant suivi la seule formation du Master, spécialité Statistique. (voir plus loin). Une part plus limitée concerne des étudiants poursuivant ultérieurement leurs études vers un doctorat.
Les emplois de chercheur, à lUniversité, au C.N.R.S. ou dans dautres organismes de recherche publique ou privée. Ces débouchés concernent principalement les élèves achevant ultérieurement une thèse de doctorat à la suite du Master de spécialité.
Compte tenu de la forte demande industrielle pour des « ingénieurs statisticiens » ayant une expérience de la recherche dépassant celle qui serait dispensée dans une formation courte ou terminale (sans initiation à la recherche), le cursus comprend un ensemble denseignements répondant à la double qualification dêtre immédiatement applicables, et davoir un niveau correspondant à celui de la recherche dans chacun des domaines concernés.
Le souci est dassurer à la fois des débouchés immédiats pour les étudiants limitant strictement leur scolarité au Master, spécialité Statistique, et des débouchés à plus long terme, une fois la thèse de doctorat achevée, pour ceux qui prévoient de terminer un cursus de 3ème cycle complet incluant la thèse. Il nest en effet pas réaliste, en Statistique, de limiter laccès au Master de spécialité aux seuls étudiants destinés à préparer une thèse par la suite.
Compte tenu du caractère spécifique de la Statistique (nécessitant la double expérience du traitement de données dobservation et de la maîtrise des outils mathématiques correspondants), le Master, spécialité Statistique, dispense une formation pouvant se suffire à elle-même.
Toutefois, afin dassurer aux étudiants la plus grande ouverture sur les disciplines voisines (tant mathématiques que relevant des applications de la statistique), le cursus offre de nombreuses possibilités recommandées dêtre complété par des cours optionnels extérieurs.
Dans une telle perspective, le Master, spécialité Statistique, fait lobjet dun accord avec lUniversité Libre de Bruxelles (ULB), permettant aux étudiants, sous certaines conditions impliquant une mobilité, dobtenir un Master Européen. Par ailleurs, plusieurs conventions (notamment avec lENSAE et lENSAI) permettent, à titre optionnel, de valider des enseignements extérieurs à lUniversité.
(II) Publics de spécialité :
La spécialité Statistique sadresse, dune part, aux étudiants issus de lUniversité Paris VI ayant validé les ECTS de première année, et dautre part, aux étudiants issus dautres formations.
Le niveau normal dadmission, au titre de la spécialité Statistique en 2ème année, se situe à la fin dune 1ère année de Master ou de son équivalent (ancienne Maîtrise de Mathématiques, pures ou appliquées, MAF, MIM, MASS ou formation de niveau comparable, française ou étrangère, correspondant, par exemple, à celle dun ingénieur diplômé ou en fin détudes). Il est conseillé davoir des notes suffisantes (mention) dans les matières liées à la Statistique ou pouvant être considérées comme nécessaires à son acquisition (principalement, Statistique, Probabilités, Analyse, Informatique). Il est demandé aux étudiants davoir un bon niveau de base en Probabilités et en Analyse, ainsi que dune compétence minimale en Informatique appliquée (connaissance dun langage de programmation tel que C++, Fortran, Turbo-Pascal, ou équivalent, lexpérience des logiciels, etc.). Les élèves diplômés, ou en fin détude, de lISUP, lENSAE, lENSAI, ou des principales grandes écoles dingénieurs seront, en principe, admis, sous réserve dun examen individuel de leur dossier, et des places disponibles. Les formations, tant françaises que de la Communauté Européenne, de niveau équivalent, ainsi que les formations dautres origines, seront acceptées sous réserve de lexamen du dossier par un jury dadmission.
COMPOSITION DE LEQUIPE ENSEIGNANTE
Tous rattachés à la section 26 du CNU, mathématiques appliquées, sauf A. Valibouze section 27, en informatique.
Bosq D. Pr à lUniversité Paris VI
Broniatowski M. Pr à lUniversité Paris VI
Biau. G Pr à lUniversité Paris VI
Chevalier J. Pr à lUniversité Paris VI
Dedecker J. MC à lUniversité PARIS VI
Deheuvels P. Pr à lUniversité Paris VI
Delecroix M. Pr à lENSAI
Desbouvries M. Pr à lINT
Guilloux. A MC à lUniversité Paris VI
Haiman G. Pr à lUniversité de Lille
Hallin M. Pr à lUniversité libre de Bruxelles
Hillion A. Pr à lENSTB
Kutoyants A. Pr à lUniversité du Maine
Louani D. Pr à lUniversité de Reims
Marcotorchino F. Dr du Centre de Recherche Thalès
Mesbah M. Pr à lUniversité Paris VI
Michaud P. Senior Consultant K&BI EMEA West Région
Lopez O. MC à lUniversité Paris VI
Pieczynski W. Pr à lINT
Pierre-Loti-Viaud D. Pr à lUniversité Paris VI
Rousseau S. Act. Conseil. à Towers Perrin
Saint Pierre P. MC à lUniversité de Paris VI
Saporta G. Pr au CNAM
Valibouze A. Pr à lUniversité Paris VI
Chandesris M. Dirt Innovation et Recherche SNCF
Tous les enseignants de cette liste sont docteurs dEtat ou habilités, à lexception de S. Rousseau, La liste ne comprend pas les enseignants de lENSAE, ni les responsables des cours rattachés à dautres formations de 3ème cycle pouvant être acceptés dans le Master spécialité Statistique comme enseignements optionnels (Master de probabilités, statistique, modélisation aléatoire,
dautres établissements).
POTENTIEL DE RECHERCHE SUR LEQUEL SAPPUIE LA FORMATION
Le Master spécialité statistique est rattaché statutairement au Laboratoire de Statistique Théorique et Appliquée (LSTA.) de lUniversité Paris VI, qui constitue son laboratoire daccueil.
LSTA. [Laboratoire de Statistique Théorique et Appliquée], Directeur Paul Deheuvels, Université Paris VI.
Ce Laboratoire existe depuis 1980. Il a été rattaché au CNRS, entre autres par lURA CNRS 1321 Paris-6 Paris-7, jusquen 1998, et a été restructuré, à cette époque et à sa demande, dans le cadre du plan de recherche quadriennal de luniversité Paris VI. Il constitue depuis 1998 lEquipe daccueil EA 3124 de lUniversité Paris VI.
Le LSTA. dans sa configuration actuelle comprend 40 chercheurs répartis, entre autres, au sein de lUniversité Paris VI et du Centre de Recherche en Economie et Statistique (CREST.) de lENSAE. Notre laboratoire comprend également des chercheurs de rang professoral des universités de Lille, Reims, Rouen, le Havre et Lyon.
Plusieurs autres laboratoires ont accepté, dans le cadre de leur collaboration avec le LSTA., de fournir un accueil à des doctorants issus de notre formation. Il sagit :
Du CREST [Centre de Recherche en Economie et Statistique], Laboratoire de Statistique, Directeur A. Montfort, INSEE, 3 avenue Pierre Larousse, 92245 Malakoff, Cedex.
De lINRETS [Institut National de Recherche sur le Transport et leur Sécurité], GRETIA, Laboratoire de Génie des Réseaux de Transport et dInformatique Avancée, Directeur G. Scemama, 2 avenue du Général Malleret-Joinville, 94114 Arcueil Cedex.
De lINAPG [Institut National Agronomique Paris Grignon], Département OMIP., Anct. Directeur J.N. Bacro, 16 rue Claude Bernard 75231 Paris Cedex 05.
Du Laboratoire de Probabilités et modèles Aléatoires, Directeur D. Picard, Université Paris 6, Boîte 188, 4 Place Jussieu, 75252 Paris Cedex 05.
De lINT [Institut National des Télécommunications] Département Communications, Images,
et Traitement de lInformation, Directeur W. Pieczynski, 9 rue Charles Fourier, 91700 Evry
De lIGN [Institut Géographique National] Service de Recherche, Directeur S. Motet, 2/4 avenue Pasteur 94165 Saint Mandé Cedex.
FORMALITES DINSCRIPTION
Inscription :
Linscription administrative se fait en ligne
1) Sur le site de luniversité Paris VI : www.etu.upmc.fr
- Cliquer sur étudiant, portail de létudiant.
- Inscription 2008/2009, Acte de candidature, grade Master, suivre les indications.
- Important : Lors de cette inscription électronique, un numéro et un mot de passe vous sont attribués. Notez les biens car ils sont nécessaires pour vous reconnecter pour faire votre inscription définitive.
- Télécharger le dossier de la spécialité retenue, léditer et le remplir.
2) Vous pouvez aussi télécharger le dossier dinscription sur le site de la filière : HYPERLINK "http://www.lsta.upmc.fr" www.lsta.upmc.fr. Vous y obtiendrez aussi des informations sur le parcours (dates de réunions, planning de cours.) mais cette opération ne vous dispense pas de linscription sur le site de lupmc.
Déposer ou envoyer le dossier rempli avec les justificatifs à ladresse suivante :
Secrétariat du M2 de statistique
Mme LAMART
Bte 158 8ème étage Aile B Bureau 8B 04
175, rue du Chevaleret
75013 Paris
Votre dossier sera soumis à une Commission :
- En cas dacceptation, une autorisation dinscription vous sera envoyée; vous devez ainsi vous connecter sur le site de lUPMC pour accepter un vu et finaliser linscription.
- En cas de refus, vous serez contacté(e) par courrier et pourrez solliciter un entretien afin que votre niveau soit expertisé à nouveau.
Il est demandé à tout candidat au Master spécialité Statistique, même en possession dune autorisation dinscription, de rencontrer les enseignants chercheurs de permanence, afin de passer un entretien d'information et d'orientation. Celui-ci a pour objet dapporter une information détaillée sur les débouchés du Master spécialité Statistique et les différentes options qui y sont offertes, afin déviter toute erreur dorientation ou de motivation éventuelle.
Des permanences auront lieu en juin - juillet et septembre sur le site Chevaleret plateau A, 8ème étage, aux dates et lieux affichés au secrétariat du Master spécialité Statistique.
Cet entretien doit être réalisé avant la mi-septembre 2008.
Le dossier devra comporter obligatoirement :
Une déclaration de candidature motivée,
Un curriculum vitae,
Un relevé des notes dexamen obtenues durant lannée en cours et /ou lannée de M1.
Les attestations de réussite des diplômes obtenus.
Une enveloppe timbrée portant le nom et ladresse du candidat (e)
COMPOSITION DU M2 STATISTIQUE
Objectif de la spécialité : Le but essentiel du Master Mention Mathématiques est de former des chercheurs de haut niveau en Statistique, en leur fournissant une double qualification : théorique (par des enseignements adaptées,
), et appliquée (par un stage en entreprise et des formations à la statistique appliquée, où des problèmes concrets sont abordés,
) avec des débouchés en Industrie et service, en biostatistique, et en Assurance et Finance. Il sadresse à des étudiants déjà titulaires dune maîtrise en mathématique (de préférence MAF ou MIM) dun M1 ou dun diplôme reconnu équivalent. Il attache une importance primordiale aux débouchés professionnels et aux relations Internationales.
Le M2 se compose de 60 ECTS.
UE OBLIGATOIRES
4 UE Fondamentales M2 S1 : Létudiant doit suivre les 4 UE suivantes :
CODE :
NM 200 D. Pierre-Loti-Viaud Modèle linéaire 6 ects 60 HC
NM 201 P. Deheuvels Processus empiriques 6 ects 60 HC
NM 202 D. Bosq Statistique des processus 6 ects 50 HC
NM 203 M. Hallin Statistique fondamentale 6 ects 30 HC
2 UE Spécialisation M2 S1 : Létudiant doit suivre les 2 UE suivantes :
NM 204 A. Valibouze M. Spathis Informatique et langage de programmation 3 ects 48 HC
NM 205 G. Saint-Pierre Statistique appliquée et logiciel SAS 3 ects 40 HC
1 UE douverture : de langue ou dinsertion
3 ects
1 UE de stage
.
.21 ects
UE AU CHOIX
2 UE parmi la liste M2 S2 : Létudiant doit suivre 2 UE dans la liste suivante :
NM 207 M. Broniatowski Méthodes issues de la théorie de linformation 3 ects 27 HC
NM 229 M. Biau Apprentissage Statistique 3 ects 24 HC
NM 208 O. Lopez Modèles de régression semi-paramétriques 3 ects 24 HC
NM 209 A. guilloux Bootstrap et rééchantillonnage 3 ects 24 HC
NM 210 G. Haiman Statistique des extrêmes 3 ects 16 HC
NM 211 Y. Kutoyants Stat. des processus de Poisson et de diffusion 3 ects 27 HC
NM 213 M. Saporta Analyse des données 3 ects 36 HC
NM 214 D. Louani Estimation fonctionnelle : le point de vue L1 3 ects 20 HC
NM 215 M. Hallin Plans dexpérience 3 ects 40 HC
NM 216 A. Hillion - W. Pieczynski Traitement dimages & télédétection 3 ects 24 HC
NM 217 F. Marcotorchino - P. Michaud Agrég et class. des données & Data-Mining 3 ects 24 HC
NM 220 S. Rousseau Actuariat et assurance vie 3 ects 21 HC
NM 222 F. Desbouvries Filtrage statistique et application 3 ects 18 HC
NM 223 D. Pierre-Loti-Viaud Statistique Actuarielle de non vie 3 ects 30 HC
NM 224 M. Mesbah Statistique des données de survie 3 ects 15 HC
NM 227 G. Peccati Mathématiques financières 3 ects 30 HC
NM 228 M. Mesbah Statistique des modèles mixtes 3 ects 30 HC
NM M. Chanderis Statistique et analyse de linformation en entreprise 3 ects 12 HC
En outre on conseille très vivement aux étudiants de suivre au moins lun des deux séminaires suivants :
3 FORMATION APPROFONDIE
Séminaire de Statistique et groupes de travail
COURS OPTIONNELS EXTERNES
Les étudiants ont la possibilité de suivre et dintégrer dans leur cursus les cours entre autres des Master spécialité Informatique et Recherche Optionnelle (PARIS VI), de probabilités (PARIS VI), de Statistique et Modèles Aléatoire en Economie et Finance (PARIS VII), de lENSAE-ENSAI et de lISUP sous réserve daccords préalables des responsables concernés et de compatibilité thématique.
STAGE EN ENTREPRISE OU EN LABORATOIRE : (expérience professionnelle de la recherche) 21 ects
ORGANISATION DE LENSEIGNEMENT :
Les enseignements sont essentiellement intégralement répartis au sein de trimestres séparés. Les examens ont lieu à la fin de chaque UE. Des rattrapages sont organisés pour les étudiants nayant pas obtenu de notes satisfaisantes.
Lenseignement se compose de plusieurs types de formations qui comprennent :
Formations fondamentales à la recherche;
Formations spécialisés à la recherche;
Un stage appliqué dans un Laboratoire de Recherche et/ou en Entreprise (de 3 à 6 mois).
Les étudiants ont la possibilité de suivre des cours optionnels, sous réserve daccords mutuels, dans les autres Masters de Statistique, Probabilités, Modélisation, etc., ainsi que parmi les cours de lENSAE et de lISUP.
UE FONDAMENTALE
MODELE LINEAIRE
Responsable de lUE : D. PIERRE-LOTI-VIAUD
Email: HYPERLINK "mailto:daniel.pierre-loti-viaud@upmc.fr" daniel.pierre-loti-viaud@upmc.fr
Code de lUE : NM 200
Nombre de crédits : 6 ECTS
Semestre où lenseignement est proposé : M2-S1
Présentation pédagogique de lUE :
1 -- Modèle linéaire unidimensionnel et multidimensionnel, présentation.
2 -- Modèle exponentiel, modèle linéaire généralisé et modèle linéaire gaussien.
3 -- Vecteurs gaussiens et lois dérivées, lois de Fisher, lois de Wilks.
4 -- Estimations pour la moyenne et la variance, théorème de Gauss-Markov.
5 -- Propriétés des estimateurs, lois limites, ellipsoïdes de confiance.
6 -- Tests du rapport des vraisemblances maximales, test de Wilks, test de Hotteling.
7 -- Exemples : échantillon, comparaison de deux populations.
8 -- Estimation des paramètres de la moyenne, régression, analyse de la variance et de la covariance.
9 -- Autour du modèle linéaire gaussien.
Références bibliographiques :
Jobson, Applied Multivariate Data Analysis, vol. I et II , 1991,
Mardia, Kent et Bibby, Multivariate Analysis, 1994.
UE FONDAMENTALE
PROCESSUS EMPIRIQUES
Responsable de lUE : P. DEHEUVELS
Email : HYPERLINK "mailto:paul.deheuvels@upmc.fr" paul.deheuvels@upmc.fr
Code de lUE : NM 201
Nombre de crédits : 6 ECTS
Semestre où lenseignement est proposé : M2-S1
Présentation pédagogique de lUE :
Ce cours se veut principalement constituer une introduction avancée à la théorie des processus empiriques en vue des applications statistiques pour des variables aléatoires réelles. Le programme ci-dessous est donné à titre indicatif, et n'est aucunement limitatif. Il se veut accessible à tout étudiant disposant d'un bagage minimum de probabilités.
1. Statistiques d'Ordre et de Rang.
- Fonctions de répartition et de quantile - Transformation de quantile
- Mesures empiriques - Fonction de répartition et de quantile empiriques
- Statistiques d'ordre et de rang - Lois exactes, indépendance
- Propriétés particulières des lois uniformes et exponentielles
- Lois limites - Valeurs extrêmes - Lois de Gumbel, Fréchet, Weibull
- Rangs séquentiels, Temps et valeurs de records
- Loi de Poisson et Mesures Empiriques - Approximation de Poisson
- Théorème de Glivenko-Cantelli
- Inégalité de Dvoretzky-Kiefer-Wolfowicz
- Statistiques de Kolmogorov-Smirnov, Anderson-Darling, Cramér-Von Mises
2. Outils Probabilistes et Statistiques de Base.
- Lemmes de Borel-Cantelli et variantes
- Métriques probabilistes, Approximations fortes
- Grandes déviations pour les sommes partielles
- Théorèmes d'Erdos-Rényi
- Inégalités exponentielles et autres
- Propriétés élementaires du processus de Wiener
- Pont brownien, processus de Kiefer
- Processus Gaussiens, Espaces de Hilbert à Noyau Autoreproduisant
- Inégalités isopérimétriques et applications
- Inégalités de petites boules et applications
3. Principes d'invariance - Lois limites fonctionnelles
- Approximation de sommes partielles par des processus de Wiener
- Approximation du processus empirique par des ponts browniens
- Approximation du processus empirique par des processus de Kiefer
- Inclusion de Skorohod, Résultats de Komlós, Major et Tusnàdy
- Résultats de Sakhanenko et Zaitsev
- Loi fonctionnelle du logarithme itéré pour des sommes partielles
- Théorème de Finkelstein, loi de Smirnov et Chung
- Lois de Chung et Mogul'skii
- Applications statistiques
4. Processus empiriques locaux.
- Module de continuité des processus empiriques et de quantiles
- Théorèmes limites fonctionnels locaux
- Représentation de Bahadur, Approximation forte du processus de quantiles
- Applications à l'estimation non paramétrique de la densité
- Statistiques des extrêmes, estimateurs de Hill et apparentés
5. Processus empiriques spéciaux.
- Estimateur produit-limite de Kaplan-Meier et processus empiriques associés
- Processus empirique des espacements - Lois limites
- Processus empiriques rééchantillonné (bootstrap)
- Processus de risque actuariel
6. Processus empiriques indexés par des fonctions ou des ensembles.
- Classes de Donsker
- Nombres d'entropie et de crochets
- Classes de Vapnik-Cervonekis
- Lois limites
References bibliographiques
Billingsley, P. (1968). Convergence of Probability Measures. Wiley, New York.
Csörgo,M. (1983). Quantile Processes with Statistical Applications. CBMS-NSF Regional Conference Series in Applied Mathematics, Vol.42, SIAM, Philadelphia.
Csörgo, M. et Révész, P. (1981) Strong Approximations in Probability and Statistics. Wiley, New York.
David, H. A. (1981). Order Statistics. (2ème. edit.) Wiley, New York.
Galambos, J. (1987). The Asymptotic Theory of Extreme Order Statistics. Krieger, Malabar, Florida.
Gaenssler, P. (1983). Empirical Processes. IMS Lecture Notes - Monograph Series, Vol. 3. Institute of Mathematical Statistics, Hayward, California.
Pollard, D. (1990) Empirical Processes : Theory and Applications. NSF-CSBMS Regional Conference Series in Probability and Statistics, Vol.2, Institute of Mathematical Statistics, Hayward, California.
Shorack, G. R. et Wellner, J. A. (1986). Empirical Processes with Applications to Statistics. Wiley, New York.
Van der Vaart, A. W. et Wellner, J. A. (1996). Weak convergence and Empirical Processes. Springer, New York.
UE FONDAMENTALE
COURS COMPLEMENTAIRE DE PROCESSUS EMPIRIQUES
Responsable de lUE : D. Louani
Email : HYPERLINK "mailto:djamel.louani@upmc.fr" djamel.louani@upmc.fr
Code de lUE : NM 201
Nombre de crédits : 6 ECTS
Semestre où lenseignement est proposé : M2-S1
Présentation pédagogique de lUE :
Plan sommaire
Lemme de Borel Cantelli-espacements.
Processus de Wiener et pont brownien.
Théorème dErds Rényi.
Théorème de Chung-Smirnov.
Théorème de Finkelstein et de Strassen.
References bibliographiques.
Finkelstein, H. (1971) : The law of the iterated logarithm for empirical distribution, Ann. Statist., 42, pp. 607-615.
Shorack, G.R., Wellner, J.A. : Empirical Processes with Applications to Statistics, Wiley, New-York, 1986.
Strassen, V. (1964) : An invariance principle for the law of the iterated logarithm, Z. Wahrsch. Verw. Geb., 3, pp. 211-226.
UE FONDAMENTALE
STATISTIQUE NON-PARAMETRIQUE DE PROCESSUS A TEMPS CONTINU
Responsable de lUE : D. BOSQ
Email : HYPERLINK "mailto:denis.bosq@upmc.fr" denis.bosq@upmc.fr
Code de lUE : NM 202
Nombre de crédits : 6 ECTS
Semestre où lenseignement est proposé : M2-S1
Présentation pédagogique de lUE :
Processus à temps continu, diffusions et calcul stochastique.
Processus linéaires fonctionnels. Théorie. Applications à la Statistique des Processus à temps continu.
Estimation et prévision non paramétrique : cas discret, cas continu.
Pré requis :
Notions classiques de Probabilités et Statistique.
UE FONDAMENTALE
COURS COMPLEMENTAIRE : STATISTIQUE DES PROCESSUS
Responsable de lUE : D. BOSQ
Email : HYPERLINK "mailto:denis.bosq@upmc.fr" denis.bosq@upmc.fr
Code de lUE :NM 202
Nombre de crédits : 6 ECTS
Semestre où lenseignement est proposé : M2-S1
Présentation pédagogique de lUE :
- Compléments sur les processus ARMA : dimension finie et infinie.
- Propriétés des processus mélangeants.
- Estimation de la densité en temps continu : discrétisation, données bruitées.
- Régression et prévision.
UE FONDAMENTALE
STATISTIQUE FONDAMENTALE-MODELES PARAMETRIQUES
Responsable de lUE : M. HALLIN
Email:
Code de lUE : NM 203
Nombre de crédits : 6 ECTS
Semestre où lenseignement est proposé : M2-S1
Présentation pédagogique de lUE :
Introduction. Exemples de modèles. Rappels sur le modèle exponentiel.
Estimation. Principe de substitution : la méthode des moments. Méthode des moments généralisés. Maximum de vraisemblance. Notion de tests.
Efficacité. Le programme de Fisher. Inégalité de linformation de van Trees. Condition LAN, et application à lefficacité.
Références bibliographiques :
P. Tassi (1989). Méthodes statistiques, Economica.
A. A. Borovkov (1987). Statistique mathématique, Mir.
D. Dachuna-Castelle, M. Duflo (1983). Probabilités et statistiques, Volumes 1 et 2, Masson.
A. Gourieroux, A. Monfort (1989). Statistique et modèles économétriques, Volumes 1 et 2, Economica.
V. Genon-Catalot, D. Picard (1993). Elements de statistique asymptotique, Springer-Verlag.
I.A. Ibragimov, R.Z. Hasminskii (1981). Statistical estimation : asymptotic theory, Springer-Verlag.
UE FONDAMENTALE
INFORMATIQUE ET LANGAGE DE PROGRAMMATION
Responsable de lUE : A.VALIBOUZE
Email : HYPERLINK "mailto:Annick.Valibouze@upmc.fr" Annick.Valibouze@upmc.fr
Code de lUE : NM 204
Nombre de crédits : 3 ECTS
Semestre où lenseignement est proposé : M2-S1
Présentation pédagogique de lUE :
Ce cours a pour objectif de former lélève à la programmation et non pas à lapprentissage dun langage unique, en loccurrence le langage C. Il permettra daborder facilement des langages de programmation différents du C.
Programme
Système UNIX et réseaux de communication (Internet)
Présentation générale de la programmation.
Portées et comportement des variables. Illustration avec le C.
Description du fonctionnement dun programme à lexécution :empilement, dépilement, statique, dynamique
Les pointeurs en général et en C. Les structures de données dynamiques (listes, arbres,
).
Préprocesseur C et programmation partagée (Makefile)
Quest-ce que cest que bien (mal) programmer ? : modularité, choix des structures de données, clarté des programmes, espace temps, espace mémoire,
.
T.D : utilisation dUNIX et programmation en C.
Livre conseillé :
S.P. Harbisson, G.L. Steele JR, Le langage C Manuel de référence. Masson
UE FONDAMENTALE
STATISTIQUE APPLIQUEE ET LOGICIELS SAS
Responsable de lUE : G. SAINT-PIERRE
Email : HYPERLINK "mailto:guillaume.saintpierre@lcpc.fr" guillaume.saintpierre@lcpc.fr
Code de lUE : NM 205
Nombre de crédits : 3 ECTS
Semestre où lenseignement est proposé : M2-S1
Présentation pédagogique de lUE :
Objectif :
Donner la capacité aux étudiants d'accéder aux outils basiques de la statistique appliquée et de les mettre en oeuvre sur le logiciel SAS.
Le cours se décompose en deux parties, une théorique présentant des compléments de la statistique en vue de son application pratique (12h = 4 séances de 3h), une d'apprentissage du logiciel SAS en salle informatique (CICRP) par groupes d'au plus trente étudiants (18h par groupe = 9 séances
de 2h par groupe). L'évaluation du cours se fait sur la base d'un projet de vingt pages analysant au moins deux programmes en SAS.
Plan de la partie théorique :
-- les deux cas pratiques de la densité de probabilité, densité par rapport à la mesure de comptage et par rapport à la mesure de Lebesgue, rappels sur les outils probabilistes associés ;
-- familles de lois de probabilité discrètes et continues, exemples, système de Pearson, échelle de comparaison des queues de distribution de probabilité;
-- vecteurs aléatoires, caractérisation, théorème limite central, principe delta, application au coefficient de corrélation et à l'a régression sur des variables de Bernoulli ;
-- mise en oeuvre pratique des méthodes d'estimation paramétrique, maximum de vraisemblance, méthode des moments ; exemples de la loi binomiale négative et de la loi gamma ;
-- mise en oeuvre pratique des méthodes d'estimations empiriques, Kolmogorov Smirnov, bande de confiance dans le cas discret ;
-- estimation sur des données tronquées et classées, exemple.
Plan de l'apprentissage du logiciel SAS :
-- introduction à SAS, gestion des librairies et des fichiers de données ;
-- étape DATA et procédures statistiques, l'analyse statistique élémentaire ;
-- premiers exemples de programme, bibliothèque de programmes SAS ;
-- récupération de données sous SAS, recherche sur internet ;
-- les principales fonctions de la procédure DATA, transformations de tableaux de données ;
-- quelques exemples de procédures statistiques, explications des lignes de code et des sorties ;
-- les procédures graphiques de SAS, encapsulage des graphiques dans un fichier postscript ;
-- préparation du projet SAS.
UE DE SPECIALISATION
METHODES ISSUES DE LA THEORIE DE LINFORMATION
APPLICATIONS AUX STATISTIQUES
Responsable de lUE : M. BRONIATOWSKI
Email: HYPERLINK "mailto:michel.broniatowski@upmc.fr" michel.broniatowski@upmc.fr
Code de lUE : NM 207
Nombre de crédits : 3 ECTS
Semestre où lenseignement est proposé : M2-S2
Présentation pédagogique de lUE :
Cette année le cours aura pour thème divergences entre lois de probabilité et choix de critère Statistique. La première partie du cours présente quelques outils statistiques classiques.
Le plan est :
1 - Outils généraux : processus empiriques fonctionnels
1a - Théorème de Glivenko Cantelli
1b - Théorème central limite
2 - Eléments de théorie de linformation
3 - Dualité pour des fonctionnelles convexes.
4 - Statistique paramétrique et choix de critère.
5 Optimisation sous contrainte de forme.
6 Divers exposés faits par les étudiants autour de la théorie de linformation et des divergences.
Références bibliographiques :
Pollard D. Convergence of empirical processes, Springer 1984
Van der Waart, A, Wellner J Empirical Processes with statestical applications, Springer, 1996
Cover, Thomas. Information Theory, Wiley
Dembo A, Zeitouni O. Large deviations, Bartlett and sons, 1996
Divers articles en Statistique mathématique.
UE DE SPECIALISATION
MODELES DE REGRESSION SEMI-PARAMETRIQUES
Responsable de lUE : O. LOPEZ
Email: HYPERLINK "mailto:lopez@ensai.fr" lopez@ensai.fr
Code de lUE : NM 208
Nombre de crédits : 3 ECTS
Semestre où lenseignement est proposé : M2-S2
Présentation pédagogique de lUE :
1) Rappels sur le modèle linéaire « généralisé ».
Définition - Estimation des paramètres Cas particuliers classiques.
2) Les modèles à « directions révélatrices » : généralités.
Définition dune « direction révélatrice » - Interprétations du paramètre fonctionnel, propriété - Exemples - Approximation dun modèle quelconque par un modèle à directions révélatrices.
3) La méthode A.D.E.
Principe de ma méthode - Définition de lestimateur Etude des propriétés asymptotiques - Choix de paramètres optimaux.
Calcul des bornes defficacité dans les modèles à direction révélatrice.
5) Rappels généraux : Modèles LAN, modèles différentiables, théorème de Convolution - Borne de Cramer-Rao pour le paramètre euclidien dun modèle semi-paramétrique Cas des modèles à direction révélatrice.
Etude des M estimateurs du paramètre euclidien dun modèle à direction révélatrice.
Hypothèse didentification Propriétés asymptotiques Construction destimateurs asymptotiquement efficaces - Application à lestimation de la régression.
UE DE SPECIALISATION
BOOTSTRAP-REECHANTILLONNAGE ET APPLICATIONS
Responsable de lUE : A. GUILLOUX
Email: HYPERLINK "mailto:agathe.guilloux@upmc.fr" agathe.guilloux@upmc.fr
Code de lUE : NM 209
Nombre de crédits : 3 ECTS
Semestre où lenseignement est proposé : M2- S2
Présentation pédagogique de lUE :
Pour lanalyse statistique de nombreux problèmes dutilisation fréquente, nous ne disposons que de la théorie asymptotique. Le statisticien appliqué est alors confronté au problème de savoir jusquà quel point il peut se fier aux résultats fondés sur la théorie asymptotique lorsquil met réellement en uvre une analyse sur des données réelles, le plus souvent en nombre restreint. Il est alors demandeur de méthodes qui soient plus performantes que celles issues de la simple application des résultats asymptotiques du premier ordre, conséquence immédiate du théorème central limite. Il souhaite évidemment que ces méthodes sappliquent à des modèles statistiques aussi généraux que possible. Cest alors quinterviennent les techniques de rééchantillonnage, dont lefficacité est intimement liée aux développements de loutil informatique, qui fournissent des méthodes pour résoudre de façon pratique ce problème.
Ce cours a pour but dintroduire la méthode du bootstrap, développée par Bradley Efron en 1979. Son principe, à la fois simple et révolutionnaire, salué parfois comme la plus importante idée nouvelle en statistique des trois ou quatre dernières décennies, reprend en fait des idées plus anciennes (jackknife, validation croisée,
). Le bootstrap sappuie sur le fait de pouvoir en rééchantillonnant dans les données proprement dites, estimer les caractéristiques du phénomène aléatoire qui a engendré ces données.
Ce cours sadresse aux étudiants soucieux dacquérir les dernières techniques en statistiques. Dune part, des résultats théoriques récents sur le sujet seront présentés ainsi que des problèmes encore ouverts, qui pourront faire lobjet de mémoires théoriques de DEA ; dautre part, de nombreuses applications pratiques avec résultats de simulations à lappui seront exposées, afin de permettre aux étudiants dapporter des réponses pratiques aux problèmes susceptibles dêtre posés par des industriels au cours de leur stage de DEA.
Plan Sommaire
Introduction aux méthodes de rééchantillonnage (jackknife bootstrap dEfron).
Propriétés et validation asymptotiques de la méthode du bootstrap.
Développement dEdgeworth, construction dintervalles de confiance.
Simulations, Algorithmes, Applications Géostatistiques.
Données censurées et applications.
Références bibiographiques :
Efron (1979). Bootstrap methods : Another look at the jackknife, Ann. Statist. ; 7, 1-26.
Efron (1982). The Jakknife, the bootstrap and other resampling plans, CBMS-BF, SIAM, 38.
Efron, Tibshirani (1993). An introduction to the bootstrap, Chapman and Hall.
Hall (1992). Bootstrap and Edgeworth expansion, Springer Verlag, New York.
Shao et Tu (1995). The jackknife and bootstrap, Springer Verlag, New York.
UE DE SPECIALISATION
STATISTIQUE DES EXTRÊMES
Responsable de lUE : G. HAIMAN
Email: HYPERLINK "mailto:georges.haiman@upmc.fr" georges.haiman@upmc.fr
Code de lUE : NM 210
Nombre de crédits : 3 ECTS
Semestre où lenseignement est proposé : M2-S2
Présentation pédagogique de lUE :
1. Lois limites extrêmes pour les suites i.i.d.
Théorème de Khinchine
Lois max-stables, domaines d'attraction et CNS d'appartenance à ces domaines
Proprietés de Poisson des excédences de niveaux élevés
2. Maximas de suites stationnaires
Conditions de mélange spécifiques
Types de lois limites pour les suites stationnaires
Suites i.i.d. associées et domaines d'attraction
Le cas particulier des suites gaussiennes
Convergence du processus ponctuel des excédences
3. Extrêmes de processus stationnaires en temps continu
Théorème des types de lois limite
Le cas particulier des processus gaussiens
"Up-crossings" et processus ponctuel associé
Références bibliographiques :
"Extremes and Related Properties of Random Sequences and Processes, M.R. Leadbetter, G.Lindgren, H.Rootzén, Springer 1983.
"The Asymptotic Theory of Extreme Order Statistics", J. Galambos, R.E. Krieger Publ.Comp., 1987.
UE DE SPECIALISATION
STATISTIQUES DES PROCESSUS DE POISSON ET DE DIFFUSION
Responsable de lUE : Yu. KUTOYANTS
Email: HYPERLINK "mailto:kutoyants@univ-lemans.fr" kutoyants@univ-lemans.fr
Code de lUE : NM 211
Nombre de crédits : 3 ECTS
Semestre où lenseignement est proposé : M2-S2
Présentation pédagogique de lUE :
Poisson :
- Intégrale stochastique
- Estimation paramétrique
- Bornes inférieures (Cramer-Rao, Van Trees, Hajek le cam)
- Comportement asymptotique des estimateurs du maximum de vraisemblance bayésiens et de la distance minimale.
- Estimation non paramétrique.
Diffusion :
- Les mêmes problèmes pour des processus de diffusion ergodiques.
Références bibliographiques :
1- Kutoyants « Statistical Inference for spatial Poisson processes » Springer, 1998
2- Kutoyants « Indentification of dynamical systems with small noise » Kluwer 1994.
3- Ibragimov, and Khasminskii, « Estimation theory » Springer, 1981.
UE DE SPECIALISATION
ANALYSE DES DONNEES
Responsable de lUE : G. SAPORTA
Email : HYPERLINK "mailto:saporta@cnam.fr" saporta@cnam.fr
Code de lUE : NM 213
Nombre de crédits : 3 ECTS
Semestre où lenseignement est proposé : M2-S1
Présentation générale
L'accumulation de données dans les entreprises (commerce de masse, commerce électronique, vente par correspondance, crédit bancaire, retour d'expériences en fiabilité,
) et dans les laboratoires de recherche (données d'expression du génome, analyse d'image
) implique des méthodes d'analyse adaptée aux grands volumes de données. Si la problématique classique (estimation et tests d'hypothèses) peut rester pertinente elle n'est plus la seule. En effet le problème est d'extraire l'information utile dans un très grand ensemble de données et de la résumer. (« Data mining »). Les méthodes d'analyse des données font donc partie des connaissances de base pour les étudiants du Master de Statistique aussi bien pour les applications que d'un point de vue conceptuel.
Généralités sur le data mining et lapprentissage (supervisé et non supervisé)
Méthodes de réduction de dimension
Composantes principales, correspondances, classification
Discrimination et Classement (15h)
- Méthodes géométriques et probabilistes d'analyse discriminante
- Régression logistique
- Arbres de décision
- Scoring et applications
- SVM
- Mesures de performances (courbe ROC, AUC)
Références bibliographiques :
Cristianini , Shawe-Taylor "An Introduction to Support Vector Machines",
Cambridge University Press, 2000
Hastie, Tibshirami, Friedman " The Elements of Statistical Learning" Springer, 2001
Lebart, Morineau et Piron, "Statistique exploratoire
multidimensionnelle", Dunod,1995
Saporta " Probabilités, Analyse des données et statistique", 2ème édition, Technip, 2006
UE DE SPECIALISATION
ESTIMATION FONCTIONNELLE : LE POINT DE VUE L1
Responsable de lUE : D. LOUANI
Email : HYPERLINK "mailto:djamel.louani@upmc.fr" djamel.louani@upmc.fr
Code de lUE : NM 214
Nombre de crédits : 3 ECTS
Semestre où lenseignement est proposé : M2-S2
Présentation pédagogique de lUE :
PLAN DU COURS
1) Rappels sur les distances
La variation totale, les espaces Lp, les espaces de Hellinger et l'information de Kullback-Leibler.
2) Estimation de la densité et propriétés élémentaires
Méthodes des histogrammes, du noyau et des séries orthogonales. Etude du biais.
3) Consistance, vitesse de convergence et stabilité relative des estimateurs
Etude de la consistance des estimateurs à histogrammes, à noyau et par la méthodes des séries orthogonales. Stabilité relative et vitesses de convergence des estimateurs. Quelques résultats minimax. Choix du paramètre de lissage.
Etude du cas de données dépendantes.
4) Normalité asymptotique
Etude de la normalité asymptotique des estimateurs à histogrammes et à noyau.
5) Grandes déviations et applications
Etude des grandes déviations relatives aux estimateurs à histogrammes et à noyau. Etude de l'efficacité des tests d'ajustement basés sur les L1-erreurs des estimateurs de densités.
Références bilbiographiques:
Devroye L. & Györfi L. (1985). Nonparametric Density Estimation. The L1-View. John Wiley, New York.
Devroye L. (1987). A Course in Density Estimation. Birkhäuser, Boston-Basel-Stuttgart.
Györfi L., Härdle W., Sarda P. & Vieu P. (1989). Nonparametric curve estimation from time series. Lecture Notes in Statistics 60, Springer-Verlag.
UE DE SPECIALISATION
PLAN DEXPERIENCES
Responsable de lUE : M. HALLIN
Email :
Code de lUE : NM 215
Nombre de crédits : 3 ECTS
Semestre où lenseignement est proposé : M2-S2
Présentation pédagogique de lUE :
Ce cours a pour but de donner une initiation avancée à certaines techniques utilisées dans la construction et le traitement statistique de données issues des plans dexpériences, avec un intérêt particulier pour les plans en blocs incomplets.
Plans en blocs incomplets :
Définition et analyse statistique classique
A-Optimalité
Plans en blocs incomplets équilibrés BIBD
Autres plans PBLED, plans cycliques
Méthodes générales de construction
Plans en mesures répétées
Plans factoriels
Applications Bio Statistique Industrie
Divers Plans Taguchi
UE DE SPECIALISATION
TRAITEMENT DIMAGES ET TELEDETECTION
Responsable de lUE : A. HILLION W. PIECZINSKI
Email : HYPERLINK "mailto:Alain.Hillion@enst-bretagne.fr" Alain.Hillion@enst-bretagne.fr; HYPERLINK "mailto:Wojciech.Pieczynski@int-evry.fr" Wojciech.Pieczynski@int-evry.fr
Code de lUE : NM 216
Nombre de crédits : 3 ECTS
Semestre où lenseignement est proposé : M2-S2
Présentation pédagogique de lUE :
Le but du cours est de présenter, de façon unitaire, les différents modèles stochastiques utilisés en imagerie satellitaire et les différentes méthodes statistiques de classification.
Les modèles dimage
- De la réalité à limage numérique.
(Rappels sur les modèles déterministes, les processus ponctuels, les processus stationnaires, les champs markoviens, les variables intrinsèques).
- Modélisation de limage numérique par superposition de champs stochastiques.
- Notions dhomogénéité dans limage.
Les algorithmes de reconnaissance
- De limage numérique à la carte thématique
(Rappels et compléments sur la théorie de la décision).
- Algorithmes globaux, algorithmes contextuels.
Application à la reconnaissance et au filtrage des images radar
(à ouverture synthétique)
- Modélisation du speckle. Etude des lois de probabilité des images radar.
- Filtrage de bruit multiplicatif.
- Classification contextuelle.
Compléments et problèmes ouverts
- Modélisation floues. Fusion de données.
Plan
Agrégation des préférences.
Historique et position du problème
Agrégation des données quantitatives
Agrégation des données ordinales
Mesures de validité des agrégations
Exemples dapplication et comparaisons avec dautres méthodes
Agrégation de similarités
Origine et présentation du problème
Les structures de partitions et le problème de partition centrale
Agrégation des données de similarités
Prise en compte des données et mesures de validité
Exemples et comparaisons avec dautres méthodes de classification
Références bibliographiques :
JP. Barthemey B. Monjardet, The median procedure in cluster analysis and social choice theory
Journal of Mathematics and Social Sciences n°3 P.37, North Holland 1981.
F. Marcotorchino P. Michaud, Optimisation en analyse ordinale des données Masson, 1979.
F. Marcotorchino Agrégation des similarités en classification automatique, thèse dEtat Paris VI.
P. Michaud Agrégation des préférences,
Thèse dEtat Paris VI.
New trends in data analysis North-Holland Publishing Compagny, Janssen,
Marcotorchino, Michaud, Proja, Editors, 1983.
UE DE SPECIALISATION
AGREGATION ET CLASSIFICATION DES DONNEES
Responsable de lUE : M. P. MICHAUD et J-F. MARCOTORCHINO
Email : HYPERLINK "mailto:jeanfrancois.marcotorchino@thalesgroup.com" jeanfrancois.marcotorchino@thalesgroup.com , HYPERLINK "mailto:pierre-michaux@wanadoo.fr" pierre-michaux@wanadoo.fr
Code de lUE : NM 217
Nombre de crédits : 3 ECTS
Semestre où lenseignement est proposé : M2-S2
Présentation pédagogique de lUE :
Ce cours a une double vocation pratique mais aussi théorique.
Au niveau pratique-il propose de nouvelles méthodes danalyse et données multicritères connues sous les vocables « Data Mining » et « Business Intelligence ».
Il sagit dAnalyse de données à léchelle industrielle centrée sur la résolution de problèmes économiques, industriels et de marketing, utilisant des méthodes et des algorithmes à très hautes performances pouvant prendre en compte des millions déléments à analyser.
Ces méthodes sont actuellement très recherchées en particulier dans les domaines de la « gestion de la relation client » et « lanalyse du Web sur Internet », et les entreprises proposent des offres dans différents secteurs associés. Cest ainsi que plusieurs étudiants de cette option ont pu trouver ces dernières années des postes de « spécialistes en Data Mining ».
Au niveau théorique il part de lorigine de ces méthodes : les travaux incomplets du Marquis de Condorcet au 18 ème siècle, pour aboutir à la version actuelle « Data Mining » en passant par les résultats de K-J. Arrow ( prix Nobel avec une théorie incorrecte
).
Il y a aussi des possibilités de sujets de thèses et de mémoires.
UE DE SPECIALISATION
ACTUARIAT ET ASSURANCE VIE
Responsable de lUE : S. ROUSSEAU
Email : HYPERLINK "mailto:sylvain.rousseau@towersperrin.com" sylvain.rousseau@towersperrin.com
Code de lUE : NM 220
Nombre de crédits : 3 ECTS
Semestre où lenseignement est proposé : M2-S2
Présentation pédagogique de lUE :
Cet enseignement constitue une base de lactuariat appliqué au secteur de lassurance vie. La présentation de la discipline seffectue dans un cadre théorique et pratique à la fois. Théorique pour comprendre en profondeur les aspects pratiques, qui sans cette phase se réduiraient à un énoncé de généralités inapplicables. Pratique car lactuariat fournit aux statisticiens dimportants débouchés dans les organismes dassurances, les établissements financiers et les structures de conseil.
Introduction
Repères historiques, nomenclature française des assurances, spécificités de lassurance vie
1- Fondements techniques de lassurance vie
Economie de lassurance, principes comptables
Mathématiques financières élémentaires, capitalisation et actualisation, probabilité de survie et aléa viager, valeur actuelle probable
2- Lois de mortalité
Taux brut et taux instantané de mortalité, équations de survie, méthodes de lissage, makehamisation, Méthodologie de construction dune table de mortalité, cadre réglementaire dutilisation, certification
3 - Mathématique de lassurance vie
Probabilités sur des groupes de plusieurs têtes, assurance contingente, temps continu, approximations
Assurance en cas de vie et en cas de décès, rente généralisée, assurance mixte et contre assurance, usufruit et nue propriété
4- Tarification
Principes généraux, Prime unique et prime périodique, les chargements rationnels, comparaison avec la méthode des assurances dommages
5- Prévisions techniques
Provisions mathématiques et autres provisions, modifications du contrat, zilmérisation, méthodes prospective et rétrospective, notion de capital sous risque
6- Réassurance
Stratégie et tactique de réassurance, Réassurance proportionnelle et non proportionnelle, recherche du choix optimum, calculs sur les extrêmes
- Application
Risque de taux et de table, statistiques de loi de rachat, principaux résultats
Notion de surplus, taux de rendement interne dun contrat dassurance
Technique de répartition et de capitalisation, fonds de pension, Assurances collectives
Références bibliographiques :
Lemonnier A.,Théorie de lassurance vie, Ed lArgus 1951
Petauton P., Théorie et pratique de lassurance-vie, 2ème édition , Dunod, 1996
Tosetti A, Behar T., Fromentau M., Ménart S., Assurance - Comptabilité, Réglementation, Actuariat, Economica, 2000
Code des assurances, Edition commentée et mise à jour, lARGUS Editions
UE DE SPECIALISATION
FILTRAGE STATISTIQUE ET APPLICATIONS
Responsable de lUE : F. DESBOUVRIES
Email : HYPERLINK "mailto:François.Desbouvries@int-evry.fr" François.Desbouvries@int-evry.fr
Code de lUE : NM 222
Nombre de crédits : 3 ECTS
Semestre où lenseignement est proposé : M2-S2
Présentation pédagogique de lUE :
Objectif du cours :
Lobjectif du module est de présenter le filtrage statistique dans le cadre de différents modèles stochastiques dynamiques Markoviens (chaînes, arbres et réseaux cachés à état continu ou discret), en vue dapplications en automatique (aéronautique, poursuite et radioguidage), traitement du signal (reconnaissance automatique de la parole, segmentation statistique du signal, analyse multirésolutions), communications numériques, économétrie et génomique.
Programme
Filtrage de Wiener ;
Filtrage de Kalman. Modèles stochastiques dynamiques et représentation détat. Problèmes de filtrage, prédiction, interpolation. Implantations pratiques : filtre « information », algorithmes à factorisation, algorithme de Chandrasekhar. Estimation des paramètres. Extension des hypothèses (non linéaire, non gaussien) : filtrage étendu, somme de gaussiennes, échantillonnage dimportance séquentiel et filtrage particulaire ;
Chaînes de Markov cachées. Restauration bayésienne du signal, estimation de paramètres, restaurations non supervisées ;
Arbres de Markov cachés, arbres de Markov couple et triplet, réseaux bayésiens couple et triplet.
Références bibliographiques :
Des notes de cours seront distribuées. Le cours sappuiera notamment sur les ouvrages suivants :
B. D. O. Anderson and J. B. Moore,
Optimal Filtering,
Prentice Hall, Englewood Cliffs, New Jersey, 1979
T. Kailath and A. H. Sayed and B. Hassibi,
Linear estimation,
Prentice Hall, Upper Saddle River, New Jersey, 2000
A. Doucet and N. de Freitas and N. Gordon,
Sequential Monte Carlo Methods in Practice,
Springer Verlag, New York 2001
S. L. Lauritzen,
Graphical models,
Oxford statistical science series N. 17, Clarendon Press, Oxford 2004
UE DE SPECIALISATION
STATISTIQUE ACTUARIELLE NON VIE
Responsable de lUE : D. PIERRE-LOTI-VIAUD
Email : HYPERLINK "mailto:daniel.pierre-loti-viaud@upmc.fr" daniel.pierre-loti-viaud@upmc.fr
Code de lUE : NM 223
Nombre de crédits : 3 ECTS
Semestre où lenseignement est proposé : M2-S2
Présentation pédagogique de lUE :
1- Concepts de base, probabilité de ruine, premier exemple de mutualisation du risque.
2- Approximation d'un portefeuille, modèle individuel et collectif, principe de calcul de prime, ordre sur les risques.
3- Fréquence de sinistres,
4- Mélange de lois et système de bonus-malus.
5- Coût de sinistres.
6- Modèle collectif et lois composées.
7- Approximations de la probabilité de ruine.
8- Segmentation de portefeuille, modèles multiplicatifs et théorie de la crédibilité.
9- Modèles en temps continu, probabilité de ruine, comparaison avec le cas discret.
Références bibliographiques :
Daykin, Pentikainen et Pesonen, Practical Risk Theory for actuaries, 1994,
Klugman, Panjer et Willmot, Loss Model from model to Decisions, 1998.
UE DE SPECIALISATION
STATISTIQUE DES DONNEES DE SURVIE
Responsable de lUE : M. MESBAH
Email: HYPERLINK "mailto:mounir.mesbah@umpc.fr" mounir.mesbah@umpc.fr
Code de lUE : NM 224
Nombre de crédits : 3 ECTS
Semestre où lenseignement est proposé : M2-S2
Présentation pédagogique de lUE :
1. Introduction : la spécificité des données de survie
Les différents types de censure et de troncature
Les programmes de survie dans les logiciels statistiques
Lutilisation des méthodes pour données de survie à dautres type de données
2. Les outils
Fonction de survie, fonction de risque, fonction de risque cumulée
Quelques modèles paramétriques usuels pour la fonction de survie
Ecriture de la vraisemblance dans les cas censurés
3. LEstimateur de Kaplan Meier
Estimation non paramétrique de la courbe de courbe de survie
Méthode de Kaplan-meier, Méthode actuarielle
Comparaison de deux ou plusieurs courbes de survie : Test du Log Rank.
Application à des données réelles ; Programmation avec SAS.
4. Regression sur données de survie
Le modèle de Cox
La vraisemblance partielle de Cox, la vraisemblance de Breslow
Estimation et test sur les paramètres, Comparaison de plusieurs courbes de survie
Application à des données réelles ; Programmation avec SAS.
5. Présentation de quelques résultats de recherches récents dans le domaine.
Modèles de regression de survie a facteurs aléatoires (frailty).
Modèles de viellissement, modèles dessais accélérés
Modèles multi-états, Modèles additifs
Analyse conjointe dune variable longitudinale et dun processus longitudinal
Références bibliographiques :
Andersen, P. K., et al, N. (1992), Statistical Models Based on Counting Processes, Springer-Verlag.
Fleming, T. R. and Harrington, D. (1991), Counting Processes and Survival Analysis, John Wiley
Lawless, J. F. (1982), Statistical Methods and Methods for Lifetime Data, New York: John Wiley
Hill, C. (1990), Analyse des données de survie. Paris: Flammarion.
Allison, P.D. (1995) Survival Analyses Using SAS System, A Practical Guide. SAS Institute.
Cantor A. (1997) Extending SAS Survival Analyses Techniques for Medical Research.. SAS Institute.
UE DE SPECIALISATION
COURS COMPLEMENTAIRE : STATISTIQUE DES DONNEES DE SURVIE
Responsable de lUE : A. GUILLOU
Email : HYPERLINK "mailto:agathe.guillou@upmc.fr" agathe.guillou@upmc.fr
Code de lUE : NM 224
Nombre de crédits : 3 ECTS
Semestre où lenseignement est proposé : M2-S2
Présentation pédagogique de lUE :
UE DE SPECIALISATION
Introduction : durée de vie et censure aléatoire à droite
Chapitre 1 : Eléments mathématiques 1.1 Processus, filtration et temps d'arrêt 1.2 Martingales à temps continu
Chapitre 2 : Processus de comptage 2.1 Processus de comptage et intensité 2.2 Compensateur 2.3 Application aux durées de vie
Chapitre 3 : Théorie limite et produit intégral 3.1 Théorie limite 3.2 Produit intégral 3.3 Application aux durées de vie
Chapitre 4 : Estimateur de Nelson-Aalen 4.1 Processus de comptage agrégé 4.2 Censure aléatoire à droite 4.3 Estimateur de Nelson-Aalen 4.4 Propriétés asymptotique de l'estimateur de Nelson-Aalen
Chapitre 5 : Estimateur de Kaplan-Meier 5.1 Définition et représentation martingale 5.2 Propriétés asymptotiques 5.3 Application au test du log-rank
UE DE SPECIALISATION
MATHEMATIQUES FINANCIERES
Responsable de lUE : G. PECCATI
Email : HYPERLINK "mailto:giovanni.peccati@libero.it" giovanni.peccati@libero.it
Code de lUE : NM 227
Nombre de crédits : 3 ECTS
Semestre où lenseignement est proposé : M2-S2
Présentation pédagogique de lUE :
I. - Rappels
Courbes des taux déterministes, stochastique.
Actifs financiers, portefeuille, stratégie. Autofinancement.
Stratégie admissible, arbitrage, AOA. Marché complet.
Modèle binomiale de Cos. Probabilité risque neutre
II - Mouvement Brownien. Définition et propriétés. Construction de lintégrale stochastique.
Propriétés. Intégration par parties. Martingales.
III. Processus de Ito. Formule de Ito sous forme intégrable, sous forme différentielle. Cas multidimensionnel.
Equations différentielles stochastiques. Existence et unicité des solutions.
IV. Modèles de Black et Sholes.
Existence dune prime de risque pour un portefeuille autofinancé en cas dAOA.
Théorème de Girsavov. Représentation des martingales browniennes. Harrison-Pliska.
Prix dune option européenne. Résolution I : construction dun portefeuille, obtention et résolution dune EDP. Résolution II : à partir des martingales et espérance conditionnelle. Equivalence des deux méthodes, en considérant le générateur infinitésimal de la diffusion. Résolution numérique. Options sur change et sur future.
V. Modèles de taux dintérêt
Cas discret.. Arborescence. Modélisation des fonctions de perturbation en présence daléa et avec hypothèse dAOA.
La forme des taux spot et terme terme.
Les taux terme terme en cas dinvariance du chemin suivi. Application Ho et Lee.
Choix du taux spot comme variable détat. Processus auto régressif dordre 1.
Cas continu. Etude des 0-coupons, sous lhypothèse que leur prix actualisé est une martingale.
Equation différentielle stochastique associée. Evaluation dune option sur obligation. Applications :
- Le modèle de Heath-Jarrov-Morton.
UE DE SPECIALISATION
STATISTIQUE DES MODELES MIXTES
Responsable de lUE : M.MESBAH
Email: HYPERLINK "mailto:mounir.mesbah@upmc.fr" mounir.mesbah@upmc.fr
Code de lUE : NM 228
Nombre de crédits : 3 ECTS
Semestre où lenseignement est proposé : M2-S2
Présentation pédagogique de lUE :
1. Du modèle linéaire à effets fixes au modèle mixte
Exemples pratiques où les modèles à effets aléatoires sont utiles. Estimation des composantes de la variance dans un modèle mixtre équilibré. Méthode de Henderson. Méthode REML..
Les procédures dans les logiciels statistiques : la procédure Mixed.
Application : Mesures répétées, données longitudinales
2. Du modèle linéaire à effets fixes au modèle linéaire généralisé
Rappels sur les familles exponentielles. Estimation et test pour les modèles linéaires généralisées. Algorithme de Newton-Raphson. Algorithme de Fisher.
Les procédures dans les logiciels statistiques : les procédures Catmod, Genmod, Logistic
Application : Regression Logistique, Regression de Poisson, Modèles loglinéaires dans les tables de Contingence
3. et au modèle linéaire généralisé à effets mixtes
Estimation des paramètres dun modèle linéaire généralisé à effets mixtes.
Quadrature de Gauss. EM Algorithme. Algorithmes Stochastiques.
Les procédures dans les logiciels statistiques : la procédure Proc NLMixed
Application à des données réelles ; Programmation avec SAS.
4. Modèles à variables latentes
Modèles pour réponses quantitatives : modèles danalyse factorielle et modèles structurels pour variables latentes.
Modèles de Réponse qualitatives : modèles de réponses aux items : modèle de Rasch, de Birnbaum, de Mokken.
Les procédures dans les logiciels statistiques : la procédure Factor, Princomp, Lisrel, NLMixed
Regression sur variables latentes.
Application à des données réelles : données subjectives en santé, scoring. Programmation avec SAS.
5. Equations dEstimation Généralisées
Approche marginale dun modèle multivariée.
Méthode de Liang et Zeger et extensions.
6. Modèles à effets aléatoires ou modèles bayésiens ?
Comparaison des deux démarches.
Références bibliographiques :
Modèles linéaires mixtes :
Hartley, H.O. and Rao, J.N.K. (1967), "Maximum-Likelihood Estimation for the Mixed Analysis of Variance Model," Biometrika, 54, 93 - 108.
Littell, R.C., Milliken, G.A., Stroup, W.W., and Wolfinger, R.D. (1996), SAS System for Mixed Models, Cary, NC: SAS Institute Inc.
Milliken, G.A. and Johnson, D.E. (1992), Analysis of Messy Data, Volume 1: Designed Experiments, New York: Chapman and Hall.
Modèles linéaires généralisés mixtes :
Breslow, N.E. and Clayton, D.G. (1993), "Approximate Inference in Generalized Linear
Gallant, A.R. (1987), Nonlinear Statistical Models, New York: John Wiley & Sons, Inc.
Longford, N.T. (1994), "Logistic Regression with Random Coefficients," Computational Statistics and Data Analysis, 17, 1 - 15.
McCulloch, C.E. (1994), "Maximum Likelihood Variance Components Estimation for Binary Data," Journal of the American Statistical Association, 89, 330 - 335.
Stiratelli, R., Laird, N.M., and Ware, J.H. (1984), "Random Effects Models for Serial Observations with Binary Response," Biometrics, 40, 961-971.
Applications et autres:
Diggle, P.J., Liang, K.Y., and Zeger, S.L. (1994), Analysis of Longitudinal Data, Oxford: Clarendon Press.
Laird, N.M. and Ware, J.H. (1982), "Random-Effects Models for Longitudinal Data," Biometrics, 38, 963 - 974.
Liang, K.Y. and Zeger, S.L. (1986), "Longitudinal Data Analysis using Generalized Linear Models," Biometrika, 73, 13 - 22.
Verbeke, G. and Molenberghs, G. (2000), Linear Mixed Models for Longitudinal Data, New York: Springer.
Vonesh, E.F. and Chinchilli, V.M. (1997), Linear and Nonlinear Models for the Analysis of Repeated Measurements, New York: Marcel Dekker.
M.L. Feddag and M. Mesbah (2004) Semi Parametric Approach to the Multivariate Mixed Rasch Model. in Parametric and Semiparametric Models with Applications to Reliability, Survival Analysis, and Quality of Life. Ed Birkhauser. Boston, 2004.
M.L. Feddag, I. Grama and M. Mesbah. (2003).Generalized estimating equations (GEE) for mixed logistic models. Communications in Statistics-Theory and Methods. Vol 32, N°4.
UE DE SPECIALISATION
APPRENTISSAGE STATISTIQUE
Responsable de lUE : G. BIAU
Email : HYPERLINK "mailto:gérard.biau@upmc.fr" gérard.biau@upmc.fr
Code de lUE : NM 229
Nombre de crédits : 3 ECTS
Semestre où lenseignement est proposé : M2-S2
Présentation pédagogique de lUE :
L'apprentissage désigne un vaste ensemble de méthodes et d'algorithmes permettant, dans un sens général, d'extraire l'information pertinente de données ou d'apprendre des comportements à partir d'exemples. Les applications de ce paradigme sont très nombreuses, allant de la recherche d'informations dans de grands ensembles de données (fouille de textes ou d'images) à la biologie (reconstruction des réseaux génétiques, puces ADN, etc).
Ce cours est consacré aux concepts et méthodes statistiques de l'apprentissage, dont l'importance s'est considérablement accrue au cours de la dernière décennie. Nous développerons essentiellement le cas de la classification binaire, qui a pour objectif de déduire d'un nombre fini d'observations indépendantes une classification de l'espace en deux domaines. Après avoir défini un cadre théorique rigoureux, nous verrons comment réaliser une telle estimation et quelle précision on peut en attendre. Les deux ouvrages de référence sont les suivants :
Références bilbiographiques:
Devroye, L., Györfi, L. et Lugosi, G. (1996). A Probabilistic Theory of Pattern Recognition, Springer-Verlag, New York.
Lugosi, G. (2002). Pattern classification and learning theory, in Principles of Nonparametric Learning, ed. L. Györfi, Springer, Wien, pp. 1-56.
STATISTIQUES ET ANALYSE DE LINFORMATION EN ENTREPRISE
Responsable de lUE : M. CHANDESRIS
Email : HYPERLINK "mailto:maguelonne.chandesris@sncf.fr" maguelonne.chandesris@sncf.fr
Code de lUE : NM
Nombre de crédits : 3 ECTS
Semestre où lenseignement est proposé : M2-S2
Présentation pédagogique de lUE :
Objectifs :
Lobjectif du cours est de faire une présentation de lintérêt et de lutilisation en entreprise des divers outils danalyse et de modélisation de linformation. Il est destiné à des étudiants BAC+5 en statistiques. Ces étudiants ont acquis, au cours de leur parcours, un bagage scientifique et technique important. Il sagit ici de leur proposer dune part une mise en perspective pratique des différentes techniques quils connaissent dun point de vue théorique. Dautre part, ce cours mettra laccent sur les différents problèmes concrets auxquels ils seront confrontés au cours de leur carrière professionnel, en particulier la collecte, la fiabilisation des données et la communication autour des études dont ils auront la responsabilité.
Contenu
Le volume du cours est dune douzaine dheures (6 x 2h), selon de découpage suivant :
Observations, modèles, études et analyse de linformation : quest-ce que lextraction de connaissances ? Quest-ce quun modèle ? Ce premier chapitre introductif présente les étapes du déroulement dune étude, ces étapes seront reprises et détaillées dans les chapitres suivants.
Communiquer linformation : la communication autour dune étude constitue un élément essentiel pour les études réalisées en entreprise. Ce chapitre présente les enjeux et les grands principes pour la représentation, notamment graphique, des résultats dune étude.
Représentation informatique des informations : lanalyse de volumes conséquents dinformation est aujourdhui rendue possible grâce à lutilisation de loutil informatique. La représentation informatique des informations est une étape délicate quil faut mener avec soin afin de ne pas dénaturer mais aussi dexploiter au mieux linformation que lon souhaite analyser.
Recueil et préparation des données : les données constituent la matière première des études danalyse de linformation, il faut dans la mesure du possible les recueillir avec soin, en prenant en compte les contraintes de coûts souvent importantes. Les données initiales doivent ensuite être préparées pour pouvoir être exploitées dans létude. Cette phase est particulièrement importante lorsque plusieurs sources dinformation existent.
Analyse exploratoire de linformation : les différentes techniques danalyse exploratoire de linformation permettent de bien cerner linformation dont on dispose pour en appréhender les structures et les exploiter au mieux par la suite.
Modélisation dun phénomène : la phase de modélisation constitue le cur de lanalyse de linformation, cest cette phase qui va permettre de résumer les données en un modèle. De très nombreuses approches et familles de modèles existent, il sagira ici den faire une revue en montrant lintérêt et lutilité pratique de chacune suivant les contextes.
Utilisation dun modèle : explication, prévision et simulation : le (s) modèle (s) construit (s) peuvent être utilisés à différentes fins. Le choix du type de modélisation doit dailleurs en prendre compte, afin quun modèle ne soit pas dévié de sa finalité initiale.
Validation dun modèle : la validation dun modèle est une problématique parfois complexe, elle ne se résume pas toujours à trouver le modèle minimisant les écarts de prédiction. Ce chapitre présente des différents objectifs pour la validation ainsi que les outils et techniques de validation associés.
Quelques mots sur les logiciels statistiques : lanalyse de linformation se fait aujourdhui à laide de logiciels plus ou moins boîte noire et plus ou moins dédiés à des types de traitements. Ce chapitre dresse un petit panorama des outils actuels.
Ressources diverses : ce dernier chapitre fournit quelques références bibliographiques, repères pour lobtention de données ainsi que des communautés existantes.
Evaluation
Une évaluation sous la forme de conduite dun mini-projet menée par groupes délèves sera organisée. Il sagira pour chaque groupe de mener les différentes étapes de conduite détude en suivant la progression du cours. La problématique, sur un thème fixé, sera simple et la partie informatique du projet sera menée à laide du logiciel SAS ou R. Létude fera lobjet dun rapport et éventuellement dune soutenance. Trois séances (3 x 2h) de suivi de projet seront organisées.
SOMMAIRE
Objectifs pédagogiques P. 2-3
Composition de léquipe enseignante P. 4
Potentiel de recherche P. 5
Formalités dinscription P. 6
Composition du M2 de Statistique P. 7
Présentation des U.E
Modèle linéaire NM 200 P.8
Processus empiriques NM 201 P. 9-10
Cours complémentaire de processus empiriques NM 201 P. 11
Statistique non-paramétrique de processus à temps continu NM 202 P. 12
Cours complémentaire de statistique des processus NM 202 P. 13
Statistique fondamentale NM 203 P. 14
Informatique et langage de programmation NM 204 P. 15
Statistique appliquée et logiciels SAS NM 205 P. 16
Méthodes issues de la théorie de linformation NM 207 P. 17
Modèles de régression semi-paramétriques NM 208 P. 18
Bootstrap-rééchantillonnage et applications NM 209 P. 19
Statistique des extrêmes NM 210 P. 20
Statistique des processus de Poisson NM 211 P. 21
Analyse des données NM 213 P. 22
Estimation fonctionnelle NM 214 P. 23
Plans dexpériences NM 215 P. 24
Traitement dimages NM 216 P. 25-26
Agrégation et classification des données NM 217 P. 27
Actuariat et assurance vie NM 220 P. 28-29
Filtrage statistique et applications NM 222 P. 30-31
Statistique actuarielle de non vie NM 223 P. 32
Statistique des données de survie NM 224 P. 33-34
Mathématiques financières NM 227 P.35
Statistique des modèles mixtes NM 228 P. 36-37
Apprentissage Statistique NM 229 P. 38
Statistiques et Analyse de linformation en entreprise NM P. 39.40
PAGE
PAGE 41
MASTER 2
SPECIALITE STATISTIQUE
Année universitaire 2008/2009
Responsable : Paul DEHEUVELS