Loi normale - Mathématiques - Académie de Caen
Croire un sondage. ...... Les valeurs instantanées des tensions ou intensités
électriques sinusoïdales ..... Comment sont alimentés nos appareils électriques ?
part of the document
Activité 1 :
Margaux choisit un réel de lintervalle [0 ; 10].
Elle ne choisit pas forcément un entier, elle peut choisir 5 SYMBOL 180 \f "Symbol"\h 10-3 , eq \r(7) ou 2(.
Compléter les phrases suivantes :
La probabilité que ce nombre soit supérieur à 5 est
La probabilité que ce nombre appartienne à lintervalle [2 ; 4] est
La probabilité que ce nombre soit plus grand que 7 est égale à la probabilité que ce nombre soit
Sachant que ce nombre est plus grand que 4, la probabilité quil soit plus grand que 5 est
Margaux a choisi le nombre eq \s\do1(\f(1;e)) . La probabilité que quelquun trouve ce nombre est
Activité 2 :
Une étude statistique porte sur le temps de bon fonctionnement, en milliers dheures, dun composant électronique.
On a étudié un échantillon de 5000 de ces composants.
Les résultats sont donnés dans les tableaux ci-dessous :
Durée de vie[0 ; 10[[10 ; 20[[20 ; 30[[30 ; 40[[40 ; 50[[50 ; 60[[60 ; 70[[70 ; 80[[80 ; 90[[90 ; 100[[100 ; 110[Fréquence0, 340,220,140,110,070,050,030,020,010,0060,004
Tracer lhistogramme des fréquences dans le repère ci-dessous.
Laire de chaque rectangle doit être proportionnelle à la fréquence.
Deux petits carreaux correspondent à 1%.
Quel est le pourcentage de composants dont le temps de bon fonctionnement est inférieur à 30 000 heures ?
Hachurer en rouge laire correspondante sur le graphique.
Que vaut la somme des aires des rectangles de lhistogramme ?
Une étude plus précise donne les résultats suivants :
Durée de vie[0 ; 5[[5 ; 10[[10 ; 15[[15 ; 20[[20 ; 25[[25 ; 30[[30 ; 35[[35 ; 40[[40 ; 45[Fréquence0,190,160,130,100,080,070,0580,050,037
Durée de vie[45 ; 50[[50 ; 55[[55 ; 60[[60 ; 65[[65 ; 70[[70 ; 75[[75 ; 80[[80 ; 85[[85 ; 90[Fréquence0,030,0240,0170,0150,0120,010,0070,0050,003Durée de vie[90 ; 95[[95 ; 100[[100 ; 105[[105 ; 110[Fréquence0,0010,00050 ,0000,0005
Tracer lhistogramme des fréquences dans le repère ci-dessous.
Laire de chaque rectangle doit être proportionnelle à la fréquence.
Deux petits carreaux correspondent à 1%.
On note T la variable aléatoire donnant le temps de bon fonctionnement dun de ces composants pris au hasard.
Dans chaque cas, hachurer laire correspondante de la couleur indiquée et compléter :
En bleu : P(T SYMBOL 206 \f "Symbol"\h [20 ; 30[ ) =
En rouge : P(T SYMBOL 206 \f "Symbol"\h [45 ; 60[ ) =
En noir : P( 85SYMBOL 163 \f "Symbol"\h T ) =
En vert : P( T > 15 ) =
Sur les deux graphiques précédents, tracer à la règle, une ligne brisée passant par le milieu de chacun des segments située « en haut » de chaque rectangle.
Cette courbe est le polygone des fréquences.
Si on fait une enquête de plus en plus précise, on réduit lamplitude de chaque classe et on augmente le nombre de rectangles. La ligne brisée « se lisse » et on voit alors apparaître une courbe représentant une fonction f appelée densité de probabilité de la loi de T.
Que vaut laire totale sous la courbe ?
Hachurer sur le graphique laire de la partie du plan correspondant à P(20 SYMBOL 163 \f "Symbol"\h T < 32,5).
Exprimer cette probabilité à laide dune intégrale.
Soit t un réel positif. A quelle probabilité correspond EMBED Equation.DSMT4 ?
La fonction f représentée ci-dessus est définie sur [0 ; +SYMBOL 165 \f "Symbol"\h [ par f (x) = 0,04308 e-0,04308x.
Déterminer une primitive F de f sur [0 ; +SYMBOL 165 \f "Symbol"\h[.
Calculer la probabilité quun de ces composants ait une durée de vie inférieure à 60 000 heures.
Quelle est la probabilité quil ait une durée de vie supérieure à 60 000 heures ?
Hachurer laire correspondante sur le graphique et exprimer cette probabilité à laide dune intégrale.
VARIABLES ALEATOIRES CONTINUES
Introduction :
Les variables aléatoires étudiées précédemment ne prenaient quun nombre fini de valeurs.
La loi de probabilité de ces variables aléatoires étaient données soit à laide dun tableau, soit à laide dune formule générale (cas de la loi binomiale).
La durée de vie dun composant électronique, le diamètre, la longueur ou le poids dune pièce usinée sont des variables aléatoires continues, elles prennent leurs valeurs dans un intervalle de EQ \o\al(I;\d\fo2()R).
Dans ces conditions, il nest plus possible de définir la loi de probabilité de X en dressant le tableau des probabilités de chacun des événements « X = xi » car il y en a une infinité.
Une autre approche est alors nécessaire : on sintéresse aux événements du type « X prend ses valeurs dans lintervalle J » que lon note abusivement « X SYMBOL 206 \f "Symbol"\h J ».
I Loi de probabilité à densité
Définition : On appelle densité de probabilité sur un intervalle I, toute fonction f continue et
positive sur I telle que lintégrale de f sur I soit égale à 1.
Exemple 1 : La fonction f définie sur [1 ; 3] par f (x) = eq \s\do1(\f(1;2)) x eq \s\do1(\f(1;2)) est une densité de probabilité.
En effet :
Définition : f désigne une densité de probabilité définie sur un intervalle I.
Dire quune variable aléatoire continue X suit la loi de densité f signifie que pour tout intervalle [a ; b] de I, P(X SYMBOL 206 \f "Symbol"\h [a ; b]) = EMBED Equation.DSMT4
Propriétés : Pour tous réels a et b de lintervalle I :
P(X = a) = 0 en effet : P(X = a) = EMBED Equation.DSMT4 = 0.
P(X SYMBOL 163 \f "Symbol"\h a) = P(X < a) et P(X SYMBOL 179 \f "Symbol"\h a) = P(X > a)
P(X > a) = 1 P(X SYMBOL 163 \f "Symbol"\h a)
P(a < X < b) = P(X < b) P(X < a)
Exemple 2 : X est la variable aléatoire de densité f définie sur [1 ; 3] par f (x) = eq \s\do1(\f(1;2)) x eq \s\do1(\f(1;2)).
P(2 SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h 2,5) =
Définition : Lespérance mathématique dune variable aléatoire continue X, de densité f sur
lintervalle I = [a ; b] est le réel défini par E(X) = EMBED Equation.DSMT4
Exemple 3 : X est la variable aléatoire de densité f définie sur [1 ; 3] par f (x) = eq \s\do1(\f(1;2)) x eq \s\do1(\f(1;2)).
E(X) =
Exercice 1 : La production quotidienne X dun produit en tonnes est une variable aléatoire continue qui prend ses valeurs dans lintervalle [0 ; 10] avec la densité de probabilité f définie par f (x) = 0,006(10x x²).
Vérifier que f est une densité de probabilité.
Calculer la probabilité des événements suivants : A : « X SYMBOL 163 \f "Symbol"\h 7 » et B : « X > 6 »
Calculer lespérance mathématique et interpréter ce résultat.
II Loi uniforme sur [a ; b]
La loi uniforme sur lintervalle [a ; b] modélise le choix, au hasard, dun nombre dans cet intervalle.
Définition : Une variable aléatoire X suit la loi uniforme sur lintervalle I = [a ; b] lorsque sa densité de probabilité f est la fonction constante définie sur [a ; b] par f (t) = eq \s\do1(\f(1;b - a)) .
Remarque : f est une densité de probabilité car
Propriété : Pour tout intervalle J = [c ; d] inclus dans I = [a ; b] : P(X SYMBOL 206 \f "Symbol"\h [c ; d]) = eq \s\do1(\f(d c;b - a)) .
On retiendra que : P(X SYMBOL 206 \f "Symbol"\h J) = eq \s\do1(\f(longueur de J;longueur de I))
Preuve : P(X SYMBOL 206 \f "Symbol"\h [c ; d]) =
Remarque : Si J et K sont deux intervalles de même longueur inclus dans [a ; b] alors
P(X SYMBOL 206 \f "Symbol"\h J) = P(X SYMBOL 206 \f "Symbol"\h K) doù le nom de loi uniforme.
Propriété : Lespérance mathématique dune variable aléatoire X qui suit la loi uniforme sur lintervalle [a ; b] est E(X) = eq \s\do1(\f(a + b;2))
Preuve : E(X) =
Exemple 4 : X est une variable aléatoire qui suit la loi uniforme sur lintervalle [0 ; 10].
P(X SYMBOL 163 \f "Symbol"\h 3) =
P(X > 6) =
P(2 SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h 7) =
Exercice 2 : A partir de 7h00, un bus passe toutes les quinze minutes à larrêt A.
Un usager se présente en A entre 7h et 7h 30. On fait lhypothèse que la durée X (en min) entre 7h00 et lheure de son arrivée en A est une variable aléatoire uniformément répartie sur lintervalle [0 ; 30].
Calculer la probabilité de lévénement E « cet usager attend moins de 5 minutes ».
Exercice 3 : Dans un parc national, un guide propose quotidiennement lobservation dun troupeau de chamois venant sabreuver dans un lac, au coucher du soleil.
Le temps dattente T du groupe, en heure, avant larrivée des animaux suit une loi uniforme sur [0 ; 1].
Calculer la probabilité que le groupe attende moins de 10 minutes.
Calculer la probabilité que le groupe attende plus dune demie heure.
Calculer P(0,2 < T SYMBOL 163 \f "Symbol"\h 0,4).
Calculer P(T = 0,6).
Calculer P(T < 0,3)
Exercice 4 : On choisit un nombre au hasard dans lintervalle [5 ; 30].
Sachant que ce nombre est inférieur à 18, quelle est la probabilité quil soit
supérieur à 12 ?
III Loi exponentielle
Définition : Une variable aléatoire X suit une loi exponentielle de paramètre (, avec ( > 0, lorsque sa densité de probabilité f est la fonction définie sur [0 ; +SYMBOL 165 \f "Symbol"\h[ par f (t) = (e-(t.
Remarque : f est une densité de probabilité car
Propriété : Pour tous réels a et b tels que 0 SYMBOL 163 \f "Symbol"\h a SYMBOL 163 \f "Symbol"\h b on a :
P(X SYMBOL 163 \f "Symbol"\h a) = 1 - e-(a
«P(X > a) = e-(a.
P(a SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h b) = e-(a- e-(b.
Preuve :
P(X SYMBOL 163 \f "Symbol"\h a) = EMBED Equation.DSMT4 = EMBED Equation.DSMT4 = -e-(a + 1 = 1 - e-(a
« X > a » est lévénement contraire de « X SYMBOL 163 \f "Symbol"\h a » donc P(X > a) = 1 (1 - e-(a ) = e-(a.
P(a SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h b) = EMBED Equation.DSMT4 = EMBED Equation.DSMT4 = -e-(b + e-(a = e-(a- e-(b.
Remarque : La durée de vie dun appareil est dite sans vieillissement (on parle aussi de processus sans mémoire), lorsque la probabilité quil fonctionne encore pendant une durée h (au moins) ne dépend que de h et pas de la durée t de son fonctionnement passé.
Cest le cas de nombreux composants électroniques (quil ait 2 jours ou 5ans, un composant électronique a la même probabilité de fonctionner encore 127 heures) ou de la désintégration dun noyau radioactif (quil ait 20 ou 3 000 ans, un noyau radioactif non désintégré à la même probabilité de se désintégrer dans les deux prochaines années).
Propriété :
Une variable aléatoire X suivant une loi exponentielle est sans vieillissement.
Preuve : PX SYMBOL 179 \f "Symbol"\h t (X SYMBOL 179 \f "Symbol"\h t + h) = eq \s\do1(\f(P(X SYMBOL 179 \f "Symbol"\h t et X SYMBOL 179 \f "Symbol"\h t + h); P(X SYMBOL 179 \f "Symbol"\h t))) = eq \s\do1(\f(P(X SYMBOL 179 \f "Symbol"\h t + h); P(X SYMBOL 179 \f "Symbol"\h t))) = eq \s\do1(\f(e-((t + h); e-(t )) = e-(h = P(X SYMBOL 179 \f "Symbol"\h h).
Remarque : On admet que réciproquement les variables aléatoires continues sans vieillissement suivent une loi exponentielle.
Ainsi, eq \x(la loi exponentielle caractérise les processus sans mémoire).
Propriété : Lespérance mathématique dune variable aléatoire X qui suit une loi exponentielle de paramètre ( est E(X) = eq \s\do1(\f(1;()).
Démonstration exigible :
Exercice 5 : On modélise le temps dattente, en minutes, entre deux clients à un guichet par une variable aléatoire X qui suit une loi exponentielle de paramètre ( > 0.
Une étude statistique a permis détablir que le temps moyen dattente est de 5 minutes.
Déterminer (.
Quelle est la probabilité dattendre plus de 15 minutes ?
Quelle est la probabilité dattendre entre 10 et 20 minutes ?
Exercice 6 : La durée de vie, exprimée en années, dun composant électronique est une variable aléatoire notée T qui suit une loi exponentielle de paramètre ( > 0.
Une étude statistique a permis destimer que 67,5 % de ces composants ont une durée de vie supérieure à 5 ans.
Déterminer une valeur arrondie à 10-3 près de ( .
Quelle est la probabilité arrondie à 10-3 près quun composant de ce type dure :
moins de 8 ans ?
plus de 10 ans.
entre 3 et 8 ans ?
au moins 8 ans sachant quil fonctionne encore au bout de 3 ans ?
Déterminer la durée de vie moyenne dun tel composant.
Rappels sur la loi binomiale
Une épreuve de Bernoulli est une expérience aléatoire à deux issues : succès S ou échec EMBED Equation.DSMT4 .
On répète n fois, de manière identique et indépendante, une épreuve de Bernoulli dont la probabilité du succès est p.
Soit X la variable aléatoire qui compte le nombre de succès.
La loi de probabilité de la variable aléatoire X est appelée loi binomiale de paramètres n et p. On la note B(n ; p).
On représente, à laide dun arbre pondéré, la répartition des n épreuves de Bernoulli identiques et indépendantes.
Arbre pondéré lorsque n = 3 :
Pour tout nombre entier k, 0 SYMBOL 163 \f "Symbol"\h k SYMBOL 163 \f "Symbol"\h n, le nombre de chemins réalisant k succès sur les n épreuves est noté EMBED Equation.DSMT4 (on lit « k parmi n »). Ce nombre est appelé coefficient binomial.
Ainsi, à partir de larbre, on obtient par exemple EMBED Equation.DSMT4 et EMBED Equation.DSMT4 .
Pour tout nombre entier k, 0 SYMBOL 163 \f "Symbol"\h k SYMBOL 163 \f "Symbol"\h n, eq \x(P(X = k) = EMBED Equation.DSMT4 pk (1 p)n k)
Espérance : E(X) = np
Variance : V(X) = np(1 p)
Ecart-type : ((X) = eq \r(np(1 p)).
Exercice 7 (corrigé) :
En France, il y a 12 % de gauchers.
Quelle est la probabilité quil y ait exactement 2 gauchers dans une classe de 35 élèves ?
Combien délèves gauchers peut-on sattendre à trouver en moyenne dans une classe de 35 élèves ?
Calculer la variance et lécart-type.
Solution :
On modélise la situation à laide dune loi binomiale
Lépreuve de Bernoulli consiste à demander à un élève sil est gaucher (succès) on non (échec).
On répète 35 fois, de manière indépendante, la même épreuve de Bernoulli.
La probabilité du succès est p = 0,12.
On note G la variable aléatoire comptant le nombre de gauchers dans une classe de 35 élèves.
G suit la loi binomiale de paramètres n = 35 et p = 0,12.
P(G = 2) = EMBED Equation.DSMT4 0,12² SYMBOL 180 \f "Symbol"\h 0,8833 SYMBOL 187 \f "Symbol"\h 0,126 (On peut effectuer directement le calcul à la machine)
E(G) = 35 SYMBOL 180 \f "Symbol"\h 0,12 = 4,2 = eq \s\do1(\f(42;10)).
Cela signifie que dans 10 classes de 35 élèves, il y a en moyenne 42 gauchers.
V(G) = 35 SYMBOL 180 \f "Symbol"\h 0,12 SYMBOL 180 \f "Symbol"\h 0,88 = 3,696 et ((G) = eq \r(35 SYMBOL 180 \f "Symbol"\h 0,12 SYMBOL 180 \f "Symbol"\h 0,88) = eq \r(3,696) SYMBOL 187 \f "Symbol"\h 1,92
Exercice 8 :
Un constructeur de composants électroniques produit des résistances. Une étude statistique permet destimer que la probabilité quune résistance soit défectueuse est égale à 0,005.
On prélève un lot de 1 000 résistances dans la production et on suppose que le stock est suffisamment important pour assimiler le prélèvement à un tirage avec remise.
On considère la variable aléatoire X qui, à tout prélèvement de 1 000 résistances, associe le nombre de résistances défectueuses.
Justifier que la variable aléatoire X suit une loi binomiale dont on précisera les paramètres.
Calculer les probabilités des évènements suivants arrondies au millième :
A : « le lot contient exactement 3 résistances défectueuses »
B : « le lot ne contient pas de résistance défectueuse »
Calculer lespérance mathématique de la variable aléatoire X et interpréter ce résultat dans le cadre de lénoncé.
Calculer la variance et lécart-type de X.
Activité : approche statistique de la loi normale
Masse (en mg)[116 ; 118[[118 ; 120[[120 ; 122[[122 ; 124[[124 ; 126[Effectif 5 14 26 43 51FréquenceAu cours dune répartition de pénicilline en flacons sur une machine automatique, on prélève, à intervalles plus ou moins réguliers, un flacon dont on pèse le contenu au dixième de milligramme. On prélève ainsi un échantillon de 250 flacons dont les masses des contenus en mg se répartissent selon les 10 classes suivantes :
Masse (en mg)[126 ; 128[[128 ; 130[[130 ; 132[[132 ; 134[[134 ; 136[Effectif 47 29 18 14 3Fréquence
Compléter le tableau ci-dessus.
Tracer lhistogramme des fréquences.
Quelle est la probabilité que la masse dun flacon soit comprise entre 122 et 128 mg ?
Hachurer laire correspondante sur le graphique.
Tracer le polygone des fréquences.
Au fur et à mesure que la taille de l'échantillon augmente et que la taille des classes diminue, l'histogramme devient de plus en plus régulier et la courbe des fréquences se rapproche d'une courbe en cloche appelée courbe de Gauss.
Représenter cette courbe en cloche donnée par le tableau de valeurs suivant :
x116117118119120121122123124125126f (x)0,0100,0180,0310,0490,0730,1030,1340,1640,1880,2020,203
x127128129130131132133134135136f (x)0,1910,1680,1390,1080,0780,0530,0340,020,0110,006Illustration : HYPERLINK "http://www.astro.ulg.ac.be/cours/magain/stat/stat51.html"http://www.astro.ulg.ac.be/cours/magain/stat/stat51.html
LA LOI NORMALE
En théorie des probabilités et en statistique, la loi normale est l'une des lois de probabilité les plus adaptées pour modéliser des phénomènes naturels issus de plusieurs évènements aléatoires (diamètre dune tige produite par une machine, masse dun paquet de sucre, taille dun enfant de 8 ans). Parmi les lois de probabilité, la loi normale prend une place particulière grâce au théorème central limite. En effet, elle correspond au comportement de toute suite d'expériences aléatoires identiques et indépendantes, lorsque le nombre d'expériences est très élevé. Grâce à cette propriété, la loi normale permet d'approcher d'autres lois et ainsi de modéliser de nombreuses études scientifiques comme des mesures d'erreurs ou des tests statistiques. Elle est reconnaissable grâce à sa courbe en cloche.
I La loi normale
La loi normale centrée réduite
définition : Une variable aléatoire X suit la loi normale centrée réduite, notée N(0 ; 1) lorsque
sa densité de probabilité f est la fonction définie sur EQ \o\al(I;\d\fo2()R) par : f (x) = eq \s\do1(\f(1; eq \r(2())) EMBED Equation.DSMT4 .
Courbe de Gauss ou courbe en cloche
Remarques :
f est continue et strictement positive sur EQ \o\al(I;\d\fo2()R).
Laire totale sous la courbe est égale à 1.
Pour tous réels a et b, P(a SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h b) = EMBED Equation.DSMT4
La probabilité que X soit compris entre a et b est laire
du domaine sous la courbe en cloche entre les droites
déquations x = a et x = b.
f est paire donc sa courbe représentative est symétrique
par rapport à laxe des ordonnées.
En particulier P (X SYMBOL 206 \f "Symbol"\h [0 ; +SYMBOL 165 \f "Symbol"\h[ ) = eq \s\do1(\f(1;2)).
Pour tout réel u, P(X SYMBOL 163 \f "Symbol"\h -u) = 1 - P(X > -u) or pour des raisons de symétrie P(X > -u) = P(X SYMBOL 163 \f "Symbol"\h u) donc P(X SYMBOL 163 \f "Symbol"\h -u) = 1 P(X SYMBOL 163 \f "Symbol"\h u).
Propriété : Soit X est une variable aléatoire qui suit la loi N(0 ; 1), alors E(X) = 0 et ((X) = 1.
Remarque : On ne sait pas calculer une primitive de la fonction densité de probabilité dans le cas des lois normales, pour effectuer les calculs, on utilise soit la table de la loi normale centrée réduite, soit la calculatrice.
Exemple 5 : Soit X est une variable aléatoire qui suit la loi N(0 ; 1).
En utilisant une calculatrice, calculer à 10-4 près :
P(-1 SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h 2) = P(X SYMBOL 163 \f "Symbol"\h 1,4) = P(X> 0,5) =
Propriété : Détermination dun intervalle centré en 0 de probabilité donnée
Si X est une variable aléatoire qui suit la loi N(0 ; 1), alors pour tout nombre réel ( SYMBOL 206 \f "Symbol"\h ]0 ; 1[, il existe un unique réel u( > 0 tel que P(-u( SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h u() = 1 - (.
Démonstration exigible :
P(-u SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h u) = EMBED Equation.DSMT4 = 2 EMBED Equation.DSMT4 = 2F(u) où F est la primitive
de f sur EQ \o\al(I;\d\fo2()R) qui sannule en 0 (intégrale de la borne supérieure).
F est continue et strictement croissante (car sa dérivée est f et f > 0).
EMBED Equation.DSMT4 eq \s\do1(\f(1;2)) car cela correspond à laire sous la courbe sur [0 ; +SYMBOL 165 \f "Symbol"\h[.
La fonction 2F est donc continue, strictement croissante, 2F(0) = 0 et
EMBED Equation.DSMT4 1.
De plus, pour tout nombre réel ( SYMBOL 206 \f "Symbol"\h ]0 ; 1[, 1 - ( SYMBOL 206 \f "Symbol"\h ]0 ; 1[ donc daprès le théorème de la bijection, il existe un unique u( > 0 tel que 2F(u() = 1 - (, cest-à-dire tel que P(-u( SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h u() = 1 - (.
En particulier :
u0,05 SYMBOL 187 \f "Symbol"\h 1,96 u0,01 SYMBOL 187 \f "Symbol"\h 2,58
P(X SYMBOL 206 \f "Symbol"\h [-1,96 ; 1,96] ) = 0,95 P(X SYMBOL 206 \f "Symbol"\h [-2,58 ; 2,58] ) = 0,99
Exemple 6 : Déterminer u0,10 tel que P(-u0,10 SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h u0,10) = 0,90.
Exercice 9 : De même, retrouver que u0,05 SYMBOL 187 \f "Symbol"\h 1,96 et que u0,01 SYMBOL 187 \f "Symbol"\h 2,58
2. La loi normale N(( ; (²)
Définition : ( désigne un réel et ( un réel strictement positif.
La variable X suit la loi normale de paramètres ( et (², notée N(( ; (²),
lorsque la variable aléatoire centrée réduite eq \s\do1(\f(X - (;()) suit la loi N(0 ; 1).
Propriété : Soit X est une variable aléatoire qui suit la loi N(( ; (²), alors son espérance est ( et son écart-type est (.
Remarque : Une loi normale N(( ; (²) est une loi à densité, il existe une fonction g définie sur EQ \o\al(I;\d\fo2()R) telle que pour tous réels a et b, P(a SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h b) = EMBED Equation.DSMT4 .
Lexpression de g nest pas au programme.
Lallure des courbes de densité est entièrement déterminée par les valeurs de ( et ( :
Lespérance ( est un paramètre de position, Lécart-type ( est un paramètre de dispersion.
il localise la zone où les réalisations de X ont Plus ( est faible, moins les réalisations de X
le plus de chance dapparaître. sont dispersées autour de (.
Exercice 10 :
Si Y suit la loi normale N (4 ; 2), déterminer P(Y SYMBOL 163 \f "Symbol"\h 6).
Si Y suit la loi normale N (5 ; 1,2), déterminer P(2,5 SYMBOL 163 \f "Symbol"\h Y SYMBOL 163 \f "Symbol"\h 6,5).
Propriété : Si X suit la loi N(( ; (²), alors sa dispersion autour de ( dépend uniquement de (.
En particulier :
P(X SYMBOL 206 \f "Symbol"\h [( - ( ; ( + (] ) SYMBOL 187 \f "Symbol"\h 0,638
P(X SYMBOL 206 \f "Symbol"\h [( - 2( ; ( + 2(] ) SYMBOL 187 \f "Symbol"\h 0,954
P(X SYMBOL 206 \f "Symbol"\h [( - 3( ; ( + 3(] ) SYMBOL 187 \f "Symbol"\h 0,997.
II Approximation dune loi binomiale par une loi normale
La loi binomiale est très utilisée en modélisation, mais les calculs sont très compliqués.
Le théorème suivant, qui permet dapproximer, sous certaines conditions, la loi binomiale par la loi normale centrée réduite, a permis de faciliter les calculs.
Le Théorème de Moivre-Laplace (admis)
Pour tout entier naturel n, Xn est une variable aléatoire qui suit la loi binomiale B(n ; p).
On pose Zn = eq \s\do1(\f(Xn np; eq \r(np(1 p)) )), variable centrée réduite associée à Xn.
Alors, pour tous réels a et b, tels que a < b : EMBED Equation.DSMT4 P(a SYMBOL 163 \f "Symbol"\h Zn SYMBOL 163 \f "Symbol"\h b) = EMBED Equation.DSMT4
Autrement dit, pour les « grandes valeurs » de n, la loi binomiale est très proche de la loi normale de même espérance np et de même écart-type eq \r(np(1 p)).
En pratique, on fera cette approximation dès que les trois conditions suivantes sont remplies :
eq \x(n SYMBOL 179 \f "Symbol"\h 30, np SYMBOL 179 \f "Symbol"\h 5 et n(1 p) SYMBOL 179 \f "Symbol"\h 5.)
Intervalle de fluctuation asymptotique
Lorsque lon, prélève un échantillon dans une population, la fréquence du caractère observé dépend de léchantillon. Ce phénomène sappelle la fluctuation déchantillonnage.
Prélever un échantillon de taille n revient à répéter n fois, de façon indépendante, la même épreuve de Bernoulli (en réalité le tirage est sans remise mais comme la taille de la population est très importante, le tirage peut être considéré avec remise car le fait de prélever quelques individus ne modifie pas de façon importante la probabilité p du succès).
La variable aléatoire qui compte le nombre de succès dans léchantillon suit la loi binomiale B(n ; p).
Théorème :
Si la variable aléatoire Xn suit la loi binomiale B(n ; p) alors la fréquence du succès Fn = eq \s\do1(\f(Xn;n)) vérifie EMBED Equation.DSMT4 P eq \b(Fn SYMBOL 206 \f "Symbol"\h eq \b\bc\[(p u( eq \s\do1(\f( eq \r(p(1 p)); eq \r(n))) , p + u( eq \s\do1(\f( eq \r(p(1 p)); eq \r(n)))) ) = 1 - (
où u( vérifie P(-u( SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h u() = 1 - ( pour X suivant la loi N(0 ; 1).
Démonstration exigible :
Xn suit la loi binomiale B(n ; p), donc daprès le théorème de Moivre-Laplace :
EMBED Equation.DSMT4 P eq \b( -u( SYMBOL 163 \f "Symbol"\h eq \s\do1(\f(Xn np; eq \r(np(1 p)) )) SYMBOL 163 \f "Symbol"\h u( ) = 1 - ( (par définition de u( pour la loi N(0 ; 1)).
Or u( SYMBOL 163 \f "Symbol"\h eq \s\do1(\f(Xn np; eq \r(np(1 p)) )) SYMBOL 163 \f "Symbol"\h u( équivaut à -u( eq \r(np(1 p)) SYMBOL 163 \f "Symbol"\h Xn np SYMBOL 163 \f "Symbol"\h u( eq \r(np(1 p))
soit np - u( eq \r(np(1 p)) SYMBOL 163 \f "Symbol"\h Xn SYMBOL 163 \f "Symbol"\h np + u( eq \r(np(1 p))
puis p - u( eq \s\do1(\f( eq \r(p(1 p)); eq \r(n))) SYMBOL 163 \f "Symbol"\h eq \s\do1(\f(Xn;n)) SYMBOL 163 \f "Symbol"\h p + u( eq \s\do1(\f( eq \r(p(1 p)); eq \r(n)))
soit Fn SYMBOL 206 \f "Symbol"\h eq \b\bc\[(p u( eq \s\do1(\f( eq \r(p(1 p)); eq \r(n))) , p + u( eq \s\do1(\f( eq \r(p(1 p)); eq \r(n)))) .
ainsi EMBED Equation.DSMT4 P eq \b(Fn SYMBOL 206 \f "Symbol"\h eq \b\bc\[(p u( eq \s\do1(\f( eq \r(p(1 p)); eq \r(n))) , p + u( eq \s\do1(\f( eq \r(p(1 p)); eq \r(n)))) ) = 1 - (
En pratique : Pour ( = 0,05, on a u0,05 SYMBOL 187 \f "Symbol"\h 1,96. Lorsque n SYMBOL 179 \f "Symbol"\h 30, np SYMBOL 179 \f "Symbol"\h 5 et n(1 p) SYMBOL 179 \f "Symbol"\h 5, on considère que la fréquence Fn de succès fluctue avec une probabilité de 0,95 dans lintervalle
eq \b\bc\[(p 1,96 eq \s\do1(\f( eq \r(p(1 p)); eq \r(n))) , p + 1,96 eq \s\do1(\f( eq \r(p(1 p)); eq \r(n))) ).
Cet intervalle est appelé intervalle de fluctuation asymptotique de Fn au seuil de 95 %.
Cela signifie que dans 95 % des cas, la fréquence Fn de léchantillon appartient à cet intervalle.
Remarque : En étudiant les variation sur [0 ; 1] de la fonction g définie par g(x) = x(1 x),
on montre quelle est majorée par eq \s\do1(\f(1;4)), ainsi pour tout p SYMBOL 206 \f "Symbol"\h [0 ; 1], eq \r(p(1 p)) SYMBOL 163 \f "Symbol"\h eq \s\do1(\f(1;2)) et 1,96 eq \s\do1(\f( eq \r(p(1 p)); eq \r(n))) SYMBOL 163 \f "Symbol"\h eq \s\do1(\f(1; eq \r(n)))
ainsi lintervalle de fluctuation ci-dessus est inclus dans lintervalle de fluctuation utilisé en Seconde :
eq \b\bc\[(p eq \s\do1(\f(1; eq \r(n))) , p + eq \s\do1(\f(1; eq \r(n)))).
Application à la prise de décision :
La proportion du caractère étudié dans la population est supposée être égale à p.
(Cest notre hypothèse).
La prise de décision consiste, à partir dun échantillon de taille n, à rejeter ou non cette hypothèse.
On vérifie que n SYMBOL 179 \f "Symbol"\h 30, np SYMBOL 179 \f "Symbol"\h 5 et n(1 p) SYMBOL 179 \f "Symbol"\h 5, puis on détermine lintervalle de fluctuation asymptotique au seuil de 95 %.
Si la fréquence f du caractère étudié dans notre échantillon appartient à cet intervalle, on ne peut pas rejeter lhypothèse faite sur p.
Sinon, on rejette lhypothèse faite sur p avec un risque de 5 % de se tromper.
Remarques :
On peut, avec cette méthode, accepter à tort une hypothèse fausse. Ce risque derreur nest pas déterminé.
On peut aussi rejeter à tort une hypothèse alors quelle est correcte. Ce risque est de 5%.
Cest une probabilité conditionnelle : sachant que lhypothèse est correcte, elle sera rejetée dans 5 % des cas.
Illustration :
Notons H lévénement : « lhypothèse est vraie »
et A lévénement : « on accepte lhypothèse ».
Les autres probabilités sont inconnues car lintervalle de fluctuation
a été établi dans le cas où la proportion p dans la population est connue
donc lorsque H est vraie !
Exemple 7: On lancé 100 fois une pièce de monnaie et obtenu 60 fois Pile.
La pièce est-elle équilibrée ?
Comprendre lénoncé : la fréquence de Pile observée est 0,6.
Cet écart avec la proportion théorique p = 0,5 dune pièce équilibrée est-il dû aux fluctuations déchantillonnage ou est-ce parce que la pièce nest pas équilibrée ?
On fait lhypothèse que la pièce est équilibrée donc que p = 0,5.
On déterminer lintervalle de fluctuation au seuil 95 %
eq \b\rc\}(\a\ac\hs4\co1(n = 100 donc n SYMBOL 179 \f "Symbol"\h 30 ; np = 100 SYMBOL 180 \f "Symbol"\h 0,5 = 50 donc np SYMBOL 179 \f "Symbol"\h 5 ; n(1 p) = 100 SYMBOL 180 \f "Symbol"\h 0,5 = 50 donc n(1 p) SYMBOL 179 \f "Symbol"\h 5.)) Les trois conditions sont remplies.
On écrit lintervalle de fluctuation au seuil 95 % :
J = eq \b\bc\[(0,5 - 1,96 SYMBOL 180 \f "Symbol"\h eq \s\do1(\f( eq \r(0,5 SYMBOL 180 \f "Symbol"\h 0, 5) ; eq \r(100))) , 0,5 + 1,96 SYMBOL 180 \f "Symbol"\h eq \s\do1(\f( eq \r(0,5 SYMBOL 180 \f "Symbol"\h 0, 5) ; eq \r(100))))
Avec des valeurs approchées par défaut à gauche et par excès à droite, on obtient : J = [0,19 ; 0,81].
f SYMBOL 206 \f "Symbol"\h J donc on ne peut pas rejeter lhypothèse : « la pièce est équilibrée ».
On considère donc que la pièce est équilibrée.
Elle ne lest peut-être pas, on prend le risque daccepter à tort une hypothèse fausse. Ce risque nest pas mesuré.
Exemple 8 : Un laboratoire pharmaceutique annonce que son nouveau médicament est efficace dans 90 % des cas.
Lagence française de sécurité sanitaire effectue une enquête sur un échantillon de 200 personnes traitées par ce médicament. 160 sont guéries.
Que conclure de cette enquête ?
On fait lhypothèse que
..
On déterminer lintervalle de fluctuation au seuil 95 %
La fréquence de léchantillon est
f
..
donc on
..
rejeter lhypothèse.
On considère donc que le laboratoire pharmaceutique
..
III Estimation
On se place dans le cas où la proportion p dun certain caractère dans une population est inconnue. Pour des raisons de coût ou de faisabilité, on ne peut interroger toute la population.
On cherche alors à estimer p à partir de la fréquence f des individus ayant ce caractère dans un échantillon de taille n, cest le principe des sondages.
La fréquence f varie dun échantillon à lautre du fait de la fluctuation déchantillonnage.
Lobjectif nest pas de donner la valeur de p mais un intervalle, appelé intervalle de confiance, contenant p dans plus de 95% des cas.
On sait que si les trois conditions usuelles sont remplies, alors f SYMBOL 206 \f "Symbol"\h eq \b\bc\[(p eq \s\do1(\f(1; eq \r(n))) , p + eq \s\do1(\f(1; eq \r(n)))) dans plus de 95 % des cas.
Cet intervalle est lintervalle de fluctuation vu en Seconde qui contient lintervalle de fluctuation vu en Terminale.
Donc P eq \b(p eq \s\do1(\f(1 ; eq \r(n))) SYMBOL 163 \f "Symbol"\h f SYMBOL 163 \f "Symbol"\h p + eq \s\do1(\f(1 ; eq \r(n)))) SYMBOL 179 \f "Symbol"\h 0,95.
Or p eq \s\do1(\f(1 ; eq \r(n))) SYMBOL 163 \f "Symbol"\h f SYMBOL 163 \f "Symbol"\h p + eq \s\do1(\f(1 ; eq \r(n))) SYMBOL 219 \f "Symbol"\h eq \b\lc\{( \s(p eq \s\do1(\f(1 ; eq \r(n))) SYMBOL 163 \f "Symbol"\h f ; f SYMBOL 163 \f "Symbol"\h p + eq \s\do1(\f(1 ; eq \r(n))))) SYMBOL 219 \f "Symbol"\h eq \b\lc\{( \s(p SYMBOL 163 \f "Symbol"\h f eq \s\do1(\f(1; eq \r(n))) ; f eq \s\do1(\f(1; eq \r(n))) SYMBOL 163 \f "Symbol"\h p)) SYMBOL 219 \f "Symbol"\h f eq \s\do1(\f(1 ; eq \r(n))) SYMBOL 163 \f "Symbol"\h p SYMBOL 163 \f "Symbol"\h f + eq \s\do1(\f(1 ; eq \r(n)))
Ainsi P eq \b(p eq \s\do1(\f(1 ; eq \r(n))) SYMBOL 163 \f "Symbol"\h f SYMBOL 163 \f "Symbol"\h p + eq \s\do1(\f(1 ; eq \r(n)))) SYMBOL 179 \f "Symbol"\h 0,95 équivaut à P eq \b(f eq \s\do1(\f(1 ; eq \r(n))) SYMBOL 163 \f "Symbol"\h p SYMBOL 163 \f "Symbol"\h f + eq \s\do1(\f(1 ; eq \r(n)))) SYMBOL 179 \f "Symbol"\h 0,95.
Propriété : La proportion p inconnue est telle que P eq \b(f eq \s\do1(\f(1 ; eq \r(n))) SYMBOL 163 \f "Symbol"\h p SYMBOL 163 \f "Symbol"\h f + eq \s\do1(\f(1 ; eq \r(n)))) SYMBOL 179 \f "Symbol"\h 0,95
lorsque les trois conditions dapproximation sont remplies.
Définition : Lintervalle eq \b\bc\[(f eq \s\do1(\f(1; eq \r(n))) , f + eq \s\do1(\f(1; eq \r(n)))) est appelé intervalle de confiance de la proportion inconnue p avec un niveau de confiance 0,95.
Remarque importante : [ + ]
Lamplitude de lintervalle de confiance est eq \s\do1(\f(2; eq \r(n))). f - eq \s\do1(\f(1; eq \r(n))) f f + eq \s\do1(\f(1; eq \r(n)))
Lamplitude, donc la précision de lestimation, ne dépend que de la taille n de léchantillon.
Si lon souhaite situer p dans un intervalle de longueur donnée a, alors on doit avoir :
eq \x( eq \s\do1(\f(2; eq \r(n))) SYMBOL 163 \f "Symbol"\h a soit eq \s\do1(\f(4;n)) SYMBOL 163 \f "Symbol"\h a² soit n SYMBOL 179 \f "Symbol"\h eq \s\do1(\f(4;a²)))
On obtient ainsi la taille dun échantillon permettant davoir p avec une précision fixée.
Exemple 9 : Dans un lycée, 850 élèves mangent à la cantine.
Un sondage sur un échantillon de 58 élèves montre que 62 % dentre eux sont satisfaits des repas.
A partir de ce sondage, déterminer lintervalle de confiance au niveau de
confiance 0,95 de la proportion délèves de ce lycée satisfaits des repas.
On utilisera des valeurs approchées à 10-4 près.
Attention : Dans le cadre de lestimation, on suppose que les conditions dapplication sont respectées. Ne connaissant pas p, il est impossible de les vérifier !
Exercice 11 : M Legrand se présente aux élections. Le dernier sondage effectué auprès dun échantillon de 400 personnes donne M Legrand gagnant avec 54 % des voix.
Déterminer un intervalle de confiance au niveau de confiance 0,95 de la proportion de personnes envisageant de voter pour M Legrand.
M Legrand est-il assuré de lemporter au vue de ce sondage ?
Quel est lamplitude de cet intervalle de confiance ?
Quelle doit être la taille de léchantillon pour obtenir un intervalle de confiance de longueur au plus 0,05 ?
Exercice 12 : On effectue un sondage auprès des 15-20 ans pour connaître leur préférence en matière de restauration rapide. La question est formulée de la façon suivante :
« Préférez-vous les kébabs ou les pizzas ? ».
On interroge un premier échantillon de 100 personnes. 48 préfèrent les pizzas.
Déterminer un intervalle de confiance au niveau 95 % pour la proportion damateurs de pizzas dans la population des 15-20 ans.
Cet intervalle permet-il de savoir lequel des deux types de restauration rapide à la préférence des 15-20 ans ?
En gardant la même fréquence quà la question 1, quelle taille déchantillon aurait-il été nécessaire pour pouvoir conclure ?
Pour faire le point :
Lorsque la proportion p dapparition dun caractère dans la population est connue
et que lon veut savoir si le hasard seul peut expliquer lécart entre la fréquence f
observée de ce caractère dans un échantillon et p, on utilise un intervalle de fluctuation I.
Si f SYMBOL 206 \f "Symbol"\h I, on décide que f et p sont « compatibles » et que lécart entre f et p est dû aux
fluctuations déchantillonnages.
Si f SYMBOL 207\f"Symbol"\hI, on considère, avec un risque de 5% de prendre une mauvaise décision,
que f et p ne sont pas « compatibles » et quil est prudent de rechercher une autre
explication que le hasard à cet écart entre f et p.
(Ce type de raisonnement est mené en Seconde).
Lorsque lon pense connaître la proportion p dapparition du caractère dans la population ou que lon souhaite tester une valeur p possible, on est encore dans le cadre de léchantillonnage. On émet une hypothèse sur la valeur de p que lon rejette ou non à laide dun intervalle de fluctuation.
Lorsque la proportion p dapparition du caractère étudié dans la population est totalement inconnue, on va estimer p à laide dun intervalle de confiance obtenu à partir de la fréquence dapparition du caractère dans un échantillon.
On est dans le cadre de lestimation, on utilise un intervalle de confiance.
PAGE \* MERGEFORMAT 18
1 %
1 %
Il y a un chemin
réalisant 3 succès.
S
S
S
S
S
S
S
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
p
p
1 - p
Il y a trois chemins
réalisant 2 succès.
1 - p
p
p
1 - p
Il y a trois chemins
réalisant 1 succès.
p
1 - p
p
1 - p
Il y a un chemin
réalisant 0 succès,
soit 3 échecs.
p
1 - p
1 - p
u0 +SYMBOL 165 \f "Symbol"\h
2F(u) 1
0
Moyenne
(
Ecart-type
(
Réduire ( réduit
la dispersion
autour
de (.
La courbe est symétrique par rapport à la
droite déquation x = (.
(
( = 0 ; ( = eq \s\do1(\f(1;2))
( = 8 ; ( = eq \s\do1(\f(1;2))
( = 4 ; ( = 1
( = 0 ; ( = 1 EMBED Equation.DSMT4 EMBED Equation.DSMT4
( = 6 ; ( = 2
( = 0 ; ( = 2
63,8 %
(
( + (
( - (
95,4 %
(
( - 2(
( + 2(
99,7 %
(
( - 3(
( + 3(
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4 0,95
EMBED Equation.DSMT4 0,05