Td corrigé Loi normale - Mathématiques - Académie de Caen pdf

Loi normale - Mathématiques - Académie de Caen

Croire un sondage. ...... Les valeurs instantanées des tensions ou intensités électriques sinusoïdales ..... Comment sont alimentés nos appareils électriques ?




part of the document



Activité 1 :

Margaux choisit un réel de l’intervalle [0 ; 10].
Elle ne choisit pas forcément un entier, elle peut choisir 5 SYMBOL 180 \f "Symbol"\h 10-3 ,  eq \r(7) ou 2(.

Compléter les phrases suivantes :

La probabilité que ce nombre soit supérieur à 5 est …

La probabilité que ce nombre appartienne à l’intervalle [2 ; 4] est …

La probabilité que ce nombre soit plus grand que 7 est égale à la probabilité que ce nombre soit …

Sachant que ce nombre est plus grand que 4, la probabilité qu’il soit plus grand que 5 est …

Margaux a choisi le nombre  eq \s\do1(\f(1;e)) . La probabilité que quelqu’un trouve ce nombre est …

Activité 2 :
Une étude statistique porte sur le temps de bon fonctionnement, en milliers d’heures, d’un composant électronique.
On a étudié un échantillon de 5000 de ces composants.
Les résultats sont donnés dans les tableaux ci-dessous :
Durée de vie[0 ; 10[[10 ; 20[[20 ; 30[[30 ; 40[[40 ; 50[[50 ; 60[[60 ; 70[[70 ; 80[[80 ; 90[[90 ; 100[[100 ; 110[Fréquence0, 340,220,140,110,070,050,030,020,010,0060,004

Tracer l’histogramme des fréquences dans le repère ci-dessous.
L’aire de chaque rectangle doit être proportionnelle à la fréquence.
Deux petits carreaux correspondent à 1%.



Quel est le pourcentage de composants dont le temps de bon fonctionnement est inférieur à 30 000 heures ?

Hachurer en rouge l’aire correspondante sur le graphique.

Que vaut la somme des aires des rectangles de l’histogramme ?

Une étude plus précise donne les résultats suivants :

Durée de vie[0 ; 5[[5 ; 10[[10 ; 15[[15 ; 20[[20 ; 25[[25 ; 30[[30 ; 35[[35 ; 40[[40 ; 45[Fréquence0,190,160,130,100,080,070,0580,050,037
Durée de vie[45 ; 50[[50 ; 55[[55 ; 60[[60 ; 65[[65 ; 70[[70 ; 75[[75 ; 80[[80 ; 85[[85 ; 90[Fréquence0,030,0240,0170,0150,0120,010,0070,0050,003Durée de vie[90 ; 95[[95 ; 100[[100 ; 105[[105 ; 110[Fréquence0,0010,00050 ,0000,0005


Tracer l’histogramme des fréquences dans le repère ci-dessous.
L’aire de chaque rectangle doit être proportionnelle à la fréquence.
Deux petits carreaux correspondent à 1%.



On note T la variable aléatoire donnant le temps de bon fonctionnement d’un de ces composants pris au hasard.
Dans chaque cas, hachurer l’aire correspondante de la couleur indiquée et compléter :

En bleu : P(T SYMBOL 206 \f "Symbol"\h [20 ; 30[ ) = … En rouge : P(T SYMBOL 206 \f "Symbol"\h [45 ; 60[ ) = …

En noir : P( 85SYMBOL 163 \f "Symbol"\h T ) = … En vert : P( T > 15 ) = …

Sur les deux graphiques précédents, tracer à la règle, une ligne brisée passant par le milieu de chacun des segments située « en haut » de chaque rectangle.
Cette courbe est le polygone des fréquences.

Si on fait une enquête de plus en plus précise, on réduit l’amplitude de chaque classe et on augmente le nombre de rectangles. La ligne brisée « se lisse » et on voit alors apparaître une courbe représentant une fonction f appelée densité de probabilité de la loi de T.



Que vaut l’aire totale sous la courbe ?

Hachurer sur le graphique l’aire de la partie du plan correspondant à P(20 SYMBOL 163 \f "Symbol"\h T < 32,5).

Exprimer cette probabilité à l’aide d’une intégrale.

Soit t un réel positif. A quelle probabilité correspond  EMBED Equation.DSMT4  ?


La fonction f représentée ci-dessus est définie sur [0 ; +SYMBOL 165 \f "Symbol"\h [ par f (x) = 0,04308 e-0,04308x.

Déterminer une primitive F de f sur [0 ; +SYMBOL 165 \f "Symbol"\h[.

Calculer la probabilité qu’un de ces composants ait une durée de vie inférieure à 60 000 heures.

Quelle est la probabilité qu’il ait une durée de vie supérieure à 60 000 heures ?



Hachurer l’aire correspondante sur le graphique et exprimer cette probabilité à l’aide d’une intégrale.
VARIABLES ALEATOIRES CONTINUES

Introduction :
Les variables aléatoires étudiées précédemment ne prenaient qu’un nombre fini de valeurs.
La loi de probabilité de ces variables aléatoires étaient données soit à l’aide d’un tableau, soit à l’aide d’une formule générale (cas de la loi binomiale).

La durée de vie d’un composant électronique, le diamètre, la longueur ou le poids d’une pièce usinée sont des variables aléatoires continues, elles prennent leurs valeurs dans un intervalle de EQ \o\al(I;\d\fo2()R).
Dans ces conditions, il n’est plus possible de définir la loi de probabilité de X en dressant le tableau des probabilités de chacun des événements « X = xi » car il y en a une infinité.
Une autre approche est alors nécessaire : on s’intéresse aux événements du type « X prend ses valeurs dans l’intervalle J » que l’on note abusivement « X SYMBOL 206 \f "Symbol"\h J ».


I Loi de probabilité à densité

Définition : On appelle densité de probabilité sur un intervalle I, toute fonction f continue et
positive sur I telle que l’intégrale de f sur I soit égale à 1.

Exemple 1 : La fonction f définie sur [1 ; 3] par f (x) =  eq \s\do1(\f(1;2)) x –  eq \s\do1(\f(1;2)) est une densité de probabilité.
 En effet :










Définition : f désigne une densité de probabilité définie sur un intervalle I.
Dire qu’une variable aléatoire continue X suit la loi de densité f signifie que pour tout intervalle [a ; b] de I, P(X SYMBOL 206 \f "Symbol"\h [a ; b]) =  EMBED Equation.DSMT4 







Propriétés : Pour tous réels a et b de l’intervalle I :
P(X = a) = 0 en effet : P(X = a) =  EMBED Equation.DSMT4  = 0.
P(X SYMBOL 163 \f "Symbol"\h a) = P(X < a) et P(X SYMBOL 179 \f "Symbol"\h a) = P(X > a)
P(X > a) = 1 – P(X SYMBOL 163 \f "Symbol"\h a)
P(a < X < b) = P(X < b) – P(X < a)
Exemple 2 : X est la variable aléatoire de densité f définie sur [1 ; 3] par f (x) =  eq \s\do1(\f(1;2)) x –  eq \s\do1(\f(1;2)).

P(2 SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h 2,5) =






Définition : L’espérance mathématique d’une variable aléatoire continue X, de densité f sur
l’intervalle I = [a ; b] est le réel défini par E(X) =  EMBED Equation.DSMT4 

Exemple 3 : X est la variable aléatoire de densité f définie sur [1 ; 3] par f (x) =  eq \s\do1(\f(1;2)) x –  eq \s\do1(\f(1;2)).
E(X) =





Exercice 1 : La production quotidienne X d’un produit en tonnes est une variable aléatoire continue qui prend ses valeurs dans l’intervalle [0 ; 10] avec la densité de probabilité f définie par f (x) = 0,006(10x – x²).

Vérifier que f est une densité de probabilité.








Calculer la probabilité des événements suivants : A : « X SYMBOL 163 \f "Symbol"\h 7 » et B : « X > 6 »









Calculer l’espérance mathématique et interpréter ce résultat.






II Loi uniforme sur [a ; b]

La loi uniforme sur l’intervalle [a ; b] modélise le choix, au hasard, d’un nombre dans cet intervalle.

Définition : Une variable aléatoire X suit la loi uniforme sur l’intervalle I = [a ; b] lorsque sa densité de probabilité f est la fonction constante définie sur [a ; b] par f (t) =  eq \s\do1(\f(1;b - a)) .

Remarque : f est une densité de probabilité car






Propriété : Pour tout intervalle J = [c ; d] inclus dans I = [a ; b] : P(X SYMBOL 206 \f "Symbol"\h [c ; d]) =  eq \s\do1(\f(d – c;b - a)) .
On retiendra que : P(X SYMBOL 206 \f "Symbol"\h J) =  eq \s\do1(\f(longueur de J;longueur de I))


Preuve : P(X SYMBOL 206 \f "Symbol"\h [c ; d]) =



Remarque : Si J et K sont deux intervalles de même longueur inclus dans [a ; b] alors
P(X SYMBOL 206 \f "Symbol"\h J) = P(X SYMBOL 206 \f "Symbol"\h K) d’où le nom de loi uniforme.


Propriété : L’espérance mathématique d’une variable aléatoire X qui suit la loi uniforme sur l’intervalle [a ; b] est E(X) =  eq \s\do1(\f(a + b;2))

Preuve : E(X) =


Exemple 4 : X est une variable aléatoire qui suit la loi uniforme sur l’intervalle [0 ; 10].

P(X SYMBOL 163 \f "Symbol"\h 3) =


P(X > 6) =


P(2 SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h 7) =








Exercice 2 : A partir de 7h00, un bus passe toutes les quinze minutes à l’arrêt A.
Un usager se présente en A entre 7h et 7h 30. On fait l’hypothèse que la durée X (en min) entre 7h00 et l’heure de son arrivée en A est une variable aléatoire uniformément répartie sur l’intervalle [0 ; 30].
Calculer la probabilité de l’événement E « cet usager attend moins de 5 minutes ».










Exercice 3 : Dans un parc national, un guide propose quotidiennement l’observation d’un troupeau de chamois venant s’abreuver dans un lac, au coucher du soleil.
Le temps d’attente T du groupe, en heure, avant l’arrivée des animaux suit une loi uniforme sur [0 ; 1].

Calculer la probabilité que le groupe attende moins de 10 minutes.




Calculer la probabilité que le groupe attende plus d’une demie heure.



Calculer P(0,2 < T SYMBOL 163 \f "Symbol"\h 0,4).



Calculer P(T = 0,6).



Calculer P(T < 0,3)




Exercice 4 : On choisit un nombre au hasard dans l’intervalle [5 ; 30].
Sachant que ce nombre est inférieur à 18, quelle est la probabilité qu’il soit
supérieur à 12 ?







III Loi exponentielle


Définition : Une variable aléatoire X suit une loi exponentielle de paramètre (, avec ( > 0, lorsque sa densité de probabilité f est la fonction définie sur [0 ; +SYMBOL 165 \f "Symbol"\h[ par f (t) = (e-(t.

Remarque : f est une densité de probabilité car 







Propriété : Pour tous réels a et b tels que 0 SYMBOL 163 \f "Symbol"\h a SYMBOL 163 \f "Symbol"\h b on a :

P(X SYMBOL 163 \f "Symbol"\h a) = 1 - e-(a
«P(X > a) = e-(a.
P(a SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h b) = e-(a- e-(b.

Preuve :
P(X SYMBOL 163 \f "Symbol"\h a) =  EMBED Equation.DSMT4 =  EMBED Equation.DSMT4 = -e-(a + 1 = 1 - e-(a
« X > a » est l’événement contraire de « X SYMBOL 163 \f "Symbol"\h a » donc P(X > a) = 1 – (1 - e-(a ) = e-(a.
P(a SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h b) =  EMBED Equation.DSMT4  = EMBED Equation.DSMT4 = -e-(b + e-(a = e-(a- e-(b.


Remarque : La durée de vie d’un appareil est dite sans vieillissement (on parle aussi de processus sans mémoire), lorsque la probabilité qu’il fonctionne encore pendant une durée h (au moins) ne dépend que de h et pas de la durée t de son fonctionnement passé.
C’est le cas de nombreux composants électroniques (qu’il ait 2 jours ou 5ans, un composant électronique a la même probabilité de fonctionner encore 127 heures) ou de la désintégration d’un noyau radioactif (qu’il ait 20 ou 3 000 ans, un noyau radioactif non désintégré à la même probabilité de se désintégrer dans les deux prochaines années).

Propriété :
Une variable aléatoire X suivant une loi exponentielle est sans vieillissement.

Preuve : PX SYMBOL 179 \f "Symbol"\h t (X SYMBOL 179 \f "Symbol"\h t + h) =  eq \s\do1(\f(P(X SYMBOL 179 \f "Symbol"\h t et X SYMBOL 179 \f "Symbol"\h t + h); P(X SYMBOL 179 \f "Symbol"\h t))) =  eq \s\do1(\f(P(X SYMBOL 179 \f "Symbol"\h t + h); P(X SYMBOL 179 \f "Symbol"\h t))) =  eq \s\do1(\f(e-((t + h); e-(t )) = e-(h = P(X SYMBOL 179 \f "Symbol"\h h).

Remarque : On admet que réciproquement les variables aléatoires continues sans vieillissement suivent une loi exponentielle.

Ainsi,  eq \x(la loi exponentielle caractérise les processus sans mémoire).


Propriété : L’espérance mathématique d’une variable aléatoire X qui suit une loi exponentielle de paramètre ( est E(X) =  eq \s\do1(\f(1;()).

Démonstration exigible :































Exercice 5 : On modélise le temps d’attente, en minutes, entre deux clients à un guichet par une variable aléatoire X qui suit une loi exponentielle de paramètre ( > 0.
Une étude statistique a permis d’établir que le temps moyen d’attente est de 5 minutes.

Déterminer (.


Quelle est la probabilité d’attendre plus de 15 minutes ?



Quelle est la probabilité d’attendre entre 10 et 20 minutes ?




Exercice 6 : La durée de vie, exprimée en années, d’un composant électronique est une variable aléatoire notée T qui suit une loi exponentielle de paramètre ( > 0.
Une étude statistique a permis d’estimer que 67,5 % de ces composants ont une durée de vie supérieure à 5 ans.

Déterminer une valeur arrondie à 10-3 près de ( .








Quelle est la probabilité arrondie à 10-3 près qu’un composant de ce type dure :
moins de 8 ans ?






plus de 10 ans.






entre 3 et 8 ans ?





au moins 8 ans sachant qu’il fonctionne encore au bout de 3 ans ?








Déterminer la durée de vie moyenne d’un tel composant.






Rappels sur la loi binomiale

Une épreuve de Bernoulli est une expérience aléatoire à deux issues : succès S ou échec EMBED Equation.DSMT4 .

On répète n fois, de manière identique et indépendante, une épreuve de Bernoulli dont la probabilité du succès est p.
Soit X la variable aléatoire qui compte le nombre de succès.
La loi de probabilité de la variable aléatoire X est appelée loi binomiale de paramètres n et p. On la note B(n ; p).

On représente, à l’aide d’un arbre pondéré, la répartition des n épreuves de Bernoulli identiques et indépendantes.


Arbre pondéré lorsque n = 3 :












 




Pour tout nombre entier k, 0 SYMBOL 163 \f "Symbol"\h k SYMBOL 163 \f "Symbol"\h n, le nombre de chemins réalisant k succès sur les n épreuves est noté  EMBED Equation.DSMT4  (on lit « k parmi n »). Ce nombre est appelé coefficient binomial.

Ainsi, à partir de l’arbre, on obtient par exemple  EMBED Equation.DSMT4  et  EMBED Equation.DSMT4 .


Pour tout nombre entier k, 0 SYMBOL 163 \f "Symbol"\h k SYMBOL 163 \f "Symbol"\h n,  eq \x(P(X = k) =  EMBED Equation.DSMT4 pk (1 – p)n – k)

Espérance : E(X) = np

Variance : V(X) = np(1 – p)

Ecart-type : ((X) =  eq \r(np(1 – p)).

Exercice 7 (corrigé) :
En France, il y a 12 % de gauchers.

Quelle est la probabilité qu’il y ait exactement 2 gauchers dans une classe de 35 élèves ?

Combien d’élèves gauchers peut-on s’attendre à trouver en moyenne dans une classe de 35 élèves ?

Calculer la variance et l’écart-type.

Solution :

On modélise la situation à l’aide d’une loi binomiale
L’épreuve de Bernoulli consiste à demander à un élève s’il est gaucher (succès) on non (échec).
On répète 35 fois, de manière indépendante, la même épreuve de Bernoulli.
La probabilité du succès est p = 0,12.
On note G la variable aléatoire comptant le nombre de gauchers dans une classe de 35 élèves.
G suit la loi binomiale de paramètres n = 35 et p = 0,12.

P(G = 2) =  EMBED Equation.DSMT4 0,12² SYMBOL 180 \f "Symbol"\h 0,8833 SYMBOL 187 \f "Symbol"\h 0,126 (On peut effectuer directement le calcul à la machine)

E(G) = 35 SYMBOL 180 \f "Symbol"\h 0,12 = 4,2 =  eq \s\do1(\f(42;10)).
Cela signifie que dans 10 classes de 35 élèves, il y a en moyenne 42 gauchers.

V(G) = 35 SYMBOL 180 \f "Symbol"\h 0,12 SYMBOL 180 \f "Symbol"\h 0,88 = 3,696 et ((G) =  eq \r(35 SYMBOL 180 \f "Symbol"\h 0,12 SYMBOL 180 \f "Symbol"\h 0,88) =  eq \r(3,696) SYMBOL 187 \f "Symbol"\h 1,92


Exercice 8 :
Un constructeur de composants électroniques produit des résistances. Une étude statistique permet d’estimer que la probabilité qu’une résistance soit défectueuse est égale à 0,005.
On prélève un lot de 1 000 résistances dans la production et on suppose que le stock est suffisamment important pour assimiler le prélèvement à un tirage avec remise.
On considère la variable aléatoire X qui, à tout prélèvement de 1 000 résistances, associe le nombre de résistances défectueuses.

Justifier que la variable aléatoire X suit une loi binomiale dont on précisera les paramètres.

Calculer les probabilités des évènements suivants arrondies au millième :

A : « le lot contient exactement 3 résistances défectueuses »

B : «  le lot ne contient pas de résistance défectueuse »

Calculer l’espérance mathématique de la variable aléatoire X et interpréter ce résultat dans le cadre de l’énoncé.

Calculer la variance et l’écart-type de X.

Activité : approche statistique de la loi normale

Masse (en mg)[116 ; 118[[118 ; 120[[120 ; 122[[122 ; 124[[124 ; 126[Effectif 5 14 26 43 51FréquenceAu cours d’une répartition de pénicilline en flacons sur une machine automatique, on prélève, à intervalles plus ou moins réguliers, un flacon dont on pèse le contenu au dixième de milligramme. On prélève ainsi un échantillon de 250 flacons dont les masses des contenus en mg se répartissent selon les 10 classes suivantes :




Masse (en mg)[126 ; 128[[128 ; 130[[130 ; 132[[132 ; 134[[134 ; 136[Effectif 47 29 18 14 3Fréquence



Compléter le tableau ci-dessus.

Tracer l’histogramme des fréquences.
Quelle est la probabilité que la masse d’un flacon soit comprise entre 122 et 128 mg ?
Hachurer l’aire correspondante sur le graphique.

Tracer le polygone des fréquences.

Au fur et à mesure que la taille de l'échantillon augmente et que la taille des classes diminue, l'histogramme devient de plus en plus régulier et la courbe des fréquences se rapproche d'une courbe en cloche appelée courbe de Gauss.

Représenter cette courbe en cloche donnée par le tableau de valeurs suivant :
x116117118119120121122123124125126f (x)0,0100,0180,0310,0490,0730,1030,1340,1640,1880,2020,203
x127128129130131132133134135136f (x)0,1910,1680,1390,1080,0780,0530,0340,020,0110,006Illustration : HYPERLINK "http://www.astro.ulg.ac.be/cours/magain/stat/stat51.html"http://www.astro.ulg.ac.be/cours/magain/stat/stat51.html
LA LOI NORMALE
En théorie des probabilités et en statistique, la loi normale est l'une des lois de probabilité les plus adaptées pour modéliser des phénomènes naturels issus de plusieurs évènements aléatoires (diamètre d’une tige produite par une machine, masse d’un paquet de sucre, taille d’un enfant de 8 ans). Parmi les lois de probabilité, la loi normale prend une place particulière grâce au théorème central limite. En effet, elle correspond au comportement de toute suite d'expériences aléatoires identiques et indépendantes, lorsque le nombre d'expériences est très élevé. Grâce à cette propriété, la loi normale permet d'approcher d'autres lois et ainsi de modéliser de nombreuses études scientifiques comme des mesures d'erreurs ou des tests statistiques. Elle est reconnaissable grâce à sa courbe en cloche.
I La loi normale

La loi normale centrée réduite

définition : Une variable aléatoire X suit la loi normale centrée réduite, notée N(0 ; 1) lorsque
sa densité de probabilité f est la fonction définie sur EQ \o\al(I;\d\fo2()R) par : f (x) =  eq \s\do1(\f(1; eq \r(2()))  EMBED Equation.DSMT4 .
Courbe de Gauss ou courbe en cloche


Remarques :

f est continue et strictement positive sur EQ \o\al(I;\d\fo2()R).

L’aire totale sous la courbe est égale à 1.

Pour tous réels a et b, P(a SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h b) =  EMBED Equation.DSMT4 
La probabilité que X soit compris entre a et b est l’aire
du domaine sous la courbe en cloche entre les droites
d’équations x = a et x = b.


f est paire donc sa courbe représentative est symétrique
par rapport à l’axe des ordonnées.
En particulier P (X SYMBOL 206 \f "Symbol"\h [0 ; +SYMBOL 165 \f "Symbol"\h[ ) =  eq \s\do1(\f(1;2)).

Pour tout réel u, P(X SYMBOL 163 \f "Symbol"\h -u) = 1 - P(X > -u) or pour des raisons de symétrie P(X > -u) = P(X SYMBOL 163 \f "Symbol"\h u) donc P(X SYMBOL 163 \f "Symbol"\h -u) = 1 – P(X SYMBOL 163 \f "Symbol"\h u).

Propriété : Soit X est une variable aléatoire qui suit la loi N(0 ; 1), alors E(X) = 0 et ((X) = 1.

Remarque : On ne sait pas calculer une primitive de la fonction densité de probabilité dans le cas des lois normales, pour effectuer les calculs, on utilise soit la table de la loi normale centrée réduite, soit la calculatrice.

Exemple 5 : Soit X est une variable aléatoire qui suit la loi N(0 ; 1).
En utilisant une calculatrice, calculer à 10-4 près :









P(-1 SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h 2) = P(X SYMBOL 163 \f "Symbol"\h 1,4) = P(X> 0,5) =


Propriété : Détermination d’un intervalle centré en 0 de probabilité donnée
Si X est une variable aléatoire qui suit la loi N(0 ; 1), alors pour tout nombre réel ( SYMBOL 206 \f "Symbol"\h ]0 ; 1[, il existe un unique réel u( > 0 tel que P(-u( SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h u() = 1 - (.

Démonstration exigible :
P(-u SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h u) =  EMBED Equation.DSMT4 = 2  EMBED Equation.DSMT4  = 2F(u) où F est la primitive
de f sur EQ \o\al(I;\d\fo2()R) qui s’annule en 0 (intégrale de la borne supérieure).

F est continue et strictement croissante (car sa dérivée est f et f > 0).
 EMBED Equation.DSMT4  eq \s\do1(\f(1;2)) car cela correspond à l’aire sous la courbe sur [0 ; +SYMBOL 165 \f "Symbol"\h[.
La fonction 2F est donc continue, strictement croissante, 2F(0) = 0 et
 EMBED Equation.DSMT4 1.
De plus, pour tout nombre réel ( SYMBOL 206 \f "Symbol"\h ]0 ; 1[, 1 - ( SYMBOL 206 \f "Symbol"\h ]0 ; 1[ donc d’après le théorème de la bijection, il existe un unique u( > 0 tel que 2F(u() = 1 - (, c’est-à-dire tel que P(-u( SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h u() = 1 - (.


En particulier :






u0,05 SYMBOL 187 \f "Symbol"\h 1,96 u0,01 SYMBOL 187 \f "Symbol"\h 2,58

P(X SYMBOL 206 \f "Symbol"\h [-1,96 ; 1,96] ) = 0,95 P(X SYMBOL 206 \f "Symbol"\h [-2,58 ; 2,58] ) = 0,99

Exemple 6 : Déterminer u0,10 tel que P(-u0,10 SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h u0,10) = 0,90.











Exercice 9 : De même, retrouver que u0,05 SYMBOL 187 \f "Symbol"\h 1,96 et que u0,01 SYMBOL 187 \f "Symbol"\h 2,58
























2. La loi normale N(( ; (²)

Définition : ( désigne un réel et ( un réel strictement positif.
La variable X suit la loi normale de paramètres ( et (², notée N(( ; (²),
lorsque la variable aléatoire centrée réduite  eq \s\do1(\f(X - (;()) suit la loi N(0 ; 1).

Propriété : Soit X est une variable aléatoire qui suit la loi N(( ; (²), alors son espérance est ( et son écart-type est (.

Remarque : Une loi normale N(( ; (²) est une loi à densité, il existe une fonction g définie sur EQ \o\al(I;\d\fo2()R) telle que pour tous réels a et b, P(a SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h b) =  EMBED Equation.DSMT4 .
L’expression de g n’est pas au programme.
L’allure des courbes de densité est entièrement déterminée par les valeurs de ( et ( :












L’espérance ( est un paramètre de position, L’écart-type ( est un paramètre de dispersion.
il localise la zone où les réalisations de X ont Plus ( est faible, moins les réalisations de X
le plus de chance d’apparaître. sont dispersées autour de (.























Exercice 10 :
Si Y suit la loi normale N (4 ; 2), déterminer P(Y SYMBOL 163 \f "Symbol"\h 6).




Si Y suit la loi normale N (5 ; 1,2), déterminer P(2,5 SYMBOL 163 \f "Symbol"\h Y SYMBOL 163 \f "Symbol"\h 6,5).







Propriété : Si X suit la loi N(( ; (²), alors sa dispersion autour de ( dépend uniquement de (.


En particulier :



P(X SYMBOL 206 \f "Symbol"\h [( - ( ; ( + (] ) SYMBOL 187 \f "Symbol"\h 0,638







P(X SYMBOL 206 \f "Symbol"\h [( - 2( ; ( + 2(] ) SYMBOL 187 \f "Symbol"\h 0,954







P(X SYMBOL 206 \f "Symbol"\h [( - 3( ; ( + 3(] ) SYMBOL 187 \f "Symbol"\h 0,997.






II Approximation d’une loi binomiale par une loi normale

La loi binomiale est très utilisée en modélisation, mais les calculs sont très compliqués.
Le théorème suivant, qui permet d’approximer, sous certaines conditions, la loi binomiale par la loi normale centrée réduite, a permis de faciliter les calculs.

Le Théorème de Moivre-Laplace (admis)

Pour tout entier naturel n, Xn est une variable aléatoire qui suit la loi binomiale B(n ; p).
On pose Zn =  eq \s\do1(\f(Xn – np; eq \r(np(1 – p)) )), variable centrée réduite associée à Xn.
Alors, pour tous réels a et b, tels que a < b :  EMBED Equation.DSMT4 P(a SYMBOL 163 \f "Symbol"\h Zn SYMBOL 163 \f "Symbol"\h b) =  EMBED Equation.DSMT4 


Autrement dit, pour les « grandes valeurs » de n, la loi binomiale est très proche de la loi normale de même espérance np et de même écart-type  eq \r(np(1 – p)).

En pratique, on fera cette approximation dès que les trois conditions suivantes sont remplies :
 eq \x(n SYMBOL 179 \f "Symbol"\h 30, np SYMBOL 179 \f "Symbol"\h 5 et n(1 – p) SYMBOL 179 \f "Symbol"\h 5.)

Intervalle de fluctuation asymptotique

Lorsque l’on, prélève un échantillon dans une population, la fréquence du caractère observé dépend de l’échantillon. Ce phénomène s’appelle la fluctuation d’échantillonnage.

Prélever un échantillon de taille n revient à répéter n fois, de façon indépendante, la même épreuve de Bernoulli (en réalité le tirage est sans remise mais comme la taille de la population est très importante, le tirage peut être considéré avec remise car le fait de prélever quelques individus ne modifie pas de façon importante la probabilité p du succès).
La variable aléatoire qui compte le nombre de succès dans l’échantillon suit la loi binomiale B(n ; p).


Théorème :
Si la variable aléatoire Xn suit la loi binomiale B(n ; p) alors la fréquence du succès Fn =  eq \s\do1(\f(Xn;n)) vérifie  EMBED Equation.DSMT4 P  eq \b(Fn SYMBOL 206 \f "Symbol"\h  eq \b\bc\[(p – u(  eq \s\do1(\f( eq \r(p(1 – p)); eq \r(n))) , p + u(  eq \s\do1(\f( eq \r(p(1 – p)); eq \r(n)))) ) = 1 - (

où u( vérifie P(-u( SYMBOL 163 \f "Symbol"\h X SYMBOL 163 \f "Symbol"\h u() = 1 - ( pour X suivant la loi N(0 ; 1).


Démonstration exigible :
Xn suit la loi binomiale B(n ; p), donc d’après le théorème de Moivre-Laplace :

 EMBED Equation.DSMT4 P  eq \b( -u( SYMBOL 163 \f "Symbol"\h  eq \s\do1(\f(Xn – np; eq \r(np(1 – p)) )) SYMBOL 163 \f "Symbol"\h u( ) = 1 - ( (par définition de u( pour la loi N(0 ; 1)).

Or –u( SYMBOL 163 \f "Symbol"\h  eq \s\do1(\f(Xn – np; eq \r(np(1 – p)) )) SYMBOL 163 \f "Symbol"\h u( équivaut à -u(  eq \r(np(1 – p)) SYMBOL 163 \f "Symbol"\h Xn – np SYMBOL 163 \f "Symbol"\h u(  eq \r(np(1 – p))

soit np - u(  eq \r(np(1 – p)) SYMBOL 163 \f "Symbol"\h Xn SYMBOL 163 \f "Symbol"\h np + u(  eq \r(np(1 – p))

puis p - u( eq \s\do1(\f( eq \r(p(1 – p)); eq \r(n))) SYMBOL 163 \f "Symbol"\h  eq \s\do1(\f(Xn;n)) SYMBOL 163 \f "Symbol"\h p + u(  eq \s\do1(\f( eq \r(p(1 – p)); eq \r(n)))
soit Fn SYMBOL 206 \f "Symbol"\h  eq \b\bc\[(p – u(  eq \s\do1(\f( eq \r(p(1 – p)); eq \r(n))) , p + u(  eq \s\do1(\f( eq \r(p(1 – p)); eq \r(n)))) .

ainsi  EMBED Equation.DSMT4 P  eq \b(Fn SYMBOL 206 \f "Symbol"\h  eq \b\bc\[(p – u(  eq \s\do1(\f( eq \r(p(1 – p)); eq \r(n))) , p + u(  eq \s\do1(\f( eq \r(p(1 – p)); eq \r(n)))) ) = 1 - (

En pratique : Pour ( = 0,05, on a u0,05 SYMBOL 187 \f "Symbol"\h 1,96. Lorsque n SYMBOL 179 \f "Symbol"\h 30, np SYMBOL 179 \f "Symbol"\h 5 et n(1 – p) SYMBOL 179 \f "Symbol"\h 5, on considère que la fréquence Fn de succès fluctue avec une probabilité de 0,95 dans l’intervalle

 eq \b\bc\[(p – 1,96  eq \s\do1(\f( eq \r(p(1 – p)); eq \r(n))) , p + 1,96  eq \s\do1(\f( eq \r(p(1 – p)); eq \r(n))) ).

Cet intervalle est appelé intervalle de fluctuation asymptotique de Fn au seuil de 95 %.

Cela signifie que dans 95 % des cas, la fréquence Fn de l’échantillon appartient à cet intervalle.


Remarque : En étudiant les variation sur [0 ; 1] de la fonction g définie par g(x) = x(1 – x),

on montre qu’elle est majorée par  eq \s\do1(\f(1;4)), ainsi pour tout p SYMBOL 206 \f "Symbol"\h [0 ; 1],  eq \r(p(1 – p)) SYMBOL 163 \f "Symbol"\h  eq \s\do1(\f(1;2)) et 1,96  eq \s\do1(\f( eq \r(p(1 – p)); eq \r(n))) SYMBOL 163 \f "Symbol"\h  eq \s\do1(\f(1; eq \r(n)))

ainsi l’intervalle de fluctuation ci-dessus est inclus dans l’intervalle de fluctuation utilisé en Seconde :

 eq \b\bc\[(p –  eq \s\do1(\f(1; eq \r(n))) , p +  eq \s\do1(\f(1; eq \r(n)))).


Application à la prise de décision :
La proportion du caractère étudié dans la population est supposée être égale à p.
(C’est notre hypothèse).

La prise de décision consiste, à partir d’un échantillon de taille n, à rejeter ou non cette hypothèse.

On vérifie que n SYMBOL 179 \f "Symbol"\h 30, np SYMBOL 179 \f "Symbol"\h 5 et n(1 – p) SYMBOL 179 \f "Symbol"\h 5, puis on détermine l’intervalle de fluctuation asymptotique au seuil de 95 %.

Si la fréquence f du caractère étudié dans notre échantillon appartient à cet intervalle, on ne peut pas rejeter l’hypothèse faite sur p.

Sinon, on rejette l’hypothèse faite sur p avec un risque de 5 % de se tromper.


Remarques :
On peut, avec cette méthode, accepter à tort une hypothèse fausse. Ce risque d’erreur n’est pas déterminé.

On peut aussi rejeter à tort une hypothèse alors qu’elle est correcte. Ce risque est de 5%.
C’est une probabilité conditionnelle : sachant que l’hypothèse est correcte, elle sera rejetée dans 5 % des cas.


Illustration :

Notons H l’événement : « l’hypothèse est vraie »

et A l’événement : « on accepte l’hypothèse ».




Les autres probabilités sont inconnues car l’intervalle de fluctuation
a été établi dans le cas où la proportion p dans la population est connue
donc lorsque H est vraie !



Exemple 7: On lancé 100 fois une pièce de monnaie et obtenu 60 fois Pile.
La pièce est-elle équilibrée ?

Comprendre l’énoncé : la fréquence de Pile observée est 0,6.
Cet écart avec la proportion théorique p = 0,5 d’une pièce équilibrée est-il dû aux fluctuations d’échantillonnage ou est-ce parce que la pièce n’est pas équilibrée ?

On fait l’hypothèse que la pièce est équilibrée donc que p = 0,5.

On déterminer l’intervalle de fluctuation au seuil 95 %
 eq \b\rc\}(\a\ac\hs4\co1(n = 100 donc n SYMBOL 179 \f "Symbol"\h 30 ; np = 100 SYMBOL 180 \f "Symbol"\h 0,5 = 50 donc np SYMBOL 179 \f "Symbol"\h 5 ; n(1 – p) = 100 SYMBOL 180 \f "Symbol"\h 0,5 = 50 donc n(1 – p) SYMBOL 179 \f "Symbol"\h 5.)) Les trois conditions sont remplies.

On écrit l’intervalle de fluctuation au seuil 95 % :

J =  eq \b\bc\[(0,5 - 1,96 SYMBOL 180 \f "Symbol"\h  eq \s\do1(\f( eq \r(0,5 SYMBOL 180 \f "Symbol"\h 0, 5) ; eq \r(100))) , 0,5 + 1,96 SYMBOL 180 \f "Symbol"\h  eq \s\do1(\f( eq \r(0,5 SYMBOL 180 \f "Symbol"\h 0, 5) ; eq \r(100))))

Avec des valeurs approchées par défaut à gauche et par excès à droite, on obtient : J = [0,19 ; 0,81].

f SYMBOL 206 \f "Symbol"\h J donc on ne peut pas rejeter l’hypothèse : « la pièce est équilibrée ».
On considère donc que la pièce est équilibrée.

Elle ne l’est peut-être pas, on prend le risque d’accepter à tort une hypothèse fausse. Ce risque n’est pas mesuré.


Exemple 8 : Un laboratoire pharmaceutique annonce que son nouveau médicament est efficace dans 90 % des cas.
L’agence française de sécurité sanitaire effectue une enquête sur un échantillon de 200 personnes traitées par ce médicament. 160 sont guéries.
Que conclure de cette enquête ?

On fait l’hypothèse que …………………………..

On déterminer l’intervalle de fluctuation au seuil 95 %






La fréquence de l’échantillon est …………………

f ……..… donc on………..………rejeter l’hypothèse.

On considère donc que le laboratoire pharmaceutique ……..


III Estimation
On se place dans le cas où la proportion p d’un certain caractère dans une population est inconnue. Pour des raisons de coût ou de faisabilité, on ne peut interroger toute la population.
On cherche alors à estimer p à partir de la fréquence f des individus ayant ce caractère dans un échantillon de taille n, c’est le principe des sondages.
La fréquence f varie d’un échantillon à l’autre du fait de la fluctuation d’échantillonnage.
L’objectif n’est pas de donner la valeur de p mais un intervalle, appelé intervalle de confiance, contenant p dans plus de 95% des cas.

On sait que si les trois conditions usuelles sont remplies, alors f SYMBOL 206 \f "Symbol"\h  eq \b\bc\[(p –  eq \s\do1(\f(1; eq \r(n))) , p +  eq \s\do1(\f(1; eq \r(n)))) dans plus de 95 % des cas.
Cet intervalle est l’intervalle de fluctuation vu en Seconde qui contient l’intervalle de fluctuation vu en Terminale.

Donc P  eq \b(p –  eq \s\do1(\f(1 ; eq \r(n))) SYMBOL 163 \f "Symbol"\h f SYMBOL 163 \f "Symbol"\h p +  eq \s\do1(\f(1 ; eq \r(n)))) SYMBOL 179 \f "Symbol"\h 0,95.

Or p –  eq \s\do1(\f(1 ; eq \r(n))) SYMBOL 163 \f "Symbol"\h f SYMBOL 163 \f "Symbol"\h p +  eq \s\do1(\f(1 ; eq \r(n))) SYMBOL 219 \f "Symbol"\h  eq \b\lc\{( \s(p –  eq \s\do1(\f(1 ; eq \r(n))) SYMBOL 163 \f "Symbol"\h f ; f SYMBOL 163 \f "Symbol"\h p +  eq \s\do1(\f(1 ; eq \r(n))))) SYMBOL 219 \f "Symbol"\h  eq \b\lc\{( \s(p SYMBOL 163 \f "Symbol"\h f –  eq \s\do1(\f(1; eq \r(n))) ; f –  eq \s\do1(\f(1; eq \r(n))) SYMBOL 163 \f "Symbol"\h p)) SYMBOL 219 \f "Symbol"\h f –  eq \s\do1(\f(1 ; eq \r(n))) SYMBOL 163 \f "Symbol"\h p SYMBOL 163 \f "Symbol"\h f +  eq \s\do1(\f(1 ; eq \r(n)))

Ainsi P  eq \b(p –  eq \s\do1(\f(1 ; eq \r(n))) SYMBOL 163 \f "Symbol"\h f SYMBOL 163 \f "Symbol"\h p +  eq \s\do1(\f(1 ; eq \r(n)))) SYMBOL 179 \f "Symbol"\h 0,95 équivaut à P  eq \b(f –  eq \s\do1(\f(1 ; eq \r(n))) SYMBOL 163 \f "Symbol"\h p SYMBOL 163 \f "Symbol"\h f +  eq \s\do1(\f(1 ; eq \r(n)))) SYMBOL 179 \f "Symbol"\h 0,95.


Propriété : La proportion p inconnue est telle que P  eq \b(f –  eq \s\do1(\f(1 ; eq \r(n))) SYMBOL 163 \f "Symbol"\h p SYMBOL 163 \f "Symbol"\h f +  eq \s\do1(\f(1 ; eq \r(n)))) SYMBOL 179 \f "Symbol"\h 0,95
lorsque les trois conditions d’approximation sont remplies.


Définition : L’intervalle  eq \b\bc\[(f –  eq \s\do1(\f(1; eq \r(n))) , f +  eq \s\do1(\f(1; eq \r(n)))) est appelé intervalle de confiance de la proportion inconnue p avec un niveau de confiance 0,95.


Remarque importante : [ + ]
L’amplitude de l’intervalle de confiance est  eq \s\do1(\f(2; eq \r(n))). f -  eq \s\do1(\f(1; eq \r(n))) f f +  eq \s\do1(\f(1; eq \r(n)))

L’amplitude, donc la précision de l’estimation, ne dépend que de la taille n de l’échantillon.

Si l’on souhaite situer p dans un intervalle de longueur donnée a, alors on doit avoir :
 eq \x( eq \s\do1(\f(2; eq \r(n))) SYMBOL 163 \f "Symbol"\h a soit  eq \s\do1(\f(4;n)) SYMBOL 163 \f "Symbol"\h a² soit n SYMBOL 179 \f "Symbol"\h  eq \s\do1(\f(4;a²)))

On obtient ainsi la taille d’un échantillon permettant d’avoir p avec une précision fixée.
Exemple 9 : Dans un lycée, 850 élèves mangent à la cantine.
Un sondage sur un échantillon de 58 élèves montre que 62 % d’entre eux sont satisfaits des repas.
A partir de ce sondage, déterminer l’intervalle de confiance au niveau de
confiance 0,95 de la proportion d’élèves de ce lycée satisfaits des repas.
On utilisera des valeurs approchées à 10-4 près.

Attention : Dans le cadre de l’estimation, on suppose que les conditions d’application sont respectées. Ne connaissant pas p, il est impossible de les vérifier !











Exercice  11 : M Legrand se présente aux élections. Le dernier sondage effectué auprès d’un échantillon de 400 personnes donne M Legrand gagnant avec 54 % des voix.

Déterminer un intervalle de confiance au niveau de confiance 0,95 de la proportion de personnes envisageant de voter pour M Legrand.




M Legrand est-il assuré de l’emporter au vue de ce sondage ?






Quel est l’amplitude de cet intervalle de confiance ?




Quelle doit être la taille de l’échantillon pour obtenir un intervalle de confiance de longueur au plus 0,05 ?










Exercice 12 : On effectue un sondage auprès des 15-20 ans pour connaître leur préférence en matière de restauration rapide. La question est formulée de la façon suivante :
« Préférez-vous les kébabs ou les pizzas ? ».

On interroge un premier échantillon de 100 personnes. 48 préfèrent les pizzas.
Déterminer un intervalle de confiance au niveau 95 % pour la proportion d’amateurs de pizzas dans la population des 15-20 ans.






Cet intervalle permet-il de savoir lequel des deux types de restauration rapide à la préférence des 15-20 ans ?





En gardant la même fréquence qu’à la question 1, quelle taille d’échantillon aurait-il été nécessaire pour pouvoir conclure ?





Pour faire le point :  

Lorsque la proportion p d’apparition d’un caractère dans la population est connue
et que l’on veut savoir si le hasard seul peut expliquer l’écart entre la fréquence f
observée de ce caractère dans un échantillon et p, on utilise un intervalle de fluctuation I.

Si f SYMBOL 206 \f "Symbol"\h I, on décide que f et p sont « compatibles » et que l’écart entre f et p est dû aux
fluctuations d’échantillonnages.

Si f  SYMBOL 207\f"Symbol"\hI, on considère, avec un risque de 5% de prendre une mauvaise décision,
que f et p ne sont pas « compatibles » et qu’il est prudent de rechercher une autre
explication que le hasard à cet écart entre f et p.
(Ce type de raisonnement est mené en Seconde).

Lorsque l’on pense connaître la proportion p d’apparition du caractère dans la population ou que l’on souhaite tester une valeur p possible, on est encore dans le cadre de l’échantillonnage. On émet une hypothèse sur la valeur de p que l’on rejette ou non à l’aide d’un intervalle de fluctuation.


Lorsque la proportion p d’apparition du caractère étudié dans la population est totalement inconnue, on va estimer p à l’aide d’un intervalle de confiance obtenu à partir de la fréquence d’apparition du caractère dans un échantillon.
On est dans le cadre de l’estimation, on utilise un intervalle de confiance.








 PAGE \* MERGEFORMAT 18



1 %

1 %

Il y a un chemin
réalisant 3 succès.

S

S

S

S

S

S

S

 EMBED Equation.DSMT4 


 EMBED Equation.DSMT4 

 EMBED Equation.DSMT4 

 EMBED Equation.DSMT4 

 EMBED Equation.DSMT4 

 EMBED Equation.DSMT4 

 EMBED Equation.DSMT4 

p

p

1 - p

Il y a trois chemins
réalisant 2 succès.

1 - p

p

p

1 - p

Il y a trois chemins
réalisant 1 succès.

p

1 - p

p

1 - p

Il y a un chemin
réalisant 0 succès,
soit 3 échecs.

p

1 - p

1 - p

















u0 +SYMBOL 165 \f "Symbol"\h
2F(u) 1

0








Moyenne
(

Ecart-type
(



Réduire ( réduit
la dispersion
autour
de (.

La courbe est symétrique par rapport à la
droite d’équation x = (.
(

( = 0 ; ( =  eq \s\do1(\f(1;2))

( = 8 ; ( =  eq \s\do1(\f(1;2))

( = 4 ; ( = 1

( = 0 ; ( = 1 EMBED Equation.DSMT4  EMBED Equation.DSMT4 

( = 6 ; ( = 2

( = 0 ; ( = 2



63,8 %

(

( + (

( - (



95,4 %

(

( - 2(

( + 2(



99,7 %

(

( - 3(

( + 3(

 EMBED Equation.DSMT4 

 EMBED Equation.DSMT4 

 EMBED Equation.DSMT4 

 EMBED Equation.DSMT4 

 EMBED Equation.DSMT4 

 EMBED Equation.DSMT4 

 EMBED Equation.DSMT4 0,95

 EMBED Equation.DSMT4 0,05