corrigé d'exercices (chapitres 5 à 9) - Examen corrige
BIOSTATISTIQUE, 2e édition, volume 1. Bruno Scherrer. CORRIGÉ DES
EXERCICES DES CHAPITRES 5 à 9. Corrigé de l'exercice 5.1. Si l'
échantillonnage ...
part of the document
BIOSTATISTIQUE, 2e édition, volume 1
Bruno Scherrer
CORRIGÉ DES EXERCICES DES CHAPITRES 5 à 9
Corrigé de lexercice 5.1
Si léchantillonnage seffectue sans remise, le nombre déchantillons différents est donné par la formule 5.7 : n ! / [(n ( p) ! p !] avec n = 20 et p = 10 ( (11 ( 12 ( 13 ( 14 ( 15 ( 16 ( 17 ( 18 ( 19 ( 20) / (1 ( 2 ( 3 ( 4 ( 5 ( 6 ( 7 ( 8 ( 9 (10) = 184 756.
Si léchantillonnage seffectue avec remise, le nombre déchantillons différents est donné par la formule 5.8 : (n + p 1) ! / [(n ( 1) ! p !] avec n = 20 et p = 10 ( (20 ( 21 ( 22 ( 23 ( 24 ( 25 ( 26 ( 27 ( 28 ( 29) / (1 ( 2 ( 3 ( 4 ( 5 ( 6 ( 7 ( 8 ( 9 (10) = 20 000 010.
Corrigé de lexercice 5.3
Il sagit destimer des probabilités (empiriques) à partir déchantillon de grande taille. La probabilité estimée quune personne âgée ait un effet secondaire grave est égale à 35 / 680 = 0,05147 (5,15%). Cette probabilité de survenue dévènements intercurrents graves est souvent exprimée en pourcentage est sappelle aussi taux dincidence. Le taux dincidence pour les personnes non âgée sélève à : 100(75 35) / (12500 680) = 0,338%.
Corrigé de lexercice 5.5
Quelle est la probabilité davoir un as ou une carte de niveau inférieur ? Comme toutes les cartes ont un niveau égal ou inférieur à un as la probabilité a priori est égale à 52 / 52 = 1. Il sagit dun évènement certain.
Quelle est la probabilité dobtenir un trèfle ou un roi ? 13 cartes sont un trèfle aux quelles il faut ajouter les 3 rois qui ne sont pas un trèfle. La probabilité a priori est égale à 16 / 52 = 0,3077.
Quelle est la probabilité que ce soit une figure de couleur rouge ? Il existe 3 figures et deux séries de couleur rouge, soit 6 cartes favorables sur 52 ( p = 6 / 52 = 0,1154.
Quelle est la probabilité que ce soit un roi de pique si lon sait quil sagit dune carte noire ? Il existe 26 cartes noires et 1 roi de pique. La probabilité conditionnelle (roi de pique (carte noire) sélève à 1 / 26 = 0,0385.
Si lon tire au hasard deux cartes de ce jeu, quelle est la probabilité que ce soit deux rois ? Au premier tirage la probabilité davoir un roi sélève à 4 / 52. Au deuxième tirage et à condition quun roi ait déjà été tiré, il reste 3 rois et 51 cartes. La probabilité conditionnelle sélève à 3 / 51. Il sagit dappliquer le théorème 8 des probabilités composées (formule 5.18) : P(E1E2) = P(E1)(P(E2 (E1) = (4/52) ( (3/51) = 0,00452.
Si lon tire au hasard une carte de ce jeu, puis une seconde sans remettre la première, quelle est la probabilité que la deuxième soit un as si la première était un roi ? Le tirage dun roi modifie la probabilité de tirage dun as au deuxième tirage car il reste 51 cartes au lieu de 52 et 4 as puisquaucun na été retiré au premier tirage. La probabilité conditionnelle est donc égale à 4 / 51 = 0,07843.
Si lon tire au hasard une carte de ce jeu, puis une seconde sans remettre la première, quelle est la probabilité que la deuxième soit un as si la première létait aussi ? Contrairement à la question, il ne sagit dune probabilité composée mais dune probabilité conditionnelle. Au deuxième tirage, il reste dans le 51 cartes et 3 as. La probabilité conditionnelle sélève à : 3 / 51 = 0,0588.
Si lon tire au hasard et successivement trois cartes et si lon replace les cartes dans le jeu après chaque tirage, quelle est la probabilité dobtenir 3 rois ? A chaque tirage la probabilité dobtenir un roi est égale à 4 / 52 = 0,0769. Comme les évènements sont indépendants cest-à-dire que la probabilité de tirage dun roi à un tirage donné ne dépend pas des résultats des tirages précédents le théorème 4 des probabilités composées (formule 5.12) et la probabilité sélève à (4(4(4)/(52(52(52) = 0,000455.
Si lon tire au hasard 4 cartes, quelle est la probabilité dobtenir un carré ? Imaginons que la première carte soit un as. La probabilité que les 4 cartes soient un as est égale à : (4/52)((3/51)((2/50)((1/49) = 0,000003694. Comme il peut sagir dun carré as ou de nimporte quel carré (13 carrés possibles) laxiome des probabilités totales (formule 5.10) sapplique : 0,000003694(13 = 0,000048. On peut également considérer que quelle que soit la première carte tirée, la seconde doit être identique à la première. Il y a 3 chances sur 51 quun tel évènement survienne. La probabilité que la troisième carte soit identique aux 2 premières, sélève à : (3/51)((2/50). Enfin la probabilité que la quatrième soit identique au 3 premières est égale : (3/51)((2/50)((1/49) = 0,000048.
Si lon tire au hasard 4 cartes, quelle est la probabilité davoir un carré das. La réponse à cette question a déjà été donnée à la question précédente, elle est égale à : (4/52)((3/51)((2/50)((1/49) = 0,000003694.
Corrigé de lexercice 6.1
Quelle est la distribution de probabilité du nombre de canards infestés. Lestimation de la probabilité dabattre un canard infesté est égale à 0,947. La distribution de probabilité suit une loi binomiale de paramètres p = 0,947 et n = 7. Les valeurs de probabilité sont obtenues à partir de la formule 6.7. On obtient pour X = 0 :
P(X = 0 (7, 0,947) = EMBED Equation.3 = 1,2(10-9
Les résultats suivants sont : P(X = 1) = 1,47(10-7, P(X = 2) = 7,9(10-6, P(X = 3) = 0,0002, P(X = 4) = 0,0042, P(X = 5) = 0,0449, P(X = 6) = 0,2676 et P(X = 7) = 0,6830.
Quelle est la probabilité de navoir aucun canard infesté ? Il sagit de P(X = 0) à savoir 0,0000000012.
Quelle est la probabilité de navoir que des canards infestés ? Il sagit de P(X = 7) à savoir 0,6830.
Quelle est la probabilité davoir au moins un canard infesté ? Il sagit den avoir 1 ou 2 ou 3
ou 7. Lapplication de la formule 5.10 (probabilité totale) conduit à : P(X ( 1) = P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5) + P(X = 6) + P(X = 7) = 1,47(10-7 + 7,9(10-6 + 0,0002 + 0,0042 + 0,0449 + 0,2676 + 0,6830 = 0,9999.
Quelle est la probabilité davoir plus de deux canards infesté ? Il sagit den avoir 3 ou 4 ou 5
ou 7. Lapplication de la formule 5.10 (probabilité totale) conduit à : P(X > 2) = P(X = 3) + P(X = 4) + P(X = 5) + P(X = 6) + P(X = 7) = 0,0002 + 0,0042 + 0,0449 + 0,2676 + 0,6830 = 0,9999.
Quelle est la probabilité davoir moins de quatre canards infestés ? Il sagit den avoir 0 ou 1 ou 2 ou 3. Lapplication de la formule 5.10 (probabilité totale) conduit à : P(X < 4) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) = 1,2(10-9 + 1,47(10-7 + 7,9(10-6 + 0,0002 = 0,0002.
Quelle est la probabilité davoir au plus trois canard infesté ? Il sagit den avoir 0 ou 1 ou 2 ou 3. Lapplication de la formule 5.10 (probabilité totale) conduit à : P(X ( 3) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) = 1,2(10-9 + 1,47(10-7 + 7,9(10-6 + 0,0002 = 0,0002.
Quelle est la probabilité davoir deux canards ou plus dinfestés ? : P(X ( 2) = P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5) + P(X = 6) + P(X = 7) = 7,9(10-6 + 0,0002 + 0,0042 + 0,0449 + 0,2676 + 0,6830 = 0,9999.
Quelle est la probabilité davoir sept canards ou moins dinfestés ? : Il sagit de lévènement certain car toutes les possibilités sont incluses P(X ( 7) = 1.
Quelle est lespérance mathématique du nombre de canards infestés ? Il sagit de lespérance dune variable binomiale (formule 6.8) : E(X) = n.p = 7(0,947 = 6,629. Même si les réalisations de la variable sont des nombres entiers, lespérance peut comporter des décimales.
Quelle est la variance du nombre de canards infestés ? La variance (attendue et non observée) du nombre de canards infestés est donnée par la formule 6.9 : Var(X) = n.p.q = 7(0,947((1-0,947) = 0,3513.
Quel est le coefficient dasymétrie de la distribution de probabilité ? Le coefficient est donné par la formule 6.10 : (0,053 0,947) / ((7(0,947(0,053) = - 1,5083. Il existe donc une asymétrie à droite de la distribution.
Corrigé de lexercice 6.3
Dans loptique de la vérification de la dose létale 50 (DL 50), quelle est lépreuve aléatoire ? Lépreuve ou expérience aléatoire consiste à tirer un rat au hasard, à lui administrer une dose de 7 mg/kg et à observer sa survie.
Quels sont les évènements possibles et dintérêt pour lestimation de la DL 50 ? Il y a trois évènements possibles à savoir lobservation daucune anomalie, lobservation danomalies non fatales probablement liées au traitement comme des convulsions, et lobservation de la mort de lindividu. Il existe deux évènements dintérêt : la mort ou non de lindividu.
Quelle est la probabilité a priori de survenue de lévènement dintérêt ? Comme la DL50 correspond à la dose conduisant à la mort de 50% des individus, la probabilité a priori est égale à 0,5. Attention, ce nest pas parce quil y a deux évènements possibles (vivant ou mort) que la probabilité sélève à 0,5. Si lon calculait la dose létale 25, la probabilité serait alors de 0,25.
Combien dépreuves aléatoires on été effectués ? 10 car il y a 10 rats.
À quelle loi de probabilité obéit le nombre de rats morts ? Comme les épreuves sont aléatoires (rat tiré au hasard), identiques (tous les rats reçoivent un dose de 7 mg/kg) et indépendantes (le mode opératoire et la survie du ième rat ne dépendent ni des interventions effectuées sur les rats précédents ni de leur survie), il sagit dune loi binomiale de paramètres p = 0,5 et n = 10. Sil existait un phénomène de contagion, ou si la dose administrée dépendait du résultat obtenu sur les rats précédents (essais adaptatifs) la loi ne serait plus binomiale.
Quelle est lespérance mathématique de la distribution ? Elle est donnée par la formule 6.8. E(X) = 10 ( 5 = 5 rats.
Quelle est la variance de la distribution ? Elle est donnée par la formule 6.9. Var(X) = n.p.q = 10 ( 0,5 ( 0,5 = 2,5 rat2.
Quel est le coefficient dasymétrie de la distribution ? En se référant à la formule 6.10 : (1 = (0,5 0,5) / (2,5 = 0. La distribution est parfaitement symétrique.
Quelle est la probabilité dobserver 4 rats morts à cette dose ? Il sagit de P(X = 4 (B (10, 0,5)) = 10 ! ( (4 !)-1 ( (10 4)-1 ( 0,54 ( 0,56 = 0,2051.
Quelle est la probabilité dobserver moins de 5 rats morts ? Il sagit de P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) = 0,0009766 + 0,009766 + 0,043947 + 0,117192 + 0,205086 = 0,377
Le pourcentage de rats présentant des convulsions à la dose létale 50 a été estimé 10%. Si lon sintéresse à la mortalité et à la proportion de rats présentant des convulsions, quelle est la probabilité dobserver dans léchantillon quatre rats morts, deux avec des convulsions et quatre rats sans anomalie ? Notons quun rat peut avoir des convulsions et mourir. Comme ces deux évènements sont compatibles il faut les rendre incompatibles en classant ces individus dans la catégorie des morts. Nous aboutissons ainsi à 3 évènements incompatibles. La loi multinomiale est alors pertinente et la formule 6.14 sapplique : P(X1 = 4, X2 = 2, X3 = 4 (M (10, p1 = 0,5, p2 = 0,1, p3 = 0,4) = 10 ! ( (4 !)-1 ( (2 !)-1 ( (4 !)-1 ( 0,54 ( 0,12 ( 0,44 = 0,05040.
Corrigé de lexercice 7.1
Quelle est la distribution de probabilité du nombre daccidents pour une ville de 1445 salariés ? Si la probabilité quun salarié ait un accident nait pas dépendante de la ville, celle-ci est estimée à p = 168 385 / 12805055 = 0,013149885 ( 0,01315. Si les évènements sont indépendants la distribution de probabilité suit une distribution de Poisson de paramètre ( = n.p = 1445(0,01315 = 19,00. La table III de la loi de Poisson à la page 749 et à la colonne ( = 19 fournit la distribution de probabilité. P(X = 0) = 0,0000,
, P(X = 5) = 0,0001, P(X = 6) = 0,0004, P(X = 7) = 0,0010, P(X = 8) = 0,0024, P(X = 9) = 0,005, P(X = 10) = 0,009, P(X = 11) = 0,016, P(X = 12) = 0,026, P(X = 13) = 0,038,
Ces probabilités ne sont autres que lapplication de la formule 7.1. P(X = 14 (( = 19) = EMBED Equation.3 = 0,05135. La distribution peut être représentée par un diagramme en bâton qui montre que la distribution est assez proche dune distribution en cloche.
EMBED Excel.Chart.8 \s
Quelle est la probabilité quaucun accident ne ce soit produit ? La probabilité correspond à P(X = 0) = EMBED Equation.3 = 6 ( 10(9
Quelle est la variance du nombre daccidents ? Var(X) = n.p.q = 1445 ( 0,01315 ( (1 0,01315) = 18,75
Quelle est la probabilité denregistrer un nombre daccidents inférieur à lespérance mathématique ? Lespérance est très légèrement supérieure à 19 (E(X) = 19,0016). La probabilité est donc égale à P(X ( 19) = P(X = 0) + P(X = 1) + P(X = 2) +
+ P(X = 19) = 0,0000 +
+ 0,091 = 0,558.
Quelle est la probabilité que plus de 1,315% des salariés de cette ville aient un accident ? Un tel pourcentage correspond à 1445(1,315% = 19,00175 salariés ou encore à la moyenne (espérance). La probabilité est donc égale au complément à 1 de la réponse à la question précédente : 1 0,558 = 0,442.
Quelle est la probabilité que moins de 2,08% des salariés de cette ville aient un accident ? 2,08 % ( 1445 = 30,056. Il sagit de trouver P(X ( 30) ( 0,992 (selon les données de la table III qui ne présentent que 3 décimales).
Corrigé de lexercice 7.6
Construire la distribution de fréquence attendue du nombre dHydrellia par unité déchantillonnage sous lhypothèse dune distribution binomiale négative. On suppose que la répartition spatiale est agrégative (ou contagieuse, en grappes, surdispersée,
). Il sagit donc destimer le paramètre k de surdispersion. La première estimation est donnée par la formule 7.22 : EMBED Equation.3 = 4,2072 / (71,822 4,207) = 17,699 / 67,615 = 0,26176. Cette estimation est correcte si EMBED Equation.3 > 6, ce qui est loin dêtre le cas. Lestimateur k2 est approprié si la moyenne est petite, ce qui nest pas vraiment le cas. Lestimateur k3 ne pourra pas être utilisé car nous navons pas la distribution de fréquences pour yi > 9 ( Ayi inconnue pour yi = 10 et les classes suivantes.
Essai EMBED Equation.3 EMBED Equation.3 (1 + EMBED Equation.3 )log(n/n0) Commentaires10,261760,322560,60879Trop petit210,71660,60879augmentation trop grande30,80,63720,60879diminution insuffisante40,70,59200,60879Trop petit mais proche50,750,61510,60879à peine trop élevée60,740,61060,60879encore trop élevée70,7350,60830,60879à peine trop bas80,7360,608750,60879OK
EMBED Equation.3 = 0,736
La formule 7.12 peut maintenant être appliquée pour obtenir la distribution de fréquences attendues du nombre dindividus par unité déchantillonnage
P(Y = y (µ = 4,207, k = 0,736) = EMBED Equation.3
Le problème avec une valeur de EMBED Equation.3 petite et par conséquent une valeur de EMBED Equation.3 ( 1 négative réside dans limpossibilité de calculer la factorielle dun nombre négatif. Soit lestimation sous-estime la valeur du paramètre k, soit la distribution séloigne trop de la loi binomiale négative pour utiliser la formule 7.12. Il faudrait la distribution de fréquence complète pour estimer k avec lestimateur EMBED Equation.3 et savoir sil y a effectivement une sous-estimation. Notons quun ajustement à la loi de Poisson est possible, mais les résultats savèrent probablement médiocres (manque dajustement = écart important entre la distribution observée et la distribution attendue) car la variance est très supérieure à la moyenne (71,82 >> 4,207) et lon sattend à un variance proche de la moyenne. Ce type de problème nest pas rare dans la pratique et lon ne sait pas vraiment à quelle loi se rapporte la distribution. Dans de telles circonstances lemploi de statistiques robustes ou de statistiques non paramétriques (distribution free = sans condition sur la forme de la distribution) savère une sage précaution et ce au moins au titre dune analyse de sensibilité.
Corrigé de lexercice 7.9
Quelle est la probabilité de nobserver aucun cas lors des essais pré-AMM ? Les cas de cytolyse sont des évènements indépendants à faible probabilité de survenue ( EMBED Equation.3 = 22 / 1 200 000 = 0,0000183). On peut donc admettre que la probabilité de survenue de X = x évènements est donnée par la loi de Poisson. Lespérance du nombre de cas pour 6750 patients est de 6750 ( 0,0000183 = 0,1237. La probabilité de nen observer aucun lors des essais thérapeutiques sélève à : P(X = 0 (P (0,1237)) = e(0,1237 ( 0,12370 / 0 ! = 0,8836.
Quelle est la probabilité de nobserver quun seul cas ? Il sagit de trouver : P(X = 1 (P (0,1237)) = e(0,1237 ( 0,12371 / 1 ! = 0,1093.
Quelle est la probabilité den observer au moins un ? Il sagit du complément à 1 de P(X = 0 (P (0,1237)) = 0,8836. la probabilité est donc égale à 1 0,8836 = 0,1164
Corrigé de lexercice 8.1
Quelle est la distribution attendue sous lhypothèse de normalité des longueurs totales des femelles juvéniles ?
Cette distribution peut être calculée avec Excel(
Colonne A : indice de classe
Colonne B : Effectif observé de classe
Colonne C : Indice de classe centré réduit = (xi 728,1)/21,8. Utiliser la fonction produit en C2 : Produit(A1-728,1 ;1/21,8) et étendre la fonction à toute la colonne C.
Colonne D : Densité de probabilité (table V): se positionner en D2, cliquer sur « autre fonction », puis sur « statistique », puis sur « loi normale » avec X = C2, Espérance = 0, écart type = 1 et cumulative = faux.
Colonne E : P(xi,inf ( X < xi,sup) (N (728,1, 21,8). Pour ce faire multiplier la densité de probabilité par lintervalle de classe (h = 20) et diviser par lécart type (sx = 21,8) : Fonction : PRODUIT(20 ;D2 ;1/21,8).
Colonne F : Effectif attendu en multipliant la probabilité par leffectif de léchantillon (n =217). Fonction : PRODUIT(217;D2).
Le graphe montre que la distribution de fréquences attendues sous lhypothèse de normalité, est relativement proche de la distribution observée.
Indice de classeEffectif observéIndice centre et réduit Densité de probabilitéP(X=x ( classe i)Effectif attendu6251-4,72935785,5465E-065,08849E-060,00110426451-3,811926610,000278990,0002559550,055542266650-2,894495410,006048230,0055488311,204096246859-1,977064220,056510430,05184443411,250242270557-1,059633030,227558120,20876891645,302854772572-0,142201830,394929020,36232020678,6234848745580,775229360,295398850,27100811758,8087613765161,692660550,095227320,08736451418,958099578532,610091740,013230530,0121381042,6339685780503,527522940,000792240,0007268250,15772096
EMBED Excel.Chart.8 \s
Si on sait que la plus petite oie mâle juvénile mesurait 680 mm, quelle est la probabilité de trouver une jeune femelle plus petite que ce mâle ?
La probabilité recherchée est P(X < 680 (N (728,1, 21,8)). Ceci revient à trouver P(Z < (680 ( 728,1)/21,8) = P(Z < -2,2064). Cette probabilité est lue dans la table IV ou avec Excel( : P(Z < -2,2064) = 0,01368.
Dans quel intervalle de longueur sattend-on à trouver 95% des jeunes femelles ? ll sagit de trouver par une méthode paramétrique (méthode faisant appel à une loi de distribution et en loccurrence la loi normale) lintervalle de tolérance pour p = 0,025 (intervalle incluant 95% des réalisations de X). La figure 8.5 montre que cet intervalle est égal à µ ( 1,96( soit P[728,1 ( 1,96(21,8 < X < 728,1 + 1,96(21,8) = P [685,4 < X < 770,8] = 0,95.
Dix pour cent des jeunes oies femelles devraient avoir une longueur totale égale ou supérieure à une certaine valeur. Laquelle ? Il sagit de trouver la valeur de x qui satisfait léquation P(X ( x) = 0,10 ou encore P(X ( x) = 0,90. Pour ce faire il faut utiliser la table IV pour trouver P(Z ( z) = 0,90 soit z = 1,2816 et transformer z en x sachant que z = EMBED Equation.3 = (x 728,1) /21,8. x = 1,2816(21,8 + 728,1 = 756. P(X ( 756) = 0,10.
Dix pour cent des jeunes oies femelles devraient avoir une longueur totale égale ou inférieure à une certaine valeur. Laquelle ? Il sagit de trouver la valeur de x qui satisfait léquation P(X ( x) = 0,90 ou encore P(X ( x) = 0,10. Pour ce faire il faut utiliser la table IV pour trouver P(Z ( z) = 0,10 soit z = (1,2816 et transformer z en x sachant que z = EMBED Equation.3 = (x 728,1) /21,8. x = (1,2816(21,8 + 728,1 = 700,2. P(X ( 700,2) = 0,10.
Quelle est la proportion attendue dindividus ayant une longueur inférieure à 728,1 ? Comme il sagit de la moyenne et que la distribution normale est symétrique par rapport à la moyenne, la proportion attendue sélève à 0,5.
Corrigé de lexercice 8.3
Dans la zone administrative B du Québec, le sexe et lâge des 73 orignaux tués ont été déterminés. Quelle est la probabilité que 36 mâles adultes aient été tués dans cette zone ? On sait que 100(3824 /7281 = 52,52% des individus étaient mâles. Il sagit donc de trouver la valeur de P[X = 36 (B (73, 0,5252)]. Un calcul exact peut être effectué avec la formule 6.7 de la loi binomiale. Une approximation de la loi binomiale par la loi normale sera satisfaisante car pour p = 0,5, un effectif n = 30 fournit une approximation suffisante (tableau 8.2). Il sagit donc de trouver P(35,5 < X < 36,5) sous lhypothèse de normalité N (73(0,5252, ((73, 0,5252, 0,4748)) ( N (38,3396, 4,2666)). Il faut donc trouver P((35,5 ( 38,34)/4,27 < Z < (36,5 38,34)/4,27) = P((0,6655 < Z < -0,4312) = P (Z < -0,4312 (N (0,1)) P (Z < -0,6655 (N (0,1)) . Table IV : = P (Z < -0,4312 (N (0,1)) = 0,3332 , P (Z < -0,6655 (N (0,1)) = 0,2529. P (X = 36) = 0,3332 0,2529 = 0,0803. Un calcul avec Excel par la loi binomiale conduit à P (X = 36) = 0,0801. De toute évidence lapproximation par la loi normale est de moins en moins utile avec lemploi dordinateurs et de simple tableur comme Excel(.
Dans la zone administrative F/3, 103 orignaux ont été tués et identifiés. Quelle est la probabilité que 58 mâles adultes ou moins y aient été abattus ? Il sagit de trouver P(X ( 58 (B (103, 0,5252)) ou P (X ( 58 (N (103(0,5252, ((103(0,5252(0,4748). Le plus simple est de passer par la loi normale pour éviter de calculer toutes les probabilités de X = 58, 57, 56,
0 et den faire la somme. P (X ( 58,5 (N (54,0956, 5,0680)) = P (Z ( (58,5 54,0956)/5,0680 (N (0, 1)) = P (Z ( 0,8691 (N (0, 1)) = 0,8076. Notons que la probabilité recherchée sapplique jusquà la limite supérieure de la classe 58 soit 58,5 même sil sagit dune variable discontinue. Si lon fixe la borne à lindice de classe (xi = 58 = mi-distance de la classe supposée continue) la probabilité devient 0,779 au lieu de 0,8076 ce qui nest pas exact.
Corrigé de lexercice 8.7
Quelle est la distribution de fréquences observées du score de la MADRS à la visite finale pour les patients ayant reçu un placebo ? La distribution de fréquences a été obtenue avec JMP en considérant Y comme une variable nominale (qualitative) (voir chapitre 3, corrigé de lexercice 3.5).
Distribution
Frequencies
LevelCountfreq220,03636320,03636440,07273550,09091620,03636720,03636840,07273910,018181030,054551120,036361320,036361410,018181510,018182110,018182210,018182510,018182720,036362810,018182910,018183020,036363120,036363210,018183920,036364120,036364330,054554420,036364510,018184810,018185210,01818Total551,00000
Quelle est la distribution de fréquence attendue sous lhypothèse de normalité du score de la MADRS ?
Le logiciel JMP permet dajuster directement une loi normale à toute distribution. Il suffit de cliquer sur « Analyse », puis sur « distribution », de sélectionner la variable quantitative Y, les histogrammes apparaissent à lécran. Cliquer sur le triangle rouge à gauche du nom de la variable. puis sur « fit distribution » et sur « normal ». La sortie dordinateur apparaissant ci-dessous montre que la distribution observée (en vert) ne sajuste pas du tout à une loi normale (courbe en rouge).
Distributions
VF
Normal(19,6364,15,5461)
Quantiles
100.%maximum52,00099.5%52,00097.5%50,40090.0%43,40075.0%quartile31,00050.0%median13,00025.0%quartile6,00010.0%4,0002.5%2,0000.5%2,0000.0%minimum2,000
Moments
Mean19,63636Std Dev15,54606Std Err Mean2,09623upper 95% Mean23,83905lower 95% Mean15,43368N55,00000
Fitted Normal
Parameter Estimates
TypeParameterEstimateLower 95%Upper 95%LocationMu19,6363615,4336723,83905DispersionSigma15,5460613,0876819,15030
Si lon utilise Excel( la colonne A indique les indices de classe, la colonne B les effectifs de classe, la colonne C est lécart centré réduit calculé à laide dune formule à appliquer par extension et égale à : Produit(A2(19,636 ;1/15,546), f(x) est une formule à étendre et obtenue en cliquant sur fx (autre fonction) puis sur « statistique » puis sur « loi normale », avec X = C2, Espérance = 0, écart type = 1 et cumulative = faux. La fréquence attendue est égale à h.f(x) = 5(f(x) et est obtenue avec la fonction produit. Leffectif attendu de classe est égal à la fréquence attendue multiplié par leffectif n = 55.
Indice de classeEffectif de classeIndice normalisé f(x)Fréquence attendueEffectif attendu28-1,134439730,209629150,067422213,70822174714-0,812813590,286713590,092214595,07180227128-0,491187440,353606320,113729046,25509694171-0,16956130,39324830,126478936,956341412220,152064840,394356330,12683536,975941752750,473690980,356603730,114693086,308119553250,795317120,290775670,093521065,143658163721,116943270,213798850,06876333,781981454271,438569410,141751540,0455912,507504974721,760195550,084747190,027256911,49913015212,081821690,045687560,014694310,80818719
EMBED Excel.Chart.8 \s
Les distributions de fréquences attendues et observées diffèrent-elles notablement ? On constate à nouveau que la distribution attendue sous la loi normale séloigne de façon importante à la distribution observée. Un intervalle de tolérance calculé sous lhypothèse de normalité naurait aucun sens.
Corrigé de lexercice 9.1
Indiquer la fonction de densité de probabilité de la variable aléatoire T donnant le temps de fonctionnement de la pile. Il sagit de la dérivée de la fonction ((t) qui sécrit f(t) = 0,05e-0,05(t -300).
A combien sélève les deux paramètres de la distribution ? Il sagit dune distribution exponentielle de paramètre ( = 0,05 et ( =300.
Quelle est la moyenne et la variance de T ? Elles sont données par les formules 9.6 et 9.7 : E(T) = µ = 300 + 1/0,05 = 320 jours, Var(T) = 1 / 0,052 = 400 jours2
Quelle est la probabilité que la pile fonctionne plus dune année ? La probabilité est donnée part la fonction de répartition (formule 9.4) : P(T > 365) = e-0,05(365-300) = 0,03877.
Quelle est la probabilité que la pile fonctionne moins dune année ? Il sagit du complément à 1 de P(T > 364) = e-0,05(364-300) = 0,04076. Elle a donc une probabilité de 1 0,04076 = 0,9592 de durer moins dun an.
Quelle est la probabilité de durer moins de quatre mois ? Comme le paramètre ( = 300, il existe une probabilité de 1 (certitude) que la pile dure au moins 300 jours. La probabilité de durer moins de 4 mois est donc nulle.
Quelle est la probabilité que la pile dure plus de 335 jours mais moins de 365 jours ? Elle est égale à P(T > 335) P(T > 364) = e-0,05(335 300) e-0,05(364 300) = 0,17377 0,04076 = 0,133.
Corrigé de lexercice 9.2
Sachant que EMBED Equation.3 est une variable aléatoire obéissant à une loi du khi carré, trouver les probabilités suivantes : Utiliser les fonctions statistiques dExcel ou la table VII en annexe.
P( EMBED Equation.3 ) > 14,07) = 0,05
P( EMBED Equation.3 ) > 38,93) = 0,01
P( EMBED Equation.3 ) > 3,84) = 0,05
P( EMBED Equation.3 ) > 4,10) = 0,0429
Trouver les valeurs critiques du (2 satisfaisant les expressions suivantes :
P( EMBED Equation.3 ) > EMBED Equation.3 ) = 0,05 ( EMBED Equation.3 = 25,0
P( EMBED Equation.3 ) > EMBED Equation.3 ) = 0,05 ( EMBED Equation.3 = 61,66
P( EMBED Equation.3 > EMBED Equation.3 ) > EMBED Equation.3 ) = 0,95 ( EMBED Equation.3 = 3,25, EMBED Equation.3 = 20,49. Attention ( est laire située à droite de la courbe (figure 9.6) et non à gauche comme pour la loi normale (figure 8.2).
P( EMBED Equation.3 > EMBED Equation.3 ) > EMBED Equation.3 ) = 0,99 ( EMBED Equation.3 = 20,49, EMBED Equation.3 = 129,57.
Corrigé de lexercice 9.3
Trouver les probabilités suivantes : Utiliser les fonctions statistiques dExcel ou la table VIII en annexe.
P(F(1, 20) > 4,35) = 0,05
P(F(50, 200) > 1,42) = 0,0482 ( 0,05
P(F(5, 20) > 4,10) = 0,010
Trouver les valeurs critiques de F satisfaisant les expressions suivantes :
P(F(10, 18) > f0,05 (10,18)) = 0,05 ( f0,05 (10,18) = 2,41
P(F(5, () > f0,01 (5, ()) = 0,01 ( f0,01 (5, () = 3,02
P(F(8, 22) > f0,05 (8, 22)) = 0,05 ( f0,05 (8, 22) = 2,40
Corrigé de lexercice 9.4
Trouver les probabilités suivantes : Utiliser les fonctions statistiques dExcel ou la table IX en annexe.
P(T(16) > 1,74) = 0,0505 ( 0,05
P((T(18) < (1,74) = 0,0495 ( 0,05
P( (T(22) ( > 2,81) = 0,0102 ( 0,01
Trouver les valeurs critiques de t satisfaisant les expressions suivantes :
P( (T(18) ( > t(/2 (18) ) = 0,05 ( t0,025 (18) = 2,10
P( (T(23) ( > t(/2 (23) ) = 0,01 ( t0,005 (23) = 2,81
P( T(18) > t(/2 (18) ) = 0,05 ( t0,05 (18) = 1,74.
Biostatistique, 2e édition, volume 1 Corrigé des exercices des chapitres 5 à 9
Bruno Scherrer
PAGE 2