Td corrigé Préliminaires pdf

Préliminaires

Chaque unité statistique ou individu s'il fait partie de la même population qu'un autre varie cependant selon certains critères appelés caractères ou variables ...




part of the document



Préliminaires
Exercice 1-1

Différence population –échantillon :
la population désigne l’ensemble des éléments de tout type de champ d’analyse ayant des propriétés communes et pris en considération par un statisticien pour le quantifier.
Un échantillon est un sous-ensemble de la population étudiée sur lequel s’effectue une étude statistique.
Définition de la variable :
Chaque unité statistique ou individu s’il fait partie de la même population qu’un autre varie cependant selon certains critères appelés caractères ou variables qui comme leur nom l’indique varient d’un élément à l’autre et permettent de caractériser la population sur base des individus.
Etapes d’une méthode statistique :
Poser le problème : toute recherche émane d’un problème, souvent une non adéquation des résultats observés par rapport aux résultats attendus sur base d’un modèle. Le chercheur s’efforcera de formuler explicitement le problème.
Simplification – idéalisation : ne pas vouloir mettre en jeu trop de variables mais plutôt simplifier le problème pour ne retenir que quelques variables essentielles, les autres restent fixées.
Mesure : collecte des données
Manipulation – transformation : ces opérations sont effectuées pour simplifier le modèle ou répondre à certaines exigences statistiques.
Vérification : par un certain nombre de tests statistiques.
Différence répétabilité – reproductibilité
La répétabilité est une mesure de la fidélité lorsque les mesures sont faites par un même opérateur sur un même instrument, selon une méthode unique et dans un délai court. L’objectif est d’obtenir des mesures dans des conditions similaires.
La reproductibilité : mesure de la fidélité sans restriction d ’opérateur, d ’instrument, de méthode ou de temps. La précision correspond à la reproductibilité. L’objectif est d’obtenir des mesures dans des conditions où une ou plusieurs sources de variabilité peuvent interférer.
Différence fidélité - justesse
La fidélité est étroitesse de l’accord entre les mesures effectuées sur des prises multiples d ’un échantillon homogène. Cette fidélité peut avoir 2 aspects :
La justesse est l’étroitesse de l ’accord entre une mesure ou la moyenne des mesures et la valeur conventionnellement vraie de l ’échantillon. Elle mesure la proximité des résultats en référence à une valeur reconnue par d'autres laboratoires.
Différence spécificité – sensibilité
La sensibilité est le rapport de la variation de la réponse instrumentale par rapport à la variation de la concentration.
La spécificité est la mesure de l’analyte avec la garantie que le signal ne provient que de l’analyte
Différentes sources d’erreurs.
Dans un problème mathématique:
l’erreur absolue XE "erreur :erreur absolue"  : différence prise en valeur absolue entre la valeur observée et la valeur de référence.
l’erreur relative XE "erreur :erreur relative"  : rapport de l’erreur absolue à la valeur de référence.
l’erreur d’arrondi XE "erreur :erreur d’arrondi"  : erreur résultant du remplacement d’une valeur numérique par une autre toute proche mais tronquée. Le calcul à n décimale entraîne une erreur d’arrondi comprise entre -0.5 10-n et 0.5 10-n. L’erreur d’arrondi peut avoir une importance lors de longues procédures de calcul par ordinateur. Aussi conseille-t-on d’effectuer les calculs avec tous les chiffres et d’arrondir pour la présentation des résultats.
Dans un problème statistique :
l’erreur aléatoire XE "erreur :erreur aléatoire"  : erreur résultant de la combinaison de multiples erreurs partielles imputables à l’instrument, à l’expérimentateur, aux fluctuations des conditions expérimentales. Les propriétés statistiques et leur estimation s’étudient par le calcul de probabilité. Elle se détermine par la répétition de l’expérience. Cette erreur affecte la précision d’un résultat. De larges erreurs aléatoires conduisent à une faible précision. Exemple : en repesant plusieurs fois le même échantillon, de légères fluctuations de poids seront observées.
l’erreur systématique XE "erreur :erreur systématique "  : erreur qui provient de causes permanentes. Les résultats dévient systématiquement de la valeur exacte suite à un appareillage non calibré ou à une erreur systématique de l’expérimentateur. Ce type d’erreur affecte l’exactitude de la mesure et donne naissance au biais statistique. Exemple : un mauvais calibrage d’un colorimètre par oubli du réglage du 0% d’absorbance et 100% de transmittance.
l’erreur accidentelle XE "erreur :erreur accidentelle "  : elle n’est pas liée à l’outil de mesure employé mais à l’expérimentateur lui-même. Exemple : erreur de lecture d’une pesée ou de dilution.
l’erreur expérimentale XE "erreur :erreur expérimentale "  : erreur due à des variables non contrôlées. Exemple : fluctuation de la température pendant une réaction chimique.
L’erreur résiduelle XE "erreur :erreur résiduelle"  : elle correspond à la différence entre la valeur estimée et la valeur observée. Elle est souvent désignée sous le terme de résidu.
Toute erreur qui survient dans le cadre statistique est une combinaison de ces différentes erreurs.
Dans un test d’hypothèse
Dans une étude faisant intervenir des tests d’hypothèses, les erreurs suivantes sont rencontrées :
L’erreur de première espèce XE "erreur :erreur de première espèce"  : erreur que l’on commet en rejetant l’hypothèse nulle lorsqu’elle est vraie.
L’erreur de seconde espèce XE "erreur :erreur de seconde espèce "  : on ne rejette pas l’hypothèse nulle alors que celle-ci est fausse.
Dans une expérience :
Différents facteurs peuvent influencer le résultat des observations :
Facteurs contrôlés : grandeurs auxiliaires telles la température, pression,... qui caractérisent l'environnement et qui en principe sont maîtrisé par l’expérimentateur.
Facteurs parasites : ou erreur dans les observations suite à l'une des raisons suivantes :
Erreur de mesure due à l'instrument, à la technique ou à l'utilisateur.
Erreur de représentativité : dans certaines techniques, comme la GLC, la grandeur physique directe est difficile d'accès.
Erreur due à l'instabilité du phénomène observé au cours du temps. Il est le fait de notre ignorance, le reflet de notre incapacité à maîtriser tous les degrés de liberté d’une situation.

Etapes d’un protocole de traitement de données
La compréhension du domaine d’application :.
Création d’un sous-ensemble sur lequel portera l’analyse 
Nettoyage : éliminer ou caractériser dans l’ensemble les erreurs, les données manquantes ou les valeurs atypiques (outliers).
Transformation des données :
Définir l’objectif et la stratégie d ‘analyse parmi les suivants :
Choix de la méthode de modélisation
Validation de la méthode
Prévision
Diffusion de l’information

Différence statistique descriptive – statistique inférentielle
La statistique descriptive se propose de classer les données, de les organiser et de les présenter clairement par les tableaux, la présentation graphique et les résumés numériques.
La statistique inférentielle a comme objectif principal de caractériser une population sur base d’observations sur un échantillon.
Exercice 1-2
Vous mettez en titre une solution acide avec une base de titre connu (NAOH 0.1 N). Vous obtenez les résultats donnés par le tableau ci-dessous. Déterminez :
ml NaOHpH1121.131.241.351.5.62738495La variable dépendante et indépendante : dépendante : pH et indépendante : NaOH.
La nature des variables : quantitative.
Les variables sont continues.
La liaison qui unit les ml au pH est une régression. 






Vous administrez un traitement 1 à un groupe de souris et un Placebo à un autre groupe. Vous déterminez une variable Y qui représente le nombre de tumeurs /souris. Répondez aux questions suivantes :
La variable Y est continue : non
La variable Y est qualitative : non
Le traitement est une variable : oui
Le traitement est une variable quantitative : non