Préliminaires
Chaque unité statistique ou individu s'il fait partie de la même population qu'un
autre varie cependant selon certains critères appelés caractères ou variables ...
part of the document
Préliminaires
Exercice 1-1
Différence population échantillon :
la population désigne lensemble des éléments de tout type de champ danalyse ayant des propriétés communes et pris en considération par un statisticien pour le quantifier.
Un échantillon est un sous-ensemble de la population étudiée sur lequel seffectue une étude statistique.
Définition de la variable :
Chaque unité statistique ou individu sil fait partie de la même population quun autre varie cependant selon certains critères appelés caractères ou variables qui comme leur nom lindique varient dun élément à lautre et permettent de caractériser la population sur base des individus.
Etapes dune méthode statistique :
Poser le problème : toute recherche émane dun problème, souvent une non adéquation des résultats observés par rapport aux résultats attendus sur base dun modèle. Le chercheur sefforcera de formuler explicitement le problème.
Simplification idéalisation : ne pas vouloir mettre en jeu trop de variables mais plutôt simplifier le problème pour ne retenir que quelques variables essentielles, les autres restent fixées.
Mesure : collecte des données
Manipulation transformation : ces opérations sont effectuées pour simplifier le modèle ou répondre à certaines exigences statistiques.
Vérification : par un certain nombre de tests statistiques.
Différence répétabilité reproductibilité
La répétabilité est une mesure de la fidélité lorsque les mesures sont faites par un même opérateur sur un même instrument, selon une méthode unique et dans un délai court. Lobjectif est dobtenir des mesures dans des conditions similaires.
La reproductibilité : mesure de la fidélité sans restriction d opérateur, d instrument, de méthode ou de temps. La précision correspond à la reproductibilité. Lobjectif est dobtenir des mesures dans des conditions où une ou plusieurs sources de variabilité peuvent interférer.
Différence fidélité - justesse
La fidélité est étroitesse de laccord entre les mesures effectuées sur des prises multiples d un échantillon homogène. Cette fidélité peut avoir 2 aspects :
La justesse est létroitesse de l accord entre une mesure ou la moyenne des mesures et la valeur conventionnellement vraie de l échantillon. Elle mesure la proximité des résultats en référence à une valeur reconnue par d'autres laboratoires.
Différence spécificité sensibilité
La sensibilité est le rapport de la variation de la réponse instrumentale par rapport à la variation de la concentration.
La spécificité est la mesure de lanalyte avec la garantie que le signal ne provient que de lanalyte
Différentes sources derreurs.
Dans un problème mathématique:
lerreur absolue XE "erreur :erreur absolue" : différence prise en valeur absolue entre la valeur observée et la valeur de référence.
lerreur relative XE "erreur :erreur relative" : rapport de lerreur absolue à la valeur de référence.
lerreur darrondi XE "erreur :erreur darrondi" : erreur résultant du remplacement dune valeur numérique par une autre toute proche mais tronquée. Le calcul à n décimale entraîne une erreur darrondi comprise entre -0.5 10-n et 0.5 10-n. Lerreur darrondi peut avoir une importance lors de longues procédures de calcul par ordinateur. Aussi conseille-t-on deffectuer les calculs avec tous les chiffres et darrondir pour la présentation des résultats.
Dans un problème statistique :
lerreur aléatoire XE "erreur :erreur aléatoire" : erreur résultant de la combinaison de multiples erreurs partielles imputables à linstrument, à lexpérimentateur, aux fluctuations des conditions expérimentales. Les propriétés statistiques et leur estimation sétudient par le calcul de probabilité. Elle se détermine par la répétition de lexpérience. Cette erreur affecte la précision dun résultat. De larges erreurs aléatoires conduisent à une faible précision. Exemple : en repesant plusieurs fois le même échantillon, de légères fluctuations de poids seront observées.
lerreur systématique XE "erreur :erreur systématique " : erreur qui provient de causes permanentes. Les résultats dévient systématiquement de la valeur exacte suite à un appareillage non calibré ou à une erreur systématique de lexpérimentateur. Ce type derreur affecte lexactitude de la mesure et donne naissance au biais statistique. Exemple : un mauvais calibrage dun colorimètre par oubli du réglage du 0% dabsorbance et 100% de transmittance.
lerreur accidentelle XE "erreur :erreur accidentelle " : elle nest pas liée à loutil de mesure employé mais à lexpérimentateur lui-même. Exemple : erreur de lecture dune pesée ou de dilution.
lerreur expérimentale XE "erreur :erreur expérimentale " : erreur due à des variables non contrôlées. Exemple : fluctuation de la température pendant une réaction chimique.
Lerreur résiduelle XE "erreur :erreur résiduelle" : elle correspond à la différence entre la valeur estimée et la valeur observée. Elle est souvent désignée sous le terme de résidu.
Toute erreur qui survient dans le cadre statistique est une combinaison de ces différentes erreurs.
Dans un test dhypothèse
Dans une étude faisant intervenir des tests dhypothèses, les erreurs suivantes sont rencontrées :
Lerreur de première espèce XE "erreur :erreur de première espèce" : erreur que lon commet en rejetant lhypothèse nulle lorsquelle est vraie.
Lerreur de seconde espèce XE "erreur :erreur de seconde espèce " : on ne rejette pas lhypothèse nulle alors que celle-ci est fausse.
Dans une expérience :
Différents facteurs peuvent influencer le résultat des observations :
Facteurs contrôlés : grandeurs auxiliaires telles la température, pression,... qui caractérisent l'environnement et qui en principe sont maîtrisé par lexpérimentateur.
Facteurs parasites : ou erreur dans les observations suite à l'une des raisons suivantes :
Erreur de mesure due à l'instrument, à la technique ou à l'utilisateur.
Erreur de représentativité : dans certaines techniques, comme la GLC, la grandeur physique directe est difficile d'accès.
Erreur due à l'instabilité du phénomène observé au cours du temps. Il est le fait de notre ignorance, le reflet de notre incapacité à maîtriser tous les degrés de liberté dune situation.
Etapes dun protocole de traitement de données
La compréhension du domaine dapplication :.
Création dun sous-ensemble sur lequel portera lanalyse
Nettoyage : éliminer ou caractériser dans lensemble les erreurs, les données manquantes ou les valeurs atypiques (outliers).
Transformation des données :
Définir lobjectif et la stratégie d analyse parmi les suivants :
Choix de la méthode de modélisation
Validation de la méthode
Prévision
Diffusion de linformation
Différence statistique descriptive statistique inférentielle
La statistique descriptive se propose de classer les données, de les organiser et de les présenter clairement par les tableaux, la présentation graphique et les résumés numériques.
La statistique inférentielle a comme objectif principal de caractériser une population sur base dobservations sur un échantillon.
Exercice 1-2
Vous mettez en titre une solution acide avec une base de titre connu (NAOH 0.1 N). Vous obtenez les résultats donnés par le tableau ci-dessous. Déterminez :
ml NaOHpH1121.131.241.351.5.62738495La variable dépendante et indépendante : dépendante : pH et indépendante : NaOH.
La nature des variables : quantitative.
Les variables sont continues.
La liaison qui unit les ml au pH est une régression.
Vous administrez un traitement 1 à un groupe de souris et un Placebo à un autre groupe. Vous déterminez une variable Y qui représente le nombre de tumeurs /souris. Répondez aux questions suivantes :
La variable Y est continue : non
La variable Y est qualitative : non
Le traitement est une variable : oui
Le traitement est une variable quantitative : non