Généralités sur la statistique

La statistique est l’étude de la collecte de données, leur analyse, leur traitement, l’interprétation des résultats et leur présentation afin de rendre les données compréhensibles par tous. C’est à la fois une science, une méthode et un ensemble de techniques.
L’analyse des données est utilisée pour d’écrire les phénomènes étudiés, faire des prévisions et prendre des décisions à leur sujet. En cela, la statistique est un outil essentiel pour la compréhension et la gestion des phénomènes complexes.
Les données étudiées peuvent être de toute nature, ce qui rend la statistique utile dans tous les champs disciplinaires et explique pourquoi elle est enseignée dans toutes les filières universitaires, de l’économie à la biologie en passant par la psychologie et bien sûr les sciences de l’ingénieur.
La statistique consiste à :
– Recueillir des données.
– Présenter et résumer ces données.
– Tirer des conclusions sur la population étudiée et d’aider à la prise de décision.
– En présence de données dépendant du temps, nous essayons de faire de la prévision.

Les statistiques descriptives visent à étudier les caractéristiques d’un ensemble d’observations comme les mesures obtenues lors d’une expérience. L’expérience est l’étape préliminaire à toute étude statistique. Il s’agit de prendre “contact” avec les observations. De manière générale, la méthode statistique est basée sur le concept suivant.

Exemple 1 (La durée de vie des lampes)
Imaginons le cas suivant : un fabricant d’ampoules électriques ayant le choix entre 4 types de filaments se propose d’étudier l’influence de la nature du filament sur la durée de vie des ampoules fabriquées. Pour ce faire, il va faire fabriquer 4 échantillons d’ampoules identiques, sauf en ce qui concerne le filament, faire brûler les ampoules jusqu’à extinction, puis comparer les résultats obtenus.

Population
En statistique, on travaille sur des populations. Ce terme vient du fait que la démographie, étude des populations humaines, a occupé une place centrale aux débuts de la statistique, notamment au travers des recensements de population. Mais, en statistique, le terme de population s’applique à tout objet statistique étudié, qu’il s’agisse d’étudiants (d’une université ou d’un pays), de ménages ou de n’importe quel autre ensemble sur lequel on fait des observations statistiques. Nous définissons la notion de population.

Définition:
On appelle population l’ensemble sur lequel porte notre étude statistique. Cet ensemble est noté Ω.

Individu (unité statistique)
Une population est composée d’individus. Les individus qui composent une population statistique sont appelés unités statistiques.

Caractère (variable statistique)
La statistique « descriptive », comme son nom l’indique cherche à décrire une population donnée. Nous nous intéressons au caractéristique des unités qui peuvent prendre différentes valeurs.

Exemple: Taille, température, nationalité, couleur des yeux, catégorie socioprofessionnelle …

Modalités
Les modalités d’une variable statistique sont les différentes valeurs que peut prendre celle-ci.
Les modalités sont les différentes situations dans lesquelles les individus peuvent se trouver à l’égard du caractère considéré.
Exemple : – Variable est ” situation familiale ”
Modalités sont ” célibataire, marié, divorcé “
– Variable est” statut d’interrupteur “
Modalités sont ” 0 et 1 “.
– Variable est ” catégories socio-professionnelles “
Modalités sont ” Employés, ouvriers, retraités,… “

Types des caractères
Nous distinguons deux catégories de caractères : les caractères qualitatifs et les caractères quantitatifs.

Caractère qualitatif
Les caractères qualitatifs sont ceux dont les modalités ne peuvent pas être ordonnées,
c’est-à-dire que si l’on considère deux caractères pris au hasard, on ne peut pas dire de l’un
des caractères qu’il est inférieur ou égal à l’autre. Plus précisément, nous avons la définition
suivante.

Définition : Les éléments de C sont représentés par autre chose que des chiffres.

Exemple : L’état d’une maison : on peut considérer les modalités suivantes
– Ancienne.
– Dégradée.
– Nouvelle.
– Rénovée.


Caractère quantitatif
Les caractères quantitatifs sont des caractères dont les modalités peuvent être ordonnées.
Ainsi, l’âge, la taille de vie ou le salaire d’un individu sont des caractères quantitatifs.
Donc, nous avons la définition suivante.

Définition : L’ensemble des valeurs est représenté par des chiffres. De même, il est partagé en deux sortes de caractères, discret et continu (voir l’exemple).

Exemple :
– Le salaire d’employés d’une usine.
Modalités : 10000da , 20000da…
Type : Discret.

– La rigidité des ressorts.
Modalités : [10, 20] N/m
Type : continu.


En général, la variable quantitative discrète est une variable ne prenant que des valeurs entières (plus rarement décimales). Le nombre de valeurs distinctes d’une telle variable est habituellement assez faible. Citons, par exemple, le nombre de maisons par quartier d’une ville. Une variable quantitative est dite continue lorsque les observations qui lui sont associées ne sont pas des valeurs précises, mais des intervalles. C’est le cas lorsque nous avons un grand nombre d’observations distinctes.
La statistique descriptive a pour objectif de synthétiser l’information contenue dans les jeux de données au moyen de tableaux, figures ou résumés numériques. Les variables statistiques sont analysées différemment selon leur nature (quantitative, qualitative).

variable statistique discrète

Le caractère statistique peut prendre un nombre fini raisonnable de valeurs (note, nombre d’enfants, nombre de pièces, …). Dans ce cas, le caractère statistique étudié est
alors appelé un caractère discret.

X : Ω -> {x1, x2, …, xn}

avec Card(Ω) : = N est le nombre d’individus dans notre étude.

Exemple:
Une enquête réalisée dans un village porte sur le nombre d’enfants à charge par famille.
On note X le nombre d’enfants, les résultats sont données par ce tableau :

Nous avons: Ω ensemble des familles.
– ω une famille.
– X nombre d’enfants par famille

X : ω -> X (ω)
On dit, à la famille ω, on associe X(ω) = le nombre d’enfants de cette famille.

effectif cumulé…
Fréquence cumulée…
fréquence relative…

Représentation graphique des séries statistiques

…..

Paramètres de position

Les indicateurs statistiques de tendance centrale (dits aussi de position) considérés fréquemment sont la moyenne, la médiane et le mode.

Le mode…
La médiane….
La moyenne….

Paramètres de dispersion (variabilité)

Les indicateurs statistiques de dispersion usuels sont l’étendue, la variance et l’écart-type.

variable statistique continue

Nous rappelons qu’une variable statistique (V.S) quantitative concerne une grandeur mesurable. Ses valeurs sont des nombres exprimant une quantité et sur lesquelles les opérations arithmétiques (addition, multiplication, etc,…) ont un sens. Nous allons dans ce chapitre se focaliser sur la V.S quantitative continue.

Caractère continu…
Classe de valeurs…
Nombre de classes….
Représentation graphique d’un caractère continu
Histogramme des fréquences…

Nous pouvons représenter le tableau statistique par un histogramme. Nous reportons les classes sur l’axe des abscisses et, au-dessus de chacune d’elles, nous traçons un rectangle dont l’aire est proportionnelle à la fréquence fi (ou l’effectif ni) associée. Ce graphique est appelé l’histogramme des fréquences.

Histogramme des fréquences ou des éffctifs.

Fonction de répartition
La moyenne

la moyenne de X

Le mode
La définition suivante permet de comprendre la démarche à suivre pour calculer le mode d’une manière exacte et qui se trouve dans une des classes appelée “classe modale”.

Représentation ou détermination graphique du mode (cas continu)

La médiane

F(x) = (fi+1 / h) (x-Li) + Fi

Paramètres de dispersion

La variance

l’écart type: σ X = √ Var (x)

Pour i ϵ {1, 2, 3}, la quantité Qi tel que F(Qi) = 1/4 s’appelle le iem quartile.

Exemple :
Pour i = 2, Q2 tel que F(Q2) = 2/4 = 0.5 , donc, Q2 = Me.

La détermination ou le calcul de Qi se fait exactement comme le calcul de la médiane (graphiquement ou analytiquement).

Interprétation : Il y a 25 % d’individus dont la valeur du caractère est dans l’intervalle [a0,Q1]. De même pour les autres quartiles.
Ces intervalles s’appellent “intervalles interquartiles”.
Q1 -> 25%
Q2 -> 50%
Q3 -> 75%

Les quartiles.

-> Retour à la page d’accueil <-