LE MANUEL COMPLET – VERSION INTÉGRALE
Statistiques
Analyse de Données – Niveau 3AC
- 1. Vocabulaire Fondamental
- 2. Traitement des Données : Effectifs et Fréquences
- 3. Paramètres de Position : La Moyenne
- 4. Paramètres de Position : La Médiane
- 5. Paramètre de Position : Le Mode
- 6. Paramètre de Dispersion : L’Étendue
- 7. Représentations Graphiques
- 8. Séries Regroupées en Classes
- 9. Synthèse et Erreurs Fréquentes
1. Vocabulaire Fondamental
La statistique est la science qui consiste à recueillir, traiter et interpréter des données. Pour cela, il faut parler le même langage.
- Population : L’ensemble des individus (ou objets) sur lesquels porte l’étude (ex: les élèves d’une classe).
- Caractère : La propriété étudiée (ex: la note au devoir, la taille, la couleur des yeux).
- Valeurs : Les différentes réponses possibles (ex: 10, 12, 15 pour les notes).
- Série statistique : La liste complète des données recueillies.
On distingue deux types de caractères :
- Quantitatif : C’est un nombre (notes, âge, poids). On peut faire des calculs.
- Qualitatif : Ce n’est pas un nombre (couleur, marque, sport préféré).
2. Traitement des Données : Effectifs et Fréquences
Une fois les données brutes récoltées, on les organise dans un tableau.
2.1 L’Effectif
- Effectif d’une valeur : Le nombre de fois que cette valeur apparaît dans la série.
- Effectif total ($N$) : Le nombre total d’individus dans la population (somme de tous les effectifs).
2.2 La Fréquence
La fréquence permet de comparer des populations de tailles différentes. Elle s’exprime souvent en pourcentage.
Dans un groupe de 20 élèves, voici les notes obtenues : 10, 12, 10, 15, 12, 12, 10, 8, 15, 12.
| Note (Caractère) | 8 | 10 | 12 | 15 | TOTAL |
|---|---|---|---|---|---|
| Effectif | 1 | 3 | 4 | 2 | 10 |
| Fréquence | 0,1 | 0,3 | 0,4 | 0,2 | 1 |
| Pourcentage | 10% | 30% | 40% | 20% | 100% |
2.3 Effectifs Cumulés Croissants (ECC)
On les obtient en additionnant les effectifs au fur et à mesure.
Utilité : Répondre à des questions du type « Combien d’élèves ont au moins ou au plus telle note ? ».
3. Paramètres de Position : La Moyenne
La moyenne est le point d’équilibre de la série. Si on répartissait équitablement le total, tout le monde aurait la moyenne.
3.1 Moyenne Arithmétique Simple
3.2 Moyenne Pondérée
Lorsque les données sont regroupées dans un tableau d’effectifs, on utilise la moyenne pondérée pour aller plus vite.
Soient $x_1, x_2, \dots$ les valeurs et $n_1, n_2, \dots$ les effectifs correspondants.
$M = \frac{1 \times 8 + 3 \times 10 + 4 \times 12 + 2 \times 15}{10}$
$M = \frac{8 + 30 + 48 + 30}{10} = \frac{116}{10} = 11,6$.
La note moyenne est 11,6.
4. Paramètres de Position : La Médiane
La médiane partage la série statistique en deux groupes de même effectif. C’est la valeur « du milieu ».
1. ORDONNER la série dans l’ordre croissant. (C’est obligatoire !)
2. Regarder l’effectif total $N$ :
- Si $N$ est impair : La médiane est la valeur centrale.
Exemple (5 valeurs) : 2, 5, 8, 12, 14 $\rightarrow$ Médiane = 8. (C’est la $\frac{N+1}{2}$-ème valeur). - Si $N$ est pair : La médiane est la moyenne des deux valeurs centrales.
Exemple (6 valeurs) : 2, 5, 8, 10, 12, 14.
Médiane = $\frac{8+10}{2} = 9$.
Avec les Effectifs Cumulés Croissants : On cherche la première valeur dont l’effectif cumulé dépasse ou égale $N/2$.
5. Paramètre de Position : Le Mode
Le mode est la valeur du caractère qui a le plus grand effectif.
Dans notre exemple précédent, la note 12 a l’effectif le plus grand (4). Le mode est donc 12.
6. Paramètre de Dispersion : L’Étendue
La moyenne ne dit pas tout. L’étendue mesure l’écart maximal entre les valeurs.
- Classe A : Notes 0, 10, 20. Moyenne = 10. Étendue = 20. (Hétérogène)
- Classe B : Notes 9, 10, 11. Moyenne = 10. Étendue = 2. (Homogène)
7. Représentations Graphiques
7.1 Le Diagramme en Bâtons
La hauteur de chaque bâton est proportionnelle à l’effectif.
7.2 Le Diagramme Circulaire (Camembert)
L’angle de chaque secteur est proportionnel à l’effectif (ou à la fréquence).
Angle = Fréquence $\times 360^\circ$.
Pour la note 12 (40%) : $0,4 \times 360 = 144^\circ$.
8. Séries Regroupées en Classes
Quand les valeurs sont trop nombreuses (ex: taille en cm), on les regroupe en intervalles appelés classes (ex: [150 ; 160[).
8.1 Calcul de la Moyenne
On ne peut pas calculer avec un intervalle. On utilise le centre de la classe.
Centre de $[a ; b[ = \frac{a+b}{2}$.
8.2 L’Histogramme
C’est comme un diagramme en bâtons, mais les barres sont collées. L’aire du rectangle représente l’effectif.
9. Synthèse et Erreurs Fréquentes
- ⛔ Calcul de la Moyenne : Diviser par le nombre de valeurs différentes au lieu de l’effectif total. (Ex: diviser par 4 au lieu de 10).
- ⛔ Calcul de la Médiane : Oublier de ranger la série dans l’ordre croissant avant de chercher le milieu.
- ⛔ Confusion : Confondre l’effectif et la valeur. Le mode n’est pas l’effectif le plus grand, mais la valeur qui A l’effectif le plus grand.
