Statistiques à deux variables et ajustement affine
Représenter un nuage de points à partir de deux séries de données, déterminer un ajustement affine par la méthode de Mayer puis par les moindres carrés. Mobiliser pour interpoler / extrapoler dans un contexte sanitaire et social.
- →Construire un nuage de points à partir d'un tableau
- →Déterminer l'équation d'une droite d'ajustement par la méthode de Mayer
- →Calculer l'équation par moindres carrés (tableur/calculatrice)
- →Lire et interpréter le coefficient de détermination R²
- →Interpoler ou extrapoler à partir d'un ajustement
01Nuage de points et tendance
Nuage de points.Lorsqu'on dispose d'une série de couples (xᵢ ; yᵢ), on les représente dans un repère : chaque couple est un pointRéponse : point. L'ensemble forme un nuage de points. Si les points semblent alignésRéponse : alignés, on peut chercher une droite d'ajustement.
Espérance de vie à la naissance en France selon les années récentes (relevé Insee) : les points suivent une tendance croissanteRéponse : croissante quasi-linéaire, ce qui justifie un ajustement affine.
02Ajustement par la méthode de Mayer
- 1Ranger les points par abscisse croissante.
- 2Partager le nuage en deuxgroupes égaux. Réponse : deux parties (G₁ et G₂) d'effectifs égaux ou presque.
- 3Calculer le point moyen de chaque groupe : G₁(x̄₁ ; ȳ₁) et G₂(x̄₂ ; ȳ₂).
- 4La droite d'ajustement passe par G₁ et G₂. Son coefficient directeur : .
- 5Trouver b en utilisant un des deux points moyens.
La méthode de Mayer est manuellesans outil. Réponse : manuelle et donne un bon ordre de grandeur. Pour plus de précision, on utilise la méthode des moindres carrés (tableur).
03Moindres carrés et coefficient R²
La droite des moindres carrés est celle qui minimise la somme des carrés des écartsrésidus verticaux. Réponse : écarts entre chaque point et la droite. Au tableur : sélectionner le nuage → ajouter une courbe de tendance → afficher l'équation et le R².
Coefficient de détermination R².R² est un nombre compris entre 0Réponse : 0 et 1Réponse : 1. Plus R² est proche de 1, meilleur est l'ajustementRéponse : ajustement. On considère souvent qu'un R² > 0,9 indique un ajustement linéaire pertinent.
- 1Une fois l'équation y = a x + b obtenue, on peut prédire y pour un x donné.
- 2Interpoler : x est à l'intérieurRéponse : à l'intérieur de l'intervalle des données → fiable.
- 3Extrapoler : x est à l'extérieurRéponse : à l'extérieur → à utiliser avec prudence (le modèle peut ne plus être valable).
Exercices
Exercice 1— Évolution du nombre de bénéficiaires APAOuvrir
Le tableau ci-dessous donne le nombre (en milliers) de bénéficiaires de l'APA (Allocation Personnalisée d'Autonomie) en France :
| Année | 2015 | 2017 | 2019 | 2021 | 2023 |
|---|---|---|---|---|---|
| Bénéficiaires (k) | 1 248 | 1 297 | 1 322 | 1 378 | 1 425 |
1) Tracer le nuage de points avec en abscisse les années (en posant x = 0 pour 2015). 2) Par la méthode de Mayer, déterminer une équation y = a x + b. 3) Estimer le nombre de bénéficiaires en 2025.
💡 Indice
G₁ = moyenne des 2 ou 3 premiers points ; G₂ = moyenne des 2 ou 3 derniers. Penser à exprimer x = année − 2015.
✓ Correction
Posons x = année − 2015. Points : (0;1248), (2;1297), (4;1322), (6;1378), (8;1425). G₁ ≈ (1 ; 1272,5), G₂ ≈ (7 ; 1401,5). a = (1401,5 − 1272,5) / (7 − 1) = 21,5 ; b = 1272,5 − 21,5 = 1251. Équation : y = 21,5 x + 1251. En 2025 : x = 10 → y ≈ 1 466 milliers, soit environ 1,47 million de bénéficiaires.
Exercice 2— Lecture critique d'un R²Ouvrir
Sur trois nuages distincts, les R² obtenus sont 0,12 / 0,73 / 0,97. Pour chacun, dire si un ajustement affine est pertinent.
✓ Correction
R² = 0,12 → pas d'ajustement linéaire pertinent (forte dispersion). R² = 0,73 → tendance linéaire visible mais à confirmer (chercher un autre modèle peut être utile). R² = 0,97 → excellent ajustement affine, prévisions fiables sur l'intervalle.