Tᵉ Bac APMG1 — Construction d'un raisonnement scientifique autour des questions du monde actuelChapitre 3

Statistiques à deux variables : ajustement affine appliqué au paysage

Représenter un nuage de points reliant deux séries (température et hauteur d'herbe, irrigation et reprise, etc.), ajuster par une droite (Mayer puis moindres carrés), évaluer R² et l'utiliser pour interpoler / prédire un rendement.

Durée
4 séances de 55 min
Objectifs
5 compétences visées
Référentiel
MG1 — Capacité C1.2 — Bac Pro tronc commun (2024)
Compétences visées
  • Construire un nuage de points
  • Ajuster par la méthode de Mayer
  • Lire l'équation des moindres carrés au tableur, interpréter R²
  • Mobiliser pour prédire un rendement, une consommation d'eau
  • Critiquer une extrapolation

01Construire un nuage de points

Sur un chantier paysager, on relève deux séries de valeurs pour étudier une relation : par exemple température moyenne / hauteur d'herbe en fin de saison, ou apport d'eau / taux de reprise. Chaque couple (xᵢ ; yᵢ) est un pointRéponse : point du repère.

Choisir l'axe : en abscisse, la variable « explicative » (celle que l'on contrôle ou que l'on cherche à utiliser pour prédire) ; en ordonnée, la variable « expliquée » (le résultat observé).

02Ajustement par la méthode de Mayer

Méthode — Étapes
  1. 1Ranger les couples par abscisse croissante.
  2. 2Diviser en deux groupes G₁ et G₂ d'effectifs (presque) égaux.
  3. 3Calculer le point moyen de chaque groupe.
  4. 4Pente : , puis b par substitution.

03Méthode des moindres carrés et R²

Propriété — Moindres carrés

La droite des moindres carrés est celle qui minimise la somme des carrés des écarts verticaux entre la droite et les points. Au tableur Excel/LibreOffice : sélectionner la colonne, courbe de tendance → afficher l'équation et le coefficient R².

Définition

Coefficient de détermination R².R² ∈ [0 ; 1]. Plus R² est proche de 1Réponse : 1, meilleur est l'ajustement. R² > 0,9 → ajustement de très bonne qualité.

QCM
Un nuage de points présente R² = 0,42. Que conclure ?
Saisie libre
Une régression donne y = 0,8 x + 12 sur l'intervalle x ∈ [10 ; 50]. Estimer y pour x = 30.

Exercices

Exercice 1Reprise d'arbustes en fonction de l'arrosage
Ouvrir

Sur 6 lots de 50 arbustes plantés, on a relevé l'arrosage hebdomadaire (en L/plant) et le taux de reprise (en %) :

Arrosage L/plant/sem123456
Reprise %627485909394

1) Tracer le nuage. 2) Par la méthode de Mayer (3+3), déterminer y = a x + b. 3) Estimer le taux de reprise pour 4,5 L/plant. 4) Au-delà de quelle valeur d'arrosage l'extrapolation devient-elle suspecte ?

✓ Correction

G₁ (3 premiers) ≈ (2 ; 73,7). G₂ (3 derniers) ≈ (5 ; 92,3). a = (92,3 − 73,7)/3 ≈ 6,2 ; b = 73,7 − 6,2·2 = 61,3. Équation y = 6,2 x + 61,3. Pour x = 4,5 : y ≈ 89,2 %. Au-delà de 6 L/plant : extrapolation suspecte (saturation visible, le taux ne dépassera pas 100 % — modèle linéaire devient absurde).

Exercice 2Lecture d'une régression au tableur
Ouvrir

Un tableur affiche pour un nuage : y = 1,45 x + 8,2 avec R² = 0,96. La donnée x est la dose d'engrais (en g/m²) et y est la masse récoltée (en kg/m²). 1) Que représente le coefficient a = 1,45 ? 2) Pour 50 g/m² d'engrais, prédire la masse récoltée. 3) L'ajustement est-il pertinent ?

✓ Correction

1) a = 1,45 signifie : pour 1 g/m² supplémentaire d'engrais, la masse récoltée augmente en moyenne de 1,45 kg/m². 2) y = 1,45 × 50 + 8,2 = 80,7 kg/m². 3) R² = 0,96 ≥ 0,9 → ajustement de très bonne qualité ; prédictions fiables sur l'intervalle observé.