Statistiques à deux variables : ajustement affine appliqué au paysage
Représenter un nuage de points reliant deux séries (température et hauteur d'herbe, irrigation et reprise, etc.), ajuster par une droite (Mayer puis moindres carrés), évaluer R² et l'utiliser pour interpoler / prédire un rendement.
- →Construire un nuage de points
- →Ajuster par la méthode de Mayer
- →Lire l'équation des moindres carrés au tableur, interpréter R²
- →Mobiliser pour prédire un rendement, une consommation d'eau
- →Critiquer une extrapolation
01Construire un nuage de points
Sur un chantier paysager, on relève deux séries de valeurs pour étudier une relation : par exemple température moyenne / hauteur d'herbe en fin de saison, ou apport d'eau / taux de reprise. Chaque couple (xᵢ ; yᵢ) est un pointRéponse : point du repère.
Choisir l'axe : en abscisse, la variable « explicative » (celle que l'on contrôle ou que l'on cherche à utiliser pour prédire) ; en ordonnée, la variable « expliquée » (le résultat observé).
02Ajustement par la méthode de Mayer
- 1Ranger les couples par abscisse croissante.
- 2Diviser en deux groupes G₁ et G₂ d'effectifs (presque) égaux.
- 3Calculer le point moyen de chaque groupe.
- 4Pente : , puis b par substitution.
03Méthode des moindres carrés et R²
La droite des moindres carrés est celle qui minimise la somme des carrés des écarts verticaux entre la droite et les points. Au tableur Excel/LibreOffice : sélectionner la colonne, courbe de tendance → afficher l'équation et le coefficient R².
Coefficient de détermination R².R² ∈ [0 ; 1]. Plus R² est proche de 1Réponse : 1, meilleur est l'ajustement. R² > 0,9 → ajustement de très bonne qualité.
Exercices
Exercice 1— Reprise d'arbustes en fonction de l'arrosageOuvrir
Sur 6 lots de 50 arbustes plantés, on a relevé l'arrosage hebdomadaire (en L/plant) et le taux de reprise (en %) :
| Arrosage L/plant/sem | 1 | 2 | 3 | 4 | 5 | 6 |
|---|---|---|---|---|---|---|
| Reprise % | 62 | 74 | 85 | 90 | 93 | 94 |
1) Tracer le nuage. 2) Par la méthode de Mayer (3+3), déterminer y = a x + b. 3) Estimer le taux de reprise pour 4,5 L/plant. 4) Au-delà de quelle valeur d'arrosage l'extrapolation devient-elle suspecte ?
✓ Correction
G₁ (3 premiers) ≈ (2 ; 73,7). G₂ (3 derniers) ≈ (5 ; 92,3). a = (92,3 − 73,7)/3 ≈ 6,2 ; b = 73,7 − 6,2·2 = 61,3. Équation y = 6,2 x + 61,3. Pour x = 4,5 : y ≈ 89,2 %. Au-delà de 6 L/plant : extrapolation suspecte (saturation visible, le taux ne dépassera pas 100 % — modèle linéaire devient absurde).
Exercice 2— Lecture d'une régression au tableurOuvrir
Un tableur affiche pour un nuage : y = 1,45 x + 8,2 avec R² = 0,96. La donnée x est la dose d'engrais (en g/m²) et y est la masse récoltée (en kg/m²). 1) Que représente le coefficient a = 1,45 ? 2) Pour 50 g/m² d'engrais, prédire la masse récoltée. 3) L'ajustement est-il pertinent ?
✓ Correction
1) a = 1,45 signifie : pour 1 g/m² supplémentaire d'engrais, la masse récoltée augmente en moyenne de 1,45 kg/m². 2) y = 1,45 × 50 + 8,2 = 80,7 kg/m². 3) R² = 0,96 ≥ 0,9 → ajustement de très bonne qualité ; prédictions fiables sur l'intervalle observé.