Exercice 31 : Machines

Un chef d'entreprise désire changer son ancienne machine produisant des pièces d'un certain type au rythme moyen de $1214$ pièces par jour avec un écart-type de $35.4$ pièces par jour. Via l'Approche Expérimentale, ces caractéristiques correspondent respectivement à la moyenne et à l'écart-type des productions quotidiennes obtenues si on pouvait faire tourner cette machine pendant une infinité de jours (il est sous-entendu que le chef d'entreprise ne l'a constaté que pour une période de $m$ jours avec $m$ très très grand).

Partie 1
Un représentant lui propose une nouvelle machine (que l'on appellera machine 1) produisant des pièces du même type. Le chef d'entreprise souhaite l'acheter à condition qu'il soit assuré que cette machine 1 est d'une part plus performante (c'est à dire, de moyenne théorique une fois et demi plus grande que son ancienne machine de référence) et d'autre part plus régulière (c'est à dire, d'écart-type théorique deux fois plus petit que l'ancienne). Soient $\mu^{M1}$ et $\sigma_{M1}$, les caractéristiques de la machine 1 correspondant respectivement à la moyenne et à l'écart-type des productions quotidiennes obtenues si on pouvait faire tourner la machine 1 pendant une infinité de jours.

(1) Exprimer à partir de $\mu^{M1}$ et $\sigma^2_{M1}$ (ou $\sigma_{M1}$) les deux conditions d'achat de la nouvelle machine exprimées par le chef d'entreprise.
Réponse
Le chef d'entreprise décidera d'acheter la nouvelle machine si $\mu^{M1}>1.5\times 1214=1821$ et si $\sigma_{M1}^2 < (35.4/2)^2=313.29$.
Pour espérer connaître les ordres de grandeur de ces quantités inconnues, le chef d'entreprise demande au représentant une période d'essai de 100 jours. Le vecteur ${\mathbf{ y^{M1} }}=(y_1^{M1},y_2^{M1},\ldots,y_{100}^{M1})$ représente les nombres de pièces fabriquées pour chaque jour de cette période d'essai. Ce vecteur de données a été préalablement saisi dans le logiciel R sous le nom $\mathtt{yM1}$.

(2) Peut-on conseiller au chef d'entreprise d'acheter la machine 1 (lorsqu'on sait qu'il accepte que tout test statistique est généralement traité à un seuil de signification $\alpha=5\%$) ?
R> yM1
  [1] 1844 1828 1837 1833 1831 1818 1836 1837 1840 1820 1845 1815 1831 1839 1824
 [16] 1839 1836 1840 1822 1824 1820 1839 1849 1846 1817 1822 1832 1846 1832 1834
...
 [76] 1810 1838 1844 1830 1830 1829 1807 1797 1814 1807 1844 1834 1827 1841 1830
 [91] 1830 1834 1840 1832 1844 1815 1825 1821 1840 1821


Performance
R> mean(yM1)
[1] 1830.13
R> # deltaEst.H0 <- (instruction R à fournir dans la rédaction)
R> deltaEst.H0
[1] 8.197877
R> pnorm(deltaEst.H0)
[1] 1


Régularité
R> var(yM1)
[1] 124.0334
R> # deltaEst.H0 <- (instruction R à fournir dans la rédaction)
R> deltaEst.H0
[1] -11.41626
R> pnorm(deltaEst.H0)
[1] 1.734226e-30

Réponse

A propos de la performance :

Hypothèses de test : \(\mathbf{H}_0:\) \(\mu^{M1}=1214*1.5\) vs \(\mathbf{H}_1:\) \(\mu^{M1}>1214*1.5\)
Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{\mu^{M1},1214*1.5} }\left({\mathbf{ { Y^{M1} } }}\right) = {\displaystyle \frac{\widehat{ \mu^{M1} }\left({\mathbf{ { Y^{M1} } }}\right)-1214*1.5}{ \widehat{ \sigma_{\widehat{ \mu^{M1}}} }\left({\mathbf{ { Y^{M1} } }}\right) }} \underset{Approx.}{\leadsto} \mathcal{N}(0,1) \]
Règle de décision : Accepter \(\mathbf{H}_1\) si p-valeur (droite) < \(5\%\)
Conclusion : puisqu'au vu des données, $$ p-valeur\overset{\mathtt{R}}{=}\mathtt{1-pnorm((mean(yM1)-1214*1.5)/seMean(yM1))} \simeq 0.0\% < 5\%, $$ on peut (plutôt) penser (avec un risque de \(5\%\)) que la machine 1 est plus performante que son ancienne machine.
A propos de la régularité :

Hypothèses de test : \(\mathbf{H}_0:\) \(\sigma^2_{M1}=(35.4/2)^2\) vs \(\mathbf{H}_1:\) \(\sigma^2_{M1}<(35.4/2)^2\)
Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{\sigma^2_{M1},(35.4/2)^2} }\left({\mathbf{ { Y^{M1} } }}\right) = {\displaystyle \frac{\widehat{ \sigma^2_{M1} }\left({\mathbf{ { Y^{M1} } }}\right)-(35.4/2)^2}{ \widehat{ \sigma_{\widehat{ \sigma^2_{M1}}} }\left({\mathbf{ { Y^{M1} } }}\right) }} \underset{Approx.}{\leadsto} \mathcal{N}(0,1) \]
Règle de décision : Accepter \(\mathbf{H}_1\) si p-valeur (gauche) < \(5\%\)
Conclusion : puisqu'au vu des données, $$ p-valeur\overset{\mathtt{R}}{=}\mathtt{pnorm((var(yM1)-(35.4/2)^2)/seVar(yM1))} \simeq 0.0\% < 5\%, $$ on peut (plutôt) penser (avec un risque de \(5\%\)) que la machine 1 est plus régulière que son ancienne machine. Finalement, on peut conseiller au chef d'entreprise d'acheter la machine 1.

Partie 2
Le chef d'entreprise prêt à acheter la machine 1 reçoit la visite d'un second représentant vantant les mérites de sa machine (que l'on appellera bien évidemment machine 2) par rapport à toutes les autres existant sur le marché. Les machines 1 et 2 étant de prix équivalents, le chef d'entreprise convaincu par l'éloquence du représentant décide de tester cette seconde machine sur une période de $n^{M2}=50$ ($ Définissons par $\mu^{M2}$ et $\sigma_{M2}$, les caractéristiques de la machine 2. On stockera les productions quotidiennes sur 50 jours dans le vecteur $y^{M2}$, préalablement saisi en $\mathtt{R}$ sous le nom $\mathtt{yM2}$ :
R> yM2
 [1] 2025 2045 2017 2024 2016 2025 2023 2020 2008 2025 2017 2014 2024 2028 2009
[16] 2023 2024 2034 2023 2024 2029 2032 2013 2017 2019 2022 2023 2005 2031 2012
...
[31] 2014 2032 2018 2022 2035 2024 2034 2012 2017 2015 2020 2015 2018 2020 2033
[46] 2025 2026 2026 2023 2014


(1) Peut-on montrer que les productions moyennes des deux machines sont différentes ?
Réponse

A propos de la performance :

Préliminaire : puisque \(\mathtt{(mean(yM1)-mean(yM2)-0)}\simeq-191.75\) est du même signe (i.e. positif) que \(\mathtt{deltaEst.H0}\) (car p-valeur gauche inférieure à \(50\%\)), on a :
  • paramètre d'intérêt : \(d_\mu=\mu^{M1}-\mu^{M2}\)
  • sa future estimation : \(\widehat{ d_\mu }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right)=\widehat{ \mu^{M1} }\left({\mathbf{ { Y^{M1} } }}\right)-\widehat{ \mu^{M2} }\left({\mathbf{ { Y^{M2} } }}\right)\)

Hypothèses de test : \(\mathbf{H}_0:\) \(d_\mu=0\) vs \(\mathbf{H}_1:\) \(d_\mu\neq0\)
Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{d_\mu,0} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right) = {\displaystyle \frac{\widehat{ d_\mu }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right)-0}{ \widehat{ \sigma_{\widehat{ d_\mu}} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right) }} \underset{Approx.}{\leadsto} \mathcal{N}(0,1) \]
Règle de décision : Accepter \(\mathbf{H}_1\) si p-valeur (biltatérale) < \(5\%\)
Conclusion : puisqu'au vu des données, $$ p-valeur\overset{\mathtt{R}}{=}\mathtt{2*pnorm((mean(yM1)-mean(yM2)-0)/seDMean(yM1,yM2))} \simeq 0.0\% < 5\%, $$ on peut (plutôt) penser (avec un risque de \(5\%\)) que les productions moyennes des deux machines sont différentes.

(2) Peut-on montrer que la seconde machine produit plus (en moyenne) et plus régulièrement que la machine 1 ?
Performance
R> mean(yM2)
[1] 2021.88
R> mean(yM1)-mean(yM2)
[1] -191.75
R> # deltaEst.H0 <- (instruction R à fournir dans la rédaction)
R> deltaEst.H0
[1] -122.3457
R> pnorm(deltaEst.H0)
[1] 0


Régularité
R> var(yM2)
[1] 60.80163
R> var(yM1)-var(yM2)
[1] 63.2318
R> # deltaEst.H0 <- (instruction R à fournir dans la rédaction)
R> deltaEst.H0
[1] 2.992739
R> pnorm(deltaEst.H0)
[1] 0.9986176

Réponse

A propos de la performance :

Préliminaire : puisque \(\mathtt{(mean(yM1)-mean(yM2)-0)}\simeq-191.75\) est du même signe (i.e. positif) que \(\mathtt{deltaEst.H0}\) (car p-valeur gauche inférieure à \(50\%\)), on a :
  • paramètre d'intérêt : \(d_\mu=\mu^{M1}-\mu^{M2}\)
  • sa future estimation : \(\widehat{ d_\mu }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right)=\widehat{ \mu^{M1} }\left({\mathbf{ { Y^{M1} } }}\right)-\widehat{ \mu^{M2} }\left({\mathbf{ { Y^{M2} } }}\right)\)

Hypothèses de test : \(\mathbf{H}_0:\) \(d_\mu=0\) vs \(\mathbf{H}_1:\) \(d_\mu<0\)
Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{d_\mu,0} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right) = {\displaystyle \frac{\widehat{ d_\mu }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right)-0}{ \widehat{ \sigma_{\widehat{ d_\mu}} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right) }} \underset{Approx.}{\leadsto} \mathcal{N}(0,1) \]
Règle de décision : Accepter \(\mathbf{H}_1\) si p-valeur (gauche) < \(5\%\)
Conclusion : puisqu'au vu des données, $$ p-valeur\overset{\mathtt{R}}{=}\mathtt{pnorm((mean(yM1)-mean(yM2)-0)/seDMean(yM1,yM2))} \simeq 0.0\% < 5\%, $$ on peut (plutôt) penser (avec un risque de \(5\%\)) que les productions moyennes des deux machines sont différentes.
A propos de la régularité :

Préliminaire : puisque \(\mathtt{(var(yM1)-var(yM2)-0)}\simeq63.2318\) est du même signe (i.e. positif) que \(\mathtt{deltaEst.H0}\) (car p-valeur gauche inférieure à \(50\%\)), on a :
  • paramètre d'intérêt : \(d_{\sigma^2}=\sigma^2_{M1}-\sigma^2_{M2}\)
  • sa future estimation : \(\widehat{ d_{\sigma^2} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right)=\widehat{ \sigma^2_{M1} }\left({\mathbf{ { Y^{M1} } }}\right)-\widehat{ \sigma^2_{M2} }\left({\mathbf{ { Y^{M2} } }}\right)\)

Hypothèses de test : \(\mathbf{H}_0:\) \(d_{\sigma^2}=0\) vs \(\mathbf{H}_1:\) \(d_{\sigma^2}>0\)
Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{d_{\sigma^2},0} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right) = {\displaystyle \frac{\widehat{ d_{\sigma^2} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right)-0}{ \widehat{ \sigma_{\widehat{ d_{\sigma^2}}} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right) }} \underset{Approx.}{\leadsto} \mathcal{N}(0,1) \]
Règle de décision : Accepter \(\mathbf{H}_1\) si p-valeur (droite) < \(5\%\)
Conclusion : puisqu'au vu des données, $$ p-valeur\overset{\mathtt{R}}{=}\mathtt{1-pnorm((var(yM1)-var(yM2)-0)/seDVar(yM1,yM2))} \simeq 0.14\% < 5\%, $$ on peut (plutôt) penser (avec un risque de \(5\%\)) que la seconde machine produit plus régulièrement que la première.

(3) Peut-on montrer que la seconde machine produit 190 pièces de plus par jour (en moyenne) que la première ?

(4) La seconde machine est-elle 1.5 fois plus régulière (i.e. de variance 1.5 fois plus petite) que la première ?
R> (mean(yM1)-mean(yM2)+190)/seDMean(yM1,yM2)
[1] -1.116584
R> pnorm( (mean(yM1)-mean(yM2)+190)/seDMean(yM1,yM2) )
[1] 0.1320861
R> (var(yM1)/var(yM2)-1.5)/seRVar(yM1,yM2)
[1] 1.044032
R> pnorm((var(yM1)/var(yM2)-1.5)/seRVar(yM1,yM2))
[1] 0.8517646
R> pnorm((var(yM2)/var(yM1)-1/1.5)/seRVar(yM2,yM1))
[1] 0.07782401

Réponse

A propos de la performance :

Préliminaire : puisque \(\mathtt{(mean(yM1)-mean(yM2)--190)}\simeq-1.75\) est du même signe (i.e. positif) que \(\mathtt{deltaEst.H0}\) (car p-valeur gauche inférieure à \(50\%\)), on a :
  • paramètre d'intérêt : \(d_\mu=\mu^{M1}-\mu^{M2}\)
  • sa future estimation : \(\widehat{ d_\mu }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right)=\widehat{ \mu^{M1} }\left({\mathbf{ { Y^{M1} } }}\right)-\widehat{ \mu^{M2} }\left({\mathbf{ { Y^{M2} } }}\right)\)

Hypothèses de test : \(\mathbf{H}_0:\) \(d_\mu=-190\) vs \(\mathbf{H}_1:\) \(d_\mu<-190\)
Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{d_\mu,-190} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right) = {\displaystyle \frac{\widehat{ d_\mu }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right)-(-190)}{ \widehat{ \sigma_{\widehat{ d_\mu}} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right) }} \underset{Approx.}{\leadsto} \mathcal{N}(0,1) \]
Règle de décision : Accepter \(\mathbf{H}_1\) si p-valeur (gauche) < \(5\%\)
Conclusion : puisqu'au vu des données, $$ p-valeur\overset{\mathtt{R}}{=}\mathtt{pnorm((mean(yM1)-mean(yM2)-(-190))/seDMean(yM1,yM2))} \simeq 13.21\%\nless5\%, $$ on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que les productions moyennes des deux machines sont différentes.
A propos de la régularité :
une des deux possibilités suivantes est admise.
  • Cas où paramètre d'intérêt est : $r_{\sigma^2}=\displaystyle \frac{\sigma^2_{M1}}{\sigma^2_{M2}}$

  • Préliminaire : puisque \(\mathtt{(var(yM1)/var(yM2)-1.5)}\simeq0.5399688\) est du même signe (i.e. positif) que \(\mathtt{deltaEst.H0}\) (car p-valeur gauche inférieure à \(50\%\)), on a :
    • paramètre d'intérêt : \(r_{\sigma^2}=\displaystyle \frac{\sigma^2_{M1}}{\sigma^2_{M2}}\)
    • sa future estimation : \(\widehat{ r_{\sigma^2} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right)=\widehat{ \sigma^2_{M1} }\left({\mathbf{ { Y^{M1} } }}\right)/\widehat{ \sigma^2_{M2} }\left({\mathbf{ { Y^{M2} } }}\right)\)

    Hypothèses de test : \(\mathbf{H}_0:\) \(r_{\sigma^2}=1.5\) vs \(\mathbf{H}_1:\) \(r_{\sigma^2}>1.5\)
    Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{r_{\sigma^2},1.5} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right) = {\displaystyle \frac{\widehat{ r_{\sigma^2} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right)-1.5}{ \widehat{ \sigma_{\widehat{ r_{\sigma^2}}} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right) }} \underset{Approx.}{\leadsto} \mathcal{N}(0,1) \]
    Règle de décision : Accepter \(\mathbf{H}_1\) si p-valeur (droite) < \(5\%\)
    Conclusion : puisqu'au vu des données, $$ p-valeur\overset{\mathtt{R}}{=}\mathtt{1-pnorm((var(yM1)/var(yM2)-1.5)/seRVar(yM1,yM2))} \simeq 14.82\%\nless5\%, $$ on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que la seconde machine est de variance 1.5 fois plus petite que la première.
  • Cas où paramètre d'intérêt est : $r_{\sigma^2}=\displaystyle \frac{\sigma^2_{M2}}{\sigma^2_{M1}}$

  • Préliminaire : puisque \(\mathtt{(var(yM2)/var(yM1)-1/1.5)}\simeq-0.1764631\) est du même signe (i.e. positif) que \(\mathtt{deltaEst.H0}\) (car p-valeur gauche inférieure à \(50\%\)), on a :
    • paramètre d'intérêt : \(r_{\sigma^2}=\displaystyle \frac{\sigma^2_{M2}}{\sigma^2_{M1}}\)
    • sa future estimation : \(\widehat{ r_{\sigma^2} }\left({\mathbf{ { Y^{M2},Y^{M1} } }}\right)=\widehat{ \sigma^2_{M2} }\left({\mathbf{ { Y^{M2} } }}\right)/\widehat{ \sigma^2_{M1} }\left({\mathbf{ { Y^{M1} } }}\right)\)

    Hypothèses de test : \(\mathbf{H}_0:\) \(r_{\sigma^2}=1/1.5\) vs \(\mathbf{H}_1:\) \(r_{\sigma^2}<1/1.5\)
    Statistique de test sous \(\mathbf{H}_0\) : \[ \widehat{ \delta_{r_{\sigma^2},1/1.5} }\left({\mathbf{ { Y^{M2},Y^{M1} } }}\right) = {\displaystyle \frac{\widehat{ r_{\sigma^2} }\left({\mathbf{ { Y^{M2},Y^{M1} } }}\right)-1/1.5}{ \widehat{ \sigma_{\widehat{ r_{\sigma^2}}} }\left({\mathbf{ { Y^{M2},Y^{M1} } }}\right) }} \underset{Approx.}{\leadsto} \mathcal{N}(0,1) \]
    Règle de décision : Accepter \(\mathbf{H}_1\) si p-valeur (gauche) < \(5\%\)
    Conclusion : puisqu'au vu des données, $$ p-valeur\overset{\mathtt{R}}{=}\mathtt{pnorm((var(yM2)/var(yM1)-1/1.5)/seRVar(yM2,yM1))} \simeq 7.78\%\nless5\%, $$ on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que la seconde machine est de variance 1.5 fois plus petite que la première.