Un chef d'entreprise désire changer son ancienne machine produisant des pièces d'un certain type au rythme moyen de $1214$ pièces par jour avec un écart-type de $35.4$ pièces par jour. Via l'Approche Expérimentale, ces caractéristiques correspondent respectivement à la moyenne et à l'écart-type des productions quotidiennes obtenues si on pouvait faire tourner cette machine pendant une infinité de jours (il est sous-entendu que le chef d'entreprise ne l'a constaté que pour une période de $m$ jours avec $m$ très très grand).
Partie 1
Un représentant lui propose une nouvelle machine (que l'on appellera machine 1) produisant des pièces du même type. Le chef d'entreprise souhaite l'acheter à condition qu'il soit assuré que cette machine 1 est d'une part plus performante (c'est à dire, de moyenne théorique une fois et demi plus grande que son ancienne machine de référence) et d'autre part plus régulière (c'est à dire, d'écart-type théorique deux fois plus petit que l'ancienne). Soient $\mu^{M1}$ et $\sigma_{M1}$, les caractéristiques de la machine 1 correspondant respectivement à la moyenne et à l'écart-type des productions quotidiennes obtenues si on pouvait faire tourner la machine 1 pendant une infinité de jours.
(1) Exprimer à partir de $\mu^{M1}$ et $\sigma^2_{M1}$ (ou $\sigma_{M1}$) les deux conditions d'achat de la nouvelle machine exprimées par le chef d'entreprise.
Réponse
Le chef d'entreprise décidera d'acheter la nouvelle machine si $\mu^{M1}>1.5\times 1214=1821$ et si $\sigma_{M1}^2 < (35.4/2)^2=313.29$.
Pour espérer connaître les ordres de grandeur de ces quantités inconnues, le chef d'entreprise demande au représentant une période d'essai de 100 jours. Le vecteur ${\mathbf{ y^{M1} }}=(y_1^{M1},y_2^{M1},\ldots,y_{100}^{M1})$ représente les nombres de pièces fabriquées pour chaque jour de cette période d'essai. Ce vecteur de données a été préalablement saisi dans le logiciel R sous le nom $\mathtt{yM1}$.
(2) Peut-on conseiller au chef d'entreprise d'acheter la machine 1 (lorsqu'on sait qu'il accepte que tout test statistique est généralement traité à un seuil de signification $\alpha=5\%$) ?
R> mean(yM1)
[1] 1830.13R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] 8.197877R> pnorm(deltaEst.H0)
[1] 1
Régularité
R> var(yM1)
[1] 124.0334R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] -11.41626R> pnorm(deltaEst.H0)
[1] 1.734226e-30
Réponse
A propos de la performance :
Hypothèses de test : \(\mathbf{H}_0:\) \(\mu^{M1}=1214*1.5\) vs \(\mathbf{H}_1:\) \(\mu^{M1}>1214*1.5\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{\mu^{M1},1214*1.5} }\left({\mathbf{ { Y^{M1} } }}\right) = {\displaystyle \frac{\widehat{ \mu^{M1} }\left({\mathbf{ { Y^{M1} } }}\right)-1214*1.5}{
\widehat{ \sigma_{\widehat{ \mu^{M1}}} }\left({\mathbf{ { Y^{M1} } }}\right)
}} \underset{Approx.}{\leadsto} \mathcal{N}(0,1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
p-valeur (droite) < \(5\%\)
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{1-pnorm((mean(yM1)-1214*1.5)/seMean(yM1))} \simeq 0.0\% < 5\%,
$$
on peut (plutôt) penser (avec un risque de \(5\%\)) que la machine 1 est plus performante que son ancienne machine.
A propos de la régularité :
Hypothèses de test : \(\mathbf{H}_0:\) \(\sigma^2_{M1}=(35.4/2)^2\) vs \(\mathbf{H}_1:\) \(\sigma^2_{M1}<(35.4/2)^2\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{\sigma^2_{M1},(35.4/2)^2} }\left({\mathbf{ { Y^{M1} } }}\right) = {\displaystyle \frac{\widehat{ \sigma^2_{M1} }\left({\mathbf{ { Y^{M1} } }}\right)-(35.4/2)^2}{
\widehat{ \sigma_{\widehat{ \sigma^2_{M1}}} }\left({\mathbf{ { Y^{M1} } }}\right)
}} \underset{Approx.}{\leadsto} \mathcal{N}(0,1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
p-valeur (gauche) < \(5\%\)
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{pnorm((var(yM1)-(35.4/2)^2)/seVar(yM1))} \simeq 0.0\% < 5\%,
$$
on peut (plutôt) penser (avec un risque de \(5\%\)) que la machine 1 est plus régulière que son ancienne machine.
Finalement, on peut conseiller au chef d'entreprise d'acheter la machine 1.
Partie 2 Le chef d'entreprise prêt à acheter la machine 1 reçoit la visite d'un second représentant vantant les mérites de sa machine (que l'on appellera bien évidemment machine 2) par rapport à toutes les autres existant sur le marché. Les machines 1 et 2 étant de prix équivalents, le chef d'entreprise convaincu par l'éloquence du représentant décide de tester cette seconde machine sur une période de $n^{M2}=50$ ($
Définissons par $\mu^{M2}$ et $\sigma_{M2}$, les caractéristiques de la machine 2. On stockera les productions quotidiennes sur 50 jours dans le vecteur $y^{M2}$, préalablement saisi en $\mathtt{R}$ sous le nom $\mathtt{yM2}$ :
(1) Peut-on montrer que les productions moyennes des deux machines sont différentes ?
Réponse
A propos de la performance :
Préliminaire : puisque \(\mathtt{(mean(yM1)-mean(yM2)-0)}\simeq-191.75\) est du même signe (i.e. positif) que \(\mathtt{deltaEst.H0}\) (car p-valeur gauche inférieure à \(50\%\)), on a :
Hypothèses de test : \(\mathbf{H}_0:\) \(d_\mu=0\) vs \(\mathbf{H}_1:\) \(d_\mu\neq0\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{d_\mu,0} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right) = {\displaystyle \frac{\widehat{ d_\mu }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right)-0}{
\widehat{ \sigma_{\widehat{ d_\mu}} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right)
}} \underset{Approx.}{\leadsto} \mathcal{N}(0,1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
p-valeur (biltatérale) < \(5\%\)
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{2*pnorm((mean(yM1)-mean(yM2)-0)/seDMean(yM1,yM2))} \simeq 0.0\% < 5\%,
$$
on peut (plutôt) penser (avec un risque de \(5\%\)) que les productions moyennes des deux machines sont différentes.
(2) Peut-on montrer que la seconde machine produit plus (en moyenne) et plus régulièrement que la machine 1 ?
Performance
R> mean(yM2)
[1] 2021.88R> mean(yM1)-mean(yM2)
[1] -191.75R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] -122.3457R> pnorm(deltaEst.H0)
[1] 0
Régularité
R> var(yM2)
[1] 60.80163R> var(yM1)-var(yM2)
[1] 63.2318R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] 2.992739R> pnorm(deltaEst.H0)
[1] 0.9986176
Réponse
A propos de la performance :
Préliminaire : puisque \(\mathtt{(mean(yM1)-mean(yM2)-0)}\simeq-191.75\) est du même signe (i.e. positif) que \(\mathtt{deltaEst.H0}\) (car p-valeur gauche inférieure à \(50\%\)), on a :
Hypothèses de test : \(\mathbf{H}_0:\) \(d_\mu=0\) vs \(\mathbf{H}_1:\) \(d_\mu<0\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{d_\mu,0} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right) = {\displaystyle \frac{\widehat{ d_\mu }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right)-0}{
\widehat{ \sigma_{\widehat{ d_\mu}} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right)
}} \underset{Approx.}{\leadsto} \mathcal{N}(0,1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
p-valeur (gauche) < \(5\%\)
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{pnorm((mean(yM1)-mean(yM2)-0)/seDMean(yM1,yM2))} \simeq 0.0\% < 5\%,
$$
on peut (plutôt) penser (avec un risque de \(5\%\)) que les productions moyennes des deux machines sont différentes.
A propos de la régularité :
Préliminaire : puisque \(\mathtt{(var(yM1)-var(yM2)-0)}\simeq63.2318\) est du même signe (i.e. positif) que \(\mathtt{deltaEst.H0}\) (car p-valeur gauche inférieure à \(50\%\)), on a :
Hypothèses de test : \(\mathbf{H}_0:\) \(d_{\sigma^2}=0\) vs \(\mathbf{H}_1:\) \(d_{\sigma^2}>0\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{d_{\sigma^2},0} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right) = {\displaystyle \frac{\widehat{ d_{\sigma^2} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right)-0}{
\widehat{ \sigma_{\widehat{ d_{\sigma^2}}} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right)
}} \underset{Approx.}{\leadsto} \mathcal{N}(0,1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
p-valeur (droite) < \(5\%\)
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{1-pnorm((var(yM1)-var(yM2)-0)/seDVar(yM1,yM2))} \simeq 0.14\% < 5\%,
$$
on peut (plutôt) penser (avec un risque de \(5\%\)) que la seconde machine produit plus régulièrement que la première.
(3) Peut-on montrer que la seconde machine produit 190 pièces de plus par jour (en moyenne) que la première ?
(4) La seconde machine est-elle 1.5 fois plus régulière (i.e. de variance 1.5 fois plus petite) que la première ?
Préliminaire : puisque \(\mathtt{(mean(yM1)-mean(yM2)--190)}\simeq-1.75\) est du même signe (i.e. positif) que \(\mathtt{deltaEst.H0}\) (car p-valeur gauche inférieure à \(50\%\)), on a :
Hypothèses de test : \(\mathbf{H}_0:\) \(d_\mu=-190\) vs \(\mathbf{H}_1:\) \(d_\mu<-190\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{d_\mu,-190} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right) = {\displaystyle \frac{\widehat{ d_\mu }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right)-(-190)}{
\widehat{ \sigma_{\widehat{ d_\mu}} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right)
}} \underset{Approx.}{\leadsto} \mathcal{N}(0,1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
p-valeur (gauche) < \(5\%\)
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{pnorm((mean(yM1)-mean(yM2)-(-190))/seDMean(yM1,yM2))} \simeq 13.21\%\nless5\%,
$$
on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que les productions moyennes des deux machines sont différentes.
A propos de la régularité : une des deux possibilités suivantes est admise.
Cas où paramètre d'intérêt est : $r_{\sigma^2}=\displaystyle \frac{\sigma^2_{M1}}{\sigma^2_{M2}}$
Préliminaire : puisque \(\mathtt{(var(yM1)/var(yM2)-1.5)}\simeq0.5399688\) est du même signe (i.e. positif) que \(\mathtt{deltaEst.H0}\) (car p-valeur gauche inférieure à \(50\%\)), on a :
Hypothèses de test : \(\mathbf{H}_0:\) \(r_{\sigma^2}=1.5\) vs \(\mathbf{H}_1:\) \(r_{\sigma^2}>1.5\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{r_{\sigma^2},1.5} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right) = {\displaystyle \frac{\widehat{ r_{\sigma^2} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right)-1.5}{
\widehat{ \sigma_{\widehat{ r_{\sigma^2}}} }\left({\mathbf{ { Y^{M1},Y^{M2} } }}\right)
}} \underset{Approx.}{\leadsto} \mathcal{N}(0,1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
p-valeur (droite) < \(5\%\)
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{1-pnorm((var(yM1)/var(yM2)-1.5)/seRVar(yM1,yM2))} \simeq 14.82\%\nless5\%,
$$
on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que la seconde machine est de variance 1.5 fois plus petite que la première.
Cas où paramètre d'intérêt est : $r_{\sigma^2}=\displaystyle \frac{\sigma^2_{M2}}{\sigma^2_{M1}}$
Préliminaire : puisque \(\mathtt{(var(yM2)/var(yM1)-1/1.5)}\simeq-0.1764631\) est du même signe (i.e. positif) que \(\mathtt{deltaEst.H0}\) (car p-valeur gauche inférieure à \(50\%\)), on a :
Hypothèses de test : \(\mathbf{H}_0:\) \(r_{\sigma^2}=1/1.5\) vs \(\mathbf{H}_1:\) \(r_{\sigma^2}<1/1.5\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{r_{\sigma^2},1/1.5} }\left({\mathbf{ { Y^{M2},Y^{M1} } }}\right) = {\displaystyle \frac{\widehat{ r_{\sigma^2} }\left({\mathbf{ { Y^{M2},Y^{M1} } }}\right)-1/1.5}{
\widehat{ \sigma_{\widehat{ r_{\sigma^2}}} }\left({\mathbf{ { Y^{M2},Y^{M1} } }}\right)
}} \underset{Approx.}{\leadsto} \mathcal{N}(0,1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
p-valeur (gauche) < \(5\%\)
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{pnorm((var(yM2)/var(yM1)-1/1.5)/seRVar(yM2,yM1))} \simeq 7.78\%\nless5\%,
$$
on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que la seconde machine est de variance 1.5 fois plus petite que la première.