Un expérimentateur veut savoir si les femmes conduisent mieux que les
hommes au vu des notes de conduite suivantes :
Hommes : 24,28,29,29,34,36,40,41 et 60.
Femmes : 21,31,34,37,38,39,42,43,44,50 et 51.
Nous supposerons que $Y^{H}\leadsto N\left( \mu^{H} ,\sigma_{H} \right) $ et $Y^{F}\leadsto N\left( \mu^{F},\sigma_{F} \right) $, et nous choisirons un seuil de signification de $5\%$.
R>yH
[1] 242829293436404160R>yF
[1] 2131343738394243445051R> mean(yH)
[1] 35.66667R> mean(yF)
[1] 39.09091R> sd(yH)
[1] 10.75872R> sd(yF)
[1] 8.561011R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] -0.7935825R> pt(deltaEst.H0,18)
[1] 0.2188878
Réponse
Préliminaire : puisque \(\mathtt{(mean(yH)-mean(yF)-0)}\simeq-3.424242\) est du même signe (i.e. négatif) que \(\mathtt{deltaEst.H0}\) (car p-valeur gauche inférieure à \(50\%\)), on a :
Hypothèses de test : \(\mathbf{H}_0:\) \(d_\mu=0\) vs \(\mathbf{H}_1:\) \(d_\mu<0\)
Statistique de test sous \(\mathbf{H}_0\) :
$$
\widehat{ \delta_{d_\mu,0} }\left({\mathbf{ { Y^{H},Y^{F} } }}\right) = {\displaystyle \frac{\widehat{ d_\mu }\left({\mathbf{ { Y^{H},Y^{F} } }}\right)-0}{
\widehat{ \sigma_{\widehat{ d_\mu}} }\left({\mathbf{ { Y^{H},Y^{F} } }}\right)
}} \leadsto \mathcal{S}t(9+11-2)
$$
Règle de décision : Accepter \(\mathbf{H}_1\) si
p-valeur (gauche) < \(5\%\)
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{pt((mean(yH)-mean(yF)-0)/seDMeanG(yH,yF),18)} \simeq 21.89\%\nless5\%,
$$
on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que les femmes conduisent mieux que les hommes.
Traitement hors exercice pour vérifier si l'hypothèse sur l'égalité des variances de X et Y n'était pas abusive :
R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] 1.579323R> pf(deltaEst.H0,8,10)
[1] 0.7550565
Hypothèses de test : \(\mathbf{H}_0:\) \(r_{\sigma^2}=1\) vs \(\mathbf{H}_1:\) \(r_{\sigma^2}\neq1\)
Statistique de test sous \(\mathbf{H}_0\) :
$$
\widehat{ \delta_{r_{\sigma^2},1} }\left({\mathbf{ { Y^{H},Y^{F} } }}\right) = {\displaystyle \frac{\widehat{ r_{\sigma^2} }\left({\mathbf{ { Y^{H},Y^{F} } }}\right)}{1}} \leadsto \mathcal{F}(9-1,11-1)
$$
Règle de décision : Accepter \(\mathbf{H}_1\) si
p-valeur (biltatérale) < \(5\%\)
Conclusion :
puisqu'au vu des données,
$$
p-valeur\overset{\mathtt{R}}{=}\mathtt{2*(1-pf((var(yH)/var(yF))/1,8,10))} \simeq 48.99\%\nless5\%,
$$
on NE peut PAS (plutôt) penser (avec un risque de \(5\%\)) que les variances des notes sont différentes.