En 2000, une dictée (de niveau 3ème) a été proposée à un très grand nombre de futurs candidats au baccalauréat. A l'époque la note moyenne (calculée à partir de l'ensemble des candidats présents) obtenue était de $6.3$. Un professeur de français pense (et voudrait le vérifier rapidement en soumettant 30 lycéens choisis au hasard à cette dictée) que les nouvelles méthodes d'enseignement, les nouveaux programmes, les nouvelles préoccupations des lycéens,... ont un effet sur le niveau en orthographe des bacheliers actuels.
(1) On notera $\mu^D$ la note moyenne des bacheliers actuels soumis à la même dictée. Avec un risque d'erreur de première espèce (maximal) préfixé à $5\%$ ? Peut-on penser, au vu des données, que l'assertion d'intérêt du professeur de français est plutôt vraie ? (rédaction standard)
R>yD
[1] 9100105610811398300100069683
[26] 511500R> mean(yD)
[1] 4.566667R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] -2.278765
Réponse
Hypothèses de test : \(\mathbf{H}_0:\) \(\mu^{D}=6.3\) vs \(\mathbf{H}_1:\) \(\mu^{D}\neq6.3\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{\mu^{D},6.3} }\left({\mathbf{ { Y^{D} } }}\right) = {\displaystyle \frac{\widehat{ \mu^{D} }\left({\mathbf{ { Y^{D} } }}\right)-6.3}{
\widehat{ \sigma_{\widehat{ \mu^{D}}} }\left({\mathbf{ { Y^{D} } }}\right)
}} \underset{Approx.}{\leadsto} \mathcal{N}(0,1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
\(\widehat{ \delta_{\mu^{D},6.3} }\left({\mathbf{ { y^{D} } }}\right) < \delta^-_{lim,5\%}\) ou \(\widehat{ \delta_{\mu^{D},6.3} }\left({\mathbf{ { y^{D} } }}\right) > \delta^+_{lim,5\%}\)
Conclusion :
puisqu'au vu des données,
$$\begin{aligned}
\widehat{ \delta_{\mu^{D},6.3} }\left({\mathbf{ { y^{D} } }}\right) &\overset{\mathtt{R}}{=} \mathtt{(mean(yD)-6.3)/seMean(yD)}\simeq -2.278765\\& < \delta^-_{lim,5\%} \overset{\mathtt{R}}{=} \mathtt{-qnorm(1-.05/2)}\simeq-1.959964
\end{aligned}$$
on peut (plutôt) penser (avec un risque de \(5\%\)) que les nouvelles méthodes d'enseignement ont un effet sur le niveau en orthographe des bacheliers actuels.
(2) Avec le même risque d'erreur de première espèce, que peut-on dire de plus (pertinent) ? (une rédaction abrégée suffit)
Réponse
Affirmation d'intérêt : \(\mathbf{H}_1:\) \(\mu^{D}<6.3\)
Application numérique : puisqu'au vu des données,
$$\begin{aligned}
\widehat{ \delta_{\mu^{D},6.3} }\left({\mathbf{ { y^{D} } }}\right) &\overset{\mathtt{R}}{=} \mathtt{(mean(yD)-6.3)/seMean(yD)}\simeq -2.278765\\& < \delta^-_{lim,5\%} \overset{\mathtt{R}}{=} \mathtt{-qnorm(1-.05)}\simeq-1.644854
\end{aligned}$$
on peut (plutôt) penser (avec un risque de \(5\%\)) que les nouvelles méthodes d'enseignement permettent une amélioration sur le niveau en orthographe des bacheliers actuels.
(3) Le professeur de français s'interroge alors sur l'hétérogénéité des étudiants. En particulier, il souhaite montrer, au vu des données, que la variance des notes (notée $\sigma^2_D$) des bacheliers actuels est supérieure à celle qui avait été obtenue en 2000 (par le très grand nombre de futurs bacheliers de l'époque) et qui valait $10.8$. Rédigez sous forme standard un test d'hypothèses et conclure avec un risque d'erreur de première espèce (maximal) fixé à $5\%$ ?
R> var(yD)
[1] 17.35747R># deltaEst.H0 <- (instruction R à fournir dans la rédaction)R>deltaEst.H0
[1] 2.482891
Réponse
Hypothèses de test : \(\mathbf{H}_0:\) \(\sigma^2_{D}=10.8\) vs \(\mathbf{H}_1:\) \(\sigma^2_{D}>10.8\)
Statistique de test sous \(\mathbf{H}_0\) :
\[
\widehat{ \delta_{\sigma^2_{D},10.8} }\left({\mathbf{ { Y^{D} } }}\right) = {\displaystyle \frac{\widehat{ \sigma^2_{D} }\left({\mathbf{ { Y^{D} } }}\right)-10.8}{
\widehat{ \sigma_{\widehat{ \sigma^2_{D}}} }\left({\mathbf{ { Y^{D} } }}\right)
}} \underset{Approx.}{\leadsto} \mathcal{N}(0,1)
\]
Règle de décision : Accepter \(\mathbf{H}_1\) si
\(\widehat{ \delta_{\sigma^2_{D},10.8} }\left({\mathbf{ { y^{D} } }}\right) > \delta^+_{lim,5\%}\)
Conclusion :
puisqu'au vu des données,
$$\begin{aligned}
\widehat{ \delta_{\sigma^2_{D},10.8} }\left({\mathbf{ { y^{D} } }}\right) &\overset{\mathtt{R}}{=} \mathtt{(var(yD)-10.8)/seVar(yD)}\simeq 2.482891\\& > \delta^+_{lim,5\%} \overset{\mathtt{R}}{=} \mathtt{qnorm(1-.05)}\simeq1.644854
\end{aligned}$$
on peut (plutôt) penser (avec un risque de \(5\%\)) que la variance des notes des bacheliers actuels est supérieure à celle qui avait été obtenue en 2000.
(4) Même question (en ne donnant que la conclusion) avec $\alpha=1\%$.
Réponse
Affirmation d'intérêt : \(\mathbf{H}_1:\) \(\sigma^2_{D}>10.8\)
Application numérique : puisqu'au vu des données,
$$\begin{aligned}
\widehat{ \delta_{\sigma^2_{D},10.8} }\left({\mathbf{ { y^{D} } }}\right) &\overset{\mathtt{R}}{=} \mathtt{(var(yD)-10.8)/seVar(yD)}\simeq 2.482891\\& > \delta^+_{lim,5\%} \overset{\mathtt{R}}{=} \mathtt{qnorm(1-.05)}\simeq1.644854
\end{aligned}$$
on peut (plutôt) penser (avec un risque de \(5\%\)) que la variance des notes des bacheliers actuels est supérieure à celle qui avait été obtenue en 2000.
(5) A la vue de l'instruction ci-dessous, quelle(s) assertion(s) peut-on confirmer en tolérant un risque d'erreur de première espèce (maximal) fixé à $5\%$ ?
R> pnorm((var(yD)-12)/seVar(yD))
[1] 0.9787468
Réponse
Avec un risque $2.13\%$, on peut dire que $\sigma^2_D > 12$
Avec un risque $4.25\%$, on peut dire que $\sigma^2_D \neq 12$