Résumé de Cours Statistique Inférentielle

Probabilité (A.M.P. vs A.E.P.)

Estimation par Intervalle de Confiance

  1. Construction: l'intervalle de confiance $IC_\mu(\boldsymbol{y})=[\widetilde{\mu}_{\inf}(\boldsymbol{y}),\widetilde{\mu}_{\sup}(\boldsymbol{y})]$ du jour J à $1-\alpha$ ($=95\%$ si $\alpha$ non précisé) niveau de confiance, est obtenu comme l'estimation $\widehat\mu(\boldsymbol{y_{[\cdot]}})$ à une marge d'erreur près qui se décompose comme le produit de:
    • quantile d'ordre $1-\frac\alpha2$ d'une loi Normale (centrée réduite): $\delta_{lim,\frac \alpha 2}^{+}\simeq q_{1-\frac\alpha2}(\mathcal{N}(0,1))$ permettant de sélectionner la proportion $1-\alpha$ des meilleurs écarts standardisés $\left(\delta_{\widehat \mu,\mu}\left(\boldsymbol{y_{[\cdot]}}\right)\right)_{+\infty}:=\left(\frac{\widehat{\mu}(\boldsymbol{y_{[\cdot]}})-\mu}{\widehat{\sigma_{\widehat\mu}}(\boldsymbol{y_{[\cdot]}})}\right)_{+\infty}$ naturellement situés dans l'intervalle $[-\delta_{lim,\frac \alpha 2}^{+},\delta_{lim,\frac \alpha 2}^{+}]$
    • erreur standard $\widehat{\sigma_{\widehat\mu}}(\boldsymbol{y})$: estimation (fournie via l'instruction R $\mathtt{seMean(y)}$) de la qualité d'estimation $\sigma_{\widehat\mu}:=\overleftrightarrow{\left(\widehat{\mu}(\boldsymbol{y_{[\cdot]}})\right)}_{+\infty}$ (que l'on espère généralement raisonnablement petite et qui est égale à $\frac{\sigma}{\sqrt n}$)
  2. Mathématiquement: $IC_\mu(\boldsymbol{y})=[\widetilde{\mu}_{\inf}(\boldsymbol{y}),\widetilde{\mu}_{\sup}(\boldsymbol{y})]=\widehat{\mu}(\boldsymbol{y})\mp \delta_{lim,\frac \alpha 2}^{+} \times \widehat{\sigma_{\widehat\mu}}(\boldsymbol{y})$
  3. En français: Intervalle de confiance (à $1-\alpha=95\%$) est égale à Estimation plus ou moins 2 fois Erreur standard
  4. Instruction R ($1-\alpha=95\%$): $\quad\mathtt{mean(y)+c(-1,1)*qnorm(.975)*seMean(y)}$ (où $\mathtt{qnorm(.975)*seMean(y)}$ correspond à la marge d'erreur)
  5. Interprétation: l'intervalle de confiance $IC_\mu(\boldsymbol{y})$, obtenu le jour J, est l'un parmi tous les intervalles de confiance $\left(IC_\mu(\boldsymbol{y_{[\cdot]}})\right)_{+\infty}$ que l'on aurait pu construire le jour J dont on sait qu'approximativement $1-\alpha$ (en général 95%) contiendraient le vrai paramètre d'intérêt INCONNU $\mu$
  6. Graphiquement: TODO (Graphiques côte à côte des écarts standardisés et estimations avec $m=100$ intervalles de confiances)

Outil d'Aide à la Décision

  1. Affirmation d'intérêt ($\mathbf{H_1}$) (dépendant de la population) :
    • directement à partir du paramètre d'intérêt : $\mu > \mu_0$
    • indirectement à partir du paramètre d'écart (standardisé) : $\delta_{\mu,\mu_0}>0$ avec $\delta_{\mu,\mu_0}:=\displaystyle\frac{\mu-\mu_0}{\sigma_{\widehat\mu}}$
    • Remarques : dans l'expression de l'affirmation d'intérêt,
      • la valeur de référence $\mu_0$ est extraite de la problématique traitée (exemple: pour faciliter la compréhension, choisir par la suite $\mu_0=0.15$ comme dans la problématique du produit B, l'affirmation d'intérêt exprimant la rentabilité du produit B)
      • la comparaison '$>$' peut être remplacée selon la problématique par '$<$' ou '$\neq$'
      • dans ce cours d'autres problématiques sont envisagées consistant à remplacer le paramètre d'intérêt (noté $\theta$ dans le cadre général), ici la moyenne $\mu$, par une proportion $p$, variance $\sigma^2$ (et bien d'autres types de paramètres), le paramètre d'écart (entre le paramètre d'intérêt et la valeur de référence) pouvant alors s'écrire sous une forme différente (voir polycopié de cours).
  2. Règle de Décision (au vu de l'échantillon): Accepter $\mathbf{H_1}$ si $\widehat{\delta_{\mu,\mu_0}}(\boldsymbol{y})>\delta_{lim,5\%}^+$
    avec
    • $\widehat{\delta_{\mu,\mu_0}}(\boldsymbol{y}):=\frac{\widehat{\mu}(\boldsymbol{y})-\mu_0}{\widehat{\sigma_{\widehat\mu}}(\boldsymbol{y})}$ l'estimation du paramètre d'écart s'exprimant en fonction de l'estimation (du paramètre d'intérêt) et son erreur standard
    • $\delta_{lim,5\%}^+$ le seuil limite à DETERMINER pour finaliser la règle de décision (dans la notation, "lim" exprime la notion de seuil limite, "+" à franchir par la droite et "-" par la gauche, $\alpha=5\%$ correspond au maximum d'erreur de décision que l'on se fixe)
    Commentaires:
    • cette expression de la Règle de Décision : $\widehat{\delta_{\mu,\mu_0}}(\boldsymbol{y})>\delta_{lim,5\%}^+$ est naturellement l'analogue de l'affirmation d'intérêt ($\mathbf{H_1}$: $\delta_{\mu,\mu_0}>0$) exprimée cette fois à partir de l'échantillon remplaçant naturellement la population (exemple: exprimant la décision du lancement du produit B, c-à-d la rentabilité du produit B, à partir de l'échantillon )
    • puisqu'utilisé à partir de l'information partielle qu'est l'échantillon, le seuil limite $\delta_{lim,\alpha}^+$ joue donc le rôle d'un remplaçant du seuil limite 0 qui lui est appliqué sur la population totale; ici dans notre exemple, il doit donc être bien supérieur à 0 (exprimé en langage mathématique par $\delta_{lim,\alpha}^+>>0$) si le risque maximal d'erreur de décision $\alpha$ envisagé est choisi raisonnablement petit (en général, $\alpha=5\%$).
  3. Erreurs de décision
    Comme dans la VRAIE SITUATION (relative à la population), le paramètre d'intérêt (et ainsi le paramètre d'écart) est INCONNU, on envisage tour à tour les erreurs de décision selon les différentes SITUATIONS POSSIBLES:
    • MAUVAISES SITUATIONS (non $\mathbf{H_1}$: $\mu\ngtr \mu_0\Leftrightarrow \delta_{\mu,\mu_0}\ngtr0 \Longleftrightarrow \mu\leq \mu_0\Leftrightarrow \delta_{\mu,\mu_0}\leq0$): erreurs de type I obtenue dès lors que l'échantillon $\boldsymbol{y}$ permet d'accepter $\mathbf{H_1}$, à savoir $\widehat{\delta_{\mu,\mu_0}}(\boldsymbol{y})>\delta_{lim,5\%}^+$ (exemple: pour le produit B cela correspond à devenir pauvre)
    • BONNES SITUATIONS ($\mathbf{H_1}$: $\mu>\mu_0\Leftrightarrow \delta_{\mu,\mu_0}>0$): erreurs de type II obtenue dès lors que l'échantillon $\boldsymbol{y}$ permet de ne pas accepter $\mathbf{H_1}$, à savoir $\widehat{\delta_{\mu,\mu_0}}(\boldsymbol{y})\ngtr\delta_{lim,5\%}^+$ (exemple: pour le produit B cela correspond à ne pas devenir riche)
  4. Risques d'erreurs (de décision) et Pire des situations
    Grâce au TCL (Théorème Central limite), on peut représenter graphiquement les risques (probabilités) des erreurs de décision et s'apercevoir que
    • Le risque de Type I est maximal dans la PIRE (DES MAUVAISES) SITUATION(S) ($\mathbf{H_0}$: $\mu=\mu_0\Leftrightarrow \delta_{\mu,\mu_0}=0$) puisqu'il est toujours plus grand qu'un Risque de type I dans une MAUVAISES SITUATIONS (non $\mathbf{H_1}$: $\mu\leq \mu_0\Leftrightarrow \delta_{\mu,\mu_0}\leq0$)
    • Le risque de Type II est d'autant plus grand que la BONNE SITUATION ($\mathbf{H_1}$: $\mu>\mu_0\Leftrightarrow \delta_{\mu,\mu_0}>0$) est proche de la PIRE DES SITUATIONS $\mathbf{H_0}$. Ainsi les Risques maximaux de type I et II ne peuvent être fixés petits car leur somme est aussi proche de 100% que désiré.
    • La Règle de Décision ne permet donc de ne contrôler que le Risque (d'erreurs de décision) de type I considéré comme le plus important à contrôler.
    • Question: Pourquoi se place-t'on dans la PIRE DES SITUATIONS pour construire la Règle de Décision ?
      Réponse: car le Risque de type I est maximal.
  5. Formulation de la Règle de Décision par la Détermination du seuil limite
    • La finalisation de la construction de la Règle de Décision s'obtient par la détermination du seuil limite $\delta_{lim,5\%}^+$ comme le quantile d'ordre 95% d'une loi $\mathcal{N}(0,1)$ qui représente le $[+\infty]$-histogramme de tous les écarts estimés $\left(\widehat{\delta_{\mu,\mu_0}}(\boldsymbol{y_{[.]}})\right)_{+\infty}$ dans la PIRE DES SITUATIONS $\mathbf{H_0}$.
    • Formulation de la Règle de Décision: Accepter $\mathbf{H_1}$ si $\widehat{\delta_{\mu,\mu_0}}(\boldsymbol{y})>\delta_{lim,5\%}^+$
    • En R et sur l'exemple du produit B, on a $\widehat{\delta_{\mu^B,0.15}}(\boldsymbol{y})=\texttt{(mean(yB)-0.15)/seMean(yB))}\simeq 1.24\ngtr \delta_{lim,5\%}^+=\texttt{qnorm(0.95)}\simeq 1.645$
  6. (Re)formulation de la Règle de Décision par la p-valeur
    • Une fois l'échantillon $\boldsymbol{y}$ obtenu, on peut appliquer la Règle de Décision et conclure. En revanche, une reformulation de la Règle de Décision apparaît naturelle dès lors qu'on se propose de modifier le niveau du risque maximal de type I (en général fixé à $5\%$) traduit par la question suivante:
      Question: Quel est le (plus petit) risque (maximal de type I) à prendre pour accepter l'affirmation d'intérêt $\mathbf{H_1}$ au vu des données (échantillon)?
      Réponse: C'est la p-valeur qui s'obtient dans le cas étudié comme la proportion de tous les écarts estimés $\left(\widehat{\delta_{\mu,\mu_0}}(\boldsymbol{y_{[.]}})\right)_{+\infty}$ dans la PIRE DES SITUATIONS $\mathbf{H_0}$ à droite de (plus grand que) celui $\widehat{\delta_{\mu,\mu_0}}(\boldsymbol{y})$ observé pour la VRAIE SITUATION $\mu$ du jour J
    • Reformulation de la Règle de Décision: Accepter $\mathbf{H_1}$ si $p-valeur < 5\%$ (à savoir le risque pour accpeter l'affirmation d'intérêt est raisonnablement petit)
    • En R et sur l'exemple du produit B, on a $p-valeur=\texttt{1-pnorm((mean(yB)-0.15)/seMean(yB))}\simeq 10.74\%$