Teorema de Cochran

En estadística, el teorema de Cochran, creado por William G. Cochran, es un teorema utilizado para justificar los resultados relacionados con las distribuciones de probabilidad de estadísticas que se utilizan en el análisis de varianza.[1][2]

Teorema

Sean U 1 , U 2 , , U n {\displaystyle U_{1},U_{2},\dots ,U_{n}} variables aleatorias normales independientes e idénticamente distribuidas y que existen matrices semipositivas definidas B ( 1 ) , B ( 2 ) , , B ( k ) {\displaystyle B^{(1)},B^{(2)},\dots ,B^{(k)}} con

i = 1 K B ( i ) = I N {\displaystyle \sum _{i=1}^{K}B^{(i)}=I_{N}}

y supóngase que r 1 + r 2 + + r k = N {\displaystyle r_{1}+r_{2}+\cdots +r_{k}=N} donde r i {\displaystyle r_{i}} es el rango de B ( i ) {\displaystyle B^{(i)}} , si escribimos

Q i = j = 1 N φ = 1 N U j B j , φ ( i ) U φ {\displaystyle Q_{i}=\sum _{j=1}^{N}\sum _{\varphi =1}^{N}U_{j}B_{j,\varphi }^{(i)}U_{\varphi }}

entonces Q i {\displaystyle Q_{i}} es una forma cuadrática entonces el teorema de Cochran enuncia que las Q i s {\displaystyle Q_{i}'s} con i = 1 , 2 , , N {\displaystyle i=1,2,\dots ,N} son independientes y cada Q i {\displaystyle Q_{i}} tiene una distribución Chi-Cuadrada con r i {\displaystyle r_{i}} grados de libertad, esto es, Q i χ r i 2 {\displaystyle Q_{i}\sim \chi _{r_{i}}^{2}} .

En regresión lineal

Sean Y N n ( 0 , σ 2 I n ) {\displaystyle Y\sim N_{n}(0,\sigma ^{2}I_{n})} un vector aleatorio con distribución normal multivariada, donde I n {\displaystyle I_{n}} denota la matriz identidad de tamaño n × n {\displaystyle n\times n} , y A 1 , A 2 , , A k {\displaystyle A_{1},A_{2},\dots ,A_{k}} matrices simétricas de tamaño n × n {\displaystyle n\times n} con

i = 1 k A i = I n {\displaystyle \sum _{i=1}^{k}A_{i}=I_{n}}

entonces una de las siguientes condiciones implica las siguientes dos:

i = 1 k Rank ( A i ) = n {\displaystyle \sum _{i=1}^{k}\operatorname {Rank} (A_{i})=n}
Y T A i Y σ 2 χ Rank ( A i ) 2 {\displaystyle Y^{T}A_{i}Y\sim \sigma ^{2}\chi _{\operatorname {Rank} (A_{i})}^{2}}
Y T A i Y {\displaystyle Y^{T}A_{i}Y} es independiente de Y T A j Y {\displaystyle Y^{T}A_{j}Y} para i j {\displaystyle i\neq j} .

Estimación de la varianza

Para estimar la varianza σ 2 {\displaystyle \sigma ^{2}} , un estimador usado es el estimador por máxima verosimilitud de la varianza de una distribución normal

σ ^ 2 = 1 n i = 1 n ( X i X ¯ ) 2 {\displaystyle {\widehat {\sigma }}^{2}={\frac {1}{n}}\sum _{i=1}^{n}\left(X_{i}-{\bar {X}}\right)^{2}}

el teorema de Cochran demuestra que

n σ ^ 2 σ 2 χ n 1 2 {\displaystyle {\frac {n{\widehat {\sigma }}^{2}}{\sigma ^{2}}}\sim \chi _{n-1}^{2}}

y por las propiedades de la distribución Chi-Cuadrada se tiene que

E [ n σ ^ 2 σ 2 ] = E [ χ n 1 2 ] n σ 2 E [ σ ^ 2 ] = n 1 E [ σ ^ 2 ] = σ 2 ( n 1 ) n {\displaystyle {\begin{aligned}\operatorname {E} \left[{\frac {n{\widehat {\sigma }}^{2}}{\sigma ^{2}}}\right]&=\operatorname {E} [\chi _{n-1}^{2}]\\{\frac {n}{\sigma ^{2}}}\operatorname {E} \left[{\widehat {\sigma }}^{2}\right]&=n-1\\\operatorname {E} \left[{\widehat {\sigma }}^{2}\right]&={\frac {\sigma ^{2}(n-1)}{n}}\end{aligned}}}

Referencias

  1. Cochran, W. G. (Abril de 1934). «The distribution of quadratic forms in a normal system, with applications to the analysis of covariance». Mathematical Proceedings of the Cambridge Philosophical Society 30 (2): 178-191. doi:10.1017/S0305004100016595. 
  2. Bapat, R. B. (2000). Linear Algebra and Linear Models (Second edición). Springer. ISBN 978-0-387-98871-9. 

Bibliografía

  • Gut, Allan. An intermediate course in probability. Springer-Verlag New York, Inc. (1995). Pag. 141-142. Traducción libre realizada en la clase de Principios de Ingeniería de Información. Escuela de Ingeniería Industrial. Universidad de Carabobo. Venezuela. Jueves 13-05-2010; Prof. Ángel Carnevali, Brs: Oscar Mistage, Luis Bolívar, Luis Latuff, Karin Sanchez, Giuliano Salvadori, Carlos Páez.
Control de autoridades
  • Proyectos Wikimedia
  • Wd Datos: Q599876
  • Wd Datos: Q599876