Distribución de gaussianas conjuntas condicionadas a su suma

Dejar X = ( X 1 , X 2 , , X norte ) ser conjuntamente gaussiano con el vector medio m y matriz de covarianza Σ . Dejar S sea ​​su suma.

Sé que la distribución de cada X i S = s también es gaussiano.

Cuando norte = 2 , Yo sé eso

mi ( X 1 S = s ) = s σ 1 2 σ 1 2 + σ 2 2
y
V ( X 1 S = s ) = σ 1 2 σ 2 2 σ 1 2 + σ 2 2
(ver aquí y aquí ). Probablemente podría resolver expresiones análogas para un arbitrario norte si me sentara con lápiz y papel y trabajara un poco.

Lo que quiero saber es, ¿ cuál es la distribución de X dado S = s ?

Sé que esto no puede ser gaussiano, ya que la suma está acotada. Claramente no es Dirichlet ni nada parecido a Dirichlet, ya que las distribuciones marginales son gaussianas. Pero más allá de eso no tengo ni idea.

Creo que debería ser un ( norte 1 ) distribución gaussiana -dimensional que se apoya en el hiperplano { X : X 1 + + X norte = s } . La suma X 1 + + X norte está acotado, pero la suma X 1 + + X norte 1 no es.
@MikeEarnest que me parece una distribución diferente, condicional a ambos S = s y X i = X para algunos i .

Respuestas (2)

Sea A una matriz determinista de tamaño norte × norte y deja v ser un vector de tamaño norte . El vector aleatorio ( A X , S ) es en conjunto normal. La idea es construir ambos

  1. una matriz A tal que A X es independiente de S , y
  2. un vector v tal que X = A X + S v .

¿Por qué? Entonces por independencia tenemos una descripción clara como el cristal de la distribución de X dado S = s : La distribución de X dado S = s es normal

norte ( s v + A m , A Σ A T )
.

Ahora vamos a encontrar tal A y v .

  • Desde ( A X , S ) son conjuntamente normales, A X es independiente de S si y solo si su matriz de covarianza es cero, es decir, mi [ A ( X m ) ( S mi [ S ] ) ] = 0 . Si tu = ( 1 , . . . , 1 ) R norte , esto es equivalente a mi [ A ( X m ) ( X m ) T tu ] = A Σ tu = 0 .
  • Para v , la relación X = A X + v S está satisfecho siempre que I norte = A + v tu T , donde de nuevo tu es el vector ( 1 , . . . , 1 ) . Desde A Σ tu = 0 , multiplicando esto por Σ tu implica que
    v = 1 tu T Σ tu Σ tu .
    Ahora configura
    A = I norte v tu T .
    Uno fácilmente verifica que tal elección de A de hecho satisface A Σ tu = 0 , y hemos construido A y v que satisfagan los requisitos.

De manera más general: la distribución de X dado tu X = b para alguna matriz tu

Si tu es un k × norte matriz de rango k y nos gustaría encontrar la distribución de X condicionalmente en tu X , la misma técnica se puede extender.

(En el ejemplo anterior, tu es un 1 × norte matriz igual a tu T .)

Procedemos de manera similar: buscamos la matriz determinista A y un norte × k matriz C tal que

  1. A X y tu X son independientes y
  2. I norte = A + C tu de modo que X = A X + C tu X siempre aguanta.

¿Por qué? Si podemos encontrar tales matrices A y C , entonces la distribución de X dado tu X = b es normal

norte ( A m + C b , A T Σ A ) .

Desde A X y tu X son conjuntamente Normales, la primera condición se cumple si y sólo si mi [ A ( X m ) ( tu ( X m ) ) T ] = A Σ tu T = 0 . Multiplicando la segunda condición por Σ tu T , debe ser eso Σ tu T = C tu Σ tu T , por eso

C = Σ tu T ( tu Σ tu T ) 1 .

Finalmente, defina

A = I norte C tu ,
y comprobar que esta elección de A y C de hecho satisfacer A Σ tu T = 0 y los requisitos anteriores.

(Por cierto, la matriz tu Σ tu T es de hecho invertible siempre que tu es de rango completo k < norte y Σ es invertible La matriz Σ es invertible si y solo si X una distribución continua en R norte en el sentido de que tiene una densidad con respecto a la medida de Lebesgue en R norte .)

el resultado para ( X | S = s ) es correcto si Γ es la matriz de segundos momentos centrales , es decir, Γ = Σ .
De hecho, gracias. Empecé a escribir la respuesta para X centrado y mezclé las cosas para manejar distinto de cero m . Está arreglado ahora.
Parece que A debería ser norte × norte (no ( norte 1 ) × norte ) En la primera parte.
Arreglado, gracias @IanFiske

La distribución de ( X | S = s ) sigue siendo en conjunto normal pero degenerado. Dejar T = ( 1 , 1 , , 1 ) t y deja X y m también ser vectores columna. Entonces ( X 1 , , X norte , T t X ) es juntamente normal como una transformada afín de una distribución juntamente normal, y podemos usar la fórmula general para una distribución condicional de componentes de una distribución juntamente normal:

( X | T t X = s ) norte ( m + s m t T T t Σ T Σ T , Σ 1 T t Σ T Σ T ( Σ T ) t ) .
T es un vector propio de la matriz de covarianza con el valor propio 0 .

Maxim, solo por notación, Σ es la matriz de covarianza del vector aleatorio original, X ; y t es la transposición, ¿verdad?
Correcto, X norte ( m , Σ ) , y T t es un vector fila.