notación (ab)uso para variables aleatorias, distribuciones, pdfs/pmfs

Esta pregunta trata sobre la notación de variables aleatorias (RV), distribuciones y pdf/pmfs y su (ab) uso común, ya que recientemente me confundí.

Dejar X , Y denota variables aleatorias.

Primero, las notaciones que suelo encontrar. Por favor corrigeme:

  • Los valores que toma un RV generalmente se denotan con versalitas, de modo que PAG ( X = X ) [ 0 , 1 ] denota la probabilidad del RV X tomando el valor X
  • X 1 , . . . , X norte X significa "sea X_1,...,X_n ser RV con la misma distribución que X " (a menudo iid )
  • si X es discreto su pmf generalmente se denota por pag ( X ) = pag X ( X ) = PAG ( X = X ) [ 0 , 1 ]
  • si X no es discreto, su pdf generalmente se denota por F ( X ) = F X ( X ) [ 0 , ) o pag ( X ) = pag X ( X ) para hablar fácilmente sobre vehículos recreativos discretos y no discretos al mismo tiempo
  • el cdf generalmente se escribe como F ( X ) = F X ( X ) = PAG ( X X ) que es una suma/integral usando el pdf/pmf

Las siguientes notaciones que generalmente entendí de una manera "intuitiva" o asumí que eran descuidadas pero causaron cierta confusión:

  • "Dejar X ser un RV con distribución X PAG ( X ) " -- ¿Qué quiere decir exactamente? ¿Debería pensar en PAG -probabilidad aquí o es un símbolo que dice "esto denota/representa la distribución de X "?
  • " pag ( X , Y ) , pag ( X ) , pag ( X | Y ) denotar las funciones de densidad de probabilidad condicional, marginal y conjunta".
  • " Dejar PAG ( X , y ) ser una distribución de probabilidad conjunta (desconocida) en instancias y etiquetas X × Y . Dada una muestra de entrenamiento ( X i , y i ) i = 1 norte iid PAG ( X , y ) ..." -- ¿Cómo leer esto?

¿Alguien podría ayudarme y arrojar algo de luz sobre los puntos mencionados anteriormente?

Lo siento, si mis preguntas son tontas. Siento que la notación se vuelve mucho más descuidada cuando leo material aplicado y me ayudaría a precisar lo que realmente significa o saber que uno necesita relajarse y aprender a leer esto de manera descuidada y correcta.

Respuestas (1)

Estás en lo cierto. La segunda lista de viñetas está llena de notación confusa, lo que demuestra que el autor tiene ideas vagas y confusas sobre la probabilidad. En lugar de tratar de interpretar y aprender de este tipo de material, sería mucho mejor ceñirse al material de autores cuya notación tenga sentido.

Gracias. Todavía sospecho que tiene algún sentido esta notación, ya que, por ejemplo, también se hace en diapositivas de un curso que trabajé por mi cuenta. Pero definitivamente una notación muy poco común. Hasta ahora lo tomé como pag X , Y pag ( X , Y ) , pag X pag ( X ) , pag X | Y pag ( X | Y ) lo que permitiría nociones intuitivas como pag ( X , Y ) = pag ( X | Y ) pag ( Y ) . ¿Esto tiene sentido? (por ejemplo, gatsby.ucl.ac.uk/teaching/courses/ml1-2008/lect1-handout.pdf diapositivas 24, 31)
Aún así, estos son terriblemente descuidados y tienen terribles consecuencias en lo que respecta a la comprensión de los estudiantes (para obtener toneladas de ejemplos, consulte las preguntas de math.se...).
@JamHei: Interpretado con la suficiente generosidad, todo tiene sentido; y tu interpretación de " pag ( X , Y ) "como significado pag X , Y tendría sentido aquí. Pero tener que lidiar con este tipo de confusión es una gran desventaja para los estudiantes.
Gracias. No estoy defendiendo esta notación para los estudiantes. De hecho, son la razón de mi confusión. Solo quiero darle sentido y entender "cómo leerlos" en este contexto, por ejemplo, de este curso u otros artículos más orientados a la aplicación en los que también los he visto. Como recapitular lo que realmente significan o qué notaciones descuidadas se usan comúnmente. ¿Y las otras dos balas?
PD. En Wikipedia ( en.wikipedia.org/wiki/Posterior_probability#Definition ), por ejemplo, usan el término "función de distribución de probabilidad" ( en.wikipedia.org/wiki/Probability_distribution_function ) en caso de pag ( θ | X ) que es más o menos lo mismo (como tomo θ y X ser casas rodantes aquí). Entonces, ¿podría ser común a este campo?
También, por ejemplo, "distribución marginal pag ( X ) " en notas de clase sobre el aprendizaje de grafos.
@JamHei: con respecto a los otros dos ejemplos con viñetas: su suposición es tan buena como la mía. Tal vez a alguien más le interese interpretar. Subrayaría el comentario de Did anterior. Es mejor no involucrarse con material didáctico como este, al menos hasta que sepa lo suficiente como para reescribirlo en notación consistente.