¿Por qué el cromosoma 19 humano tiene el segundo mayor número de genes que codifican proteínas?

Si bien el cromosoma 19 es el decimonoveno cromosoma autosómico más grande, contiene 1440 genes que codifican proteínas y, por lo tanto, tiene el segundo número más alto de genes que codifican proteínas de cualquier cromosoma humano.

A modo de comparación: si uno supusiera ingenuamente la misma densidad de genes que codifican proteínas que en chr1, que tiene el número absoluto más alto de genes que codifican proteínas (2109), la anticipación para chr19 sería ~ 540 genes que codifican proteínas.

El eje x de este gráfico destaca el aumento de la densidad de genes que codifican proteínas en el cromosoma 19 ;El eje x destaca el aumento de la densidad de genes en el cromosoma 19.

No creo que haya ninguna respuesta a "por qué".
Dentro de cualquier población natural habrá valores atípicos. El gráfico de distribución que muestra tiene una cola larga, lo cual es de esperar. Busque gráficos sobre la distribución de la altura, por ejemplo, y verá que el 90 % de los valores están dentro de un rango bastante pequeño, pero el 5 % de cada lado se extiende bastante, ya que hay valores atípicos extremos en ambos extremos. .
Como los valores atípicos extremos en las poblaciones naturales a menudo son de alguna manera especiales, y como un conjunto de más de 1000 genes argumentaría fuertemente en contra de tantos eventos aleatorios independientes, tenía curiosidad por saber si había algo especial en chr 19 o sus genes, que podría favorecer un comparativamente tan alto. densidad génica.
Bueno, una respuesta de tipo de analogía muy aproximada es que la mutación aleatoria no es una forma muy eficiente de hacer el genoma, al igual que tocar el teclado al azar no es una forma muy eficiente de escribir código de computadora, terminará con variación en la eficiencia de guiones
Los genes parálogos normalmente se encuentran en diferentes cromosomas, lo que demuestra que la ubicación cromosómica no está estrictamente dada por la mutación/formación de novo de un gen en un cromosoma dado.
Creo que OP tiene razón en que hay algo que explicar aquí (es decir, los modelos nulos estándar para la distribución de genes en el genoma no predecirían tal valor atípico), pero creo que nadie sabe la respuesta.
@WYSIWYG Creo que "por qué" en este caso se traduce como "a qué eventos llevaron".

Respuestas (2)

Este artículo de Nature de 2004, de Jane Grimwood et al. va al menos un largo camino para dar una respuesta a la pregunta del OP. En resumen: hubo demasiadas duplicaciones, especialmente durante un evento hace 30-40 millones de años, así como durante un evento mucho más reciente. Estas duplicaciones son, inusualmente, predominantemente intracromosómicas en lugar de intercromosómicas. Además, el cromosoma 19 contiene una gran cantidad de parálogos similares a las inmunoglobinas: un tipo de gen para el que es claramente adaptativo desde el punto de vista evolutivo al sufrir una duplicación rápida seguida de una mutación aleatoria, ya que desempeñan un papel en la adaptación a los antígenos potenciales.

Es interesante que no solo el líder 19, sino también el 16 y el 17 siguen una tendencia similar. ¿Quizás su tamaño podría ser la mejor proporción peso/longitud para garantizar una replicación segura? Entonces lo que habría que explicar sería 18, tan lejos a la izquierda. Eso podría ser si el 18 es más nuevo, resultado de la división de un cromosoma más grande o de la fusión de dos más pequeños, sin tener aún tiempo para acumular un mayor número de genes favorecidos por las ventajas de la "coevolución posicional de genes" (si tal cosa existe).