Cifrado de ADN real (o al menos haciendo que sea difícil de decodificar/cambiar)

¡Así que soy el dueño de una startup que nos hará la vida más fácil con criaturas de ADN personalizadas! Nuestros pocos primeros productos se están vendiendo muy bien y nada andaba mal hasta los eventos de la semana pasada.

Otra empresa compró uno de nuestros productos y simplemente decodificó la secuencia de ADN completa, luego cambió algunas cosas y las revendió como propias, consumiendo nuestros ingresos. Es bastante malo para nosotros, pero aún así está bien, porque podemos demandarlos.

Ahora imagine si algunos terroristas robaran nuestros virus (nada ilegal, los usamos como terapia) y cambiaron el código (bien desarrollado, legible) para hacer cosas realmente malas (como simplemente matar para empezar, o incluso peor).

¡Así que nuestro plan es establecer algún tipo de encriptación! Pero parece difícil de hacer.

¿Hay alguna manera fácil de configurar el cifrado, o al menos hacer que el ADN sea mucho menos legible?

Puntos de bonificación por

  • Cifrado de ARN también
  • Células que se dividen sin un proceso de descifrado
  • Algunas variaciones de ADN
  • Hacer que las secuencias de proteínas sean más difíciles de encontrar también
¿Por qué no se patenta el proceso? Por lo general, si tiene algo tan único, presenta múltiples patentes de métodos en sus procesos únicos para llegar a ese punto y tener una ventana de más de 20 años en la que puede ser el vendedor exclusivo de su tecnología.
@Anoplexian Ok, pero ¿estás seguro de que los terroristas se preocuparán por cosas como las patentes?
Cuanto más controle en qué entornos puede estar su virus y controle el acceso a estos virus, más difícil será para los terroristas. Piense en ello como información bancaria. Unos cuantos piratas informáticos terroristas fantásticos teóricamente podrían piratear un banco y causar un caos generalizado, pero en su lugar recurren a ataques físicos. El mismo principio, solo que en realidad no tienen ninguna razón para hacerlo, y sospecho que el espionaje corporativo es un problema mayor. Tenga en cuenta que si los terroristas realmente quisieran, propagar priones o enfermedades sería la mejor forma de acabar con los "infieles".
Necesitas una 'cremallera' de bioingeniería. Entonces, la replicación del ADN implica dividir la hélice con algo parecido a una cremallera. Si tuviera una cremallera personalizada, podría dividir el ADN en hebras de ARN de manera diferente... pero haga lo que haga será ingeniería inversa.
Como señalan las otras respuestas, no es el ADN lo que es valioso, es SU documentación sobre qué hace qué genoma, etc. Y ESO, con suerte, sigue siendo un secreto de empresa (y/o patente). [Es como con el software: teóricamente puedes descompilarlo todo, pero es basura sin valor con poco valor sin el código fuente]
Me entristece un poco que la primera respuesta al éxito de una nueva tecnología siempre parezca ser "¿Cómo podemos asegurarnos de tener el monopolio de esto?", en lugar de decir "¿Cómo podemos retribuir a una sociedad que permitió este avance en primer lugar?" Pero dejando de lado los sentimientos personales, ¿qué es exactamente lo que haría, por ejemplo, que sus virus sean una mejor "base" para un arma biológica que los "naturales"? ¿Los alteró de una manera que facilita la modificación posterior? ¿Poseen habilidades inusuales que son fáciles de explotar?
@Hobbamok Incluso un ingeniero inverso aficionado no estaría de acuerdo contigo...

Respuestas (13)

No sucederá en un futuro previsible

Déjame mostrarte este XKCD primero:

Transcripción a continuación

[Sombrero Blanco, sosteniendo una computadora portátil, está hablando con Megan, quien mira su teléfono inteligente.]

White Hat: La biología está en gran parte resuelta. El ADN es el código fuente de nuestros cuerpos. Ahora que la secuenciación de genes es fácil, solo tenemos que leerlo.

Megan: No es solo "código fuente". Hay un montón de comentarios y procesamiento externo.

[Sombrero Blanco, abriendo su computadora portátil, camina hacia un escritorio y una silla pasando a Megan, quien le extiende los brazos.]

Megan: Pero incluso si lo fuera, el ADN es el resultado del proceso de optimización más agresivo del universo, funcionando en paralelo en todos los niveles, en todos los seres vivos, durante cuatro mil millones de años.

White Hat: Todavía es solo código.

[White Hat se sienta en el escritorio con su computadora portátil abierta, mientras Megan mira por encima del hombro.]

Megan: Bien, intente abrir google.com y haga clic en "Ver código fuente".

Sombrero Blanco: Bien, yo-... Dios mío.

Megan: Son solo algunos años de optimización por parte de los desarrolladores de Google. El ADN es miles de veces más largo y mucho, mucho peor.

White Hat: Wow, la biología es imposible .

¿Qué significa esto, específicamente a su pregunta?

  1. El ADN que codifica la proteína tiene que estar en un orden específico. No hay dos formas de codificar una proteína, en realidad no.

  2. El ADN ya es tan complicado, interconectado, ilógico, sus resultados dependen de los efectos de otras partes del ADN, etcétera (consulte el artículo ADN no codificante si está interesado), que todas las complicaciones que pueda agregar a propósito serán muy, muy insignificante en comparación con lo que la naturaleza ya hizo. Por lo tanto, si alguien puede descifrar lo que hizo la naturaleza, su capa adicional de ofuscación realmente no cambiaría nada.

    2a. Incluso para los virus, si alguien quiere modificarlos y usarlos en humanos de manera efectiva, debe poder decodificar y comprender el genoma humano, el virus sería fácil para alguien con tales capacidades, con el espacio muy, muy limitado que tiene dentro de un virus.

El ADN no es un "código" en ningún sentido significativo. El ADN es simplemente una biblioteca masiva de fórmulas químicas para proteínas; nada más y nada menos. No contiene decisiones, no contiene bucles, no contiene subrutinas: todo lo que tiene es una lista masiva de fórmulas químicas de proteínas. El ADN no dice qué hacen esas proteínas, cuánto hacer de cada proteína, si es que hay alguna, en qué circunstancias hacer cada proteína y en qué circunstancias evitar hacerla.
@AlexP "biblioteca masiva de fórmulas químicas para proteínas; nada más, nada menos". - falso. Lea en.wikipedia.org/wiki/Non-coding_DNA ; básicamente, tiene IFinstrucciones , por ejemplo.
Las construcciones de bucle están una capa más arriba. La reproducción celular sigue repitiéndose y las proteínas crean desencadenantes ambientales que hacen que las declaraciones IF se ejecuten de manera diferente. Algún idiota pensó que la programación orientada a aspectos era increíble y superpuso un sistema de metaprogramación mecánico en capas. Toda la aplicación estaba integrada en un sistema operativo planetario que ni siquiera es estable. Sin seguridad en la red... cualquier virus externo puede reescribir las aplicaciones internas. Es como si nadie se hubiera molestado con el diseño inteligente y dejara que el sistema evolucionara o algo así.
@AlexP El ADN hace que se sinteticen proteínas, y esas proteínas interactúan entre sí. Esas interacciones pueden denominarse razonablemente "decisiones", "bucles" y "subrutinas". Decir que el ADN no es código porque en realidad no hace nada es como decir que el código fuente que no ha sido compilado no es código.
@Accumulation: la diferencia es que el ADN no dice cómo interactúan estas proteínas... Además, las interacciones entre proteínas no están determinadas por las proteínas en sí, sino por la maquinaria celular.
@AlexP Las interacciones entre líneas de código en realidad no están determinadas por las líneas de código en sí mismas, sino por la maquinaria en la que se ejecutan. No está identificando ningún sentido en el que el ADN no sea un código que los programas de computadora son.
@Acumulación: pero el código fuente en sí mismo especifica cómo interactúan las líneas de código. No puede hacer que interactúen, pero especifica cómo deben interactuar cuando se ejecutan. El ADN no hace eso; simplemente enumera una gran cantidad de recetas para hacer proteínas, y es la maquinaria celular la que sabe qué proteínas hacer y cuáles no, cuántas hacer, cómo equilibrar la producción de proteínas, cuándo hacerlas, etc. Uno puede comprender un programa fuente sin saber en qué máquina se ejecuta; uno no puede entender el ADN sin entender cómo funcionan las células.
@AlexP El código fuente en sí mismo no especifica cómo interactúan las líneas de código. El código fuente es simplemente texto. El compilador y el código juntos especifican qué código de máquina resulta, y el código de máquina junto con el conjunto de instrucciones determina lo que hace la computadora. Si cree que puede entender lo que hará un código fuente sin saber en qué máquina se ejecuta, entonces simplemente no entiende las computadoras en absoluto, por lo que debe dejar de hacer declaraciones sobre cosas que no entiende.
Sí, hay cierto grado en el que las computadoras están estandarizadas para hacer lo mismo con el mismo código de máquina, pero eso se debe a que la industria informática decide que las computadoras deben hacer lo mismo, no a que el código fuente tenga un resultado fijo inherente. "El ADN no hace eso, simplemente enumera una gran cantidad de recetas para hacer proteínas" O te estás expresando muy mal o estás extremadamente confundido sobre cómo funciona la biología. El ADN no solo le dice a la célula cómo hacer proteínas, le dice a la célula qué proteínas debe hacer.
"El ADN que codifica la proteína tiene que estar en un orden específico. No hay dos formas de codificar una proteína, en realidad no". ¿Um que? Si te refieres a la secuencia de pares de bases que se agrupan en codones que especifican aminoácidos, entonces hay toneladas de variantes que derivan de la misma proteína. Solo dos aminoácidos tienen un solo codón que los especifica. en.wikipedia.org/wiki/Genetic_code#Standard_codon_tables
El OP preguntó qué pasa si las personas roban sus virus personalizados y "cambian el código (bien desarrollado, tan fácil de leer)", lo que he interpretado como que los virus personalizados tienen un código genético escrito con las mejores prácticas que existen en ese universo. . Así que es modular y fácil de cambiar. Esto implica que sus criaturas también están escritas de una manera muy lógica y directa, y están buscando una forma de ofuscarlo. Creo que su segundo punto ignora esa sutileza en la pregunta.
@Thymine más adelante en la pregunta, puede ver "Células que se dividen sin un proceso de descifrado", por lo que no se trata solo de virus. Además, buscar "células totalmente sintéticas" en Google muestra cuán grande es la tarea. Incluso con un genoma mínimo, su expresión depende de genes que solían estar en una célula vacía antes...
@Thymine agregó una parte más explícita sobre los virus
@AlexP Eso en realidad no es del todo cierto. El ADN, incluso en un entorno biológico, "procesa" y contiene mucho más que solo exones codificadores. Aunque es más común para el ARN (por ejemplo, la rareza que permite codificar la seleocisteína sin un codón para ella), todavía sucede con el ADN. De hecho, la mayoría de los genetistas argumentarían que solo una minoría del material genético funcional en realidad codifica proteínas (en lugar de estar relacionado con la retroalimentación y el control).
No estoy de acuerdo con tu punto #2. Hablando estrictamente desde un punto de vista criptográfico (no puedo decir que sepa lo suficiente de la biografía para hablar de los detalles allí), su declaración básicamente confunde CODIFICACIÓN con CIFRADO. La codificación es confusa pero comprensible. El cifrado, cuando se realiza correctamente (y hay formas de hacerlo correctamente), es literalmente matemáticamente imposible de descifrar sin la clave. Así que no, la naturaleza no nos dio el cifrado, nos dio la codificación. Agregar cifrado como lo solicita el OP (si se hace de una manera biológicamente posible) haría que la información fuera inaccesible sin clave
@ColonelPanic, su preocupación ya se abordó en esta respuesta : la clave ya está allí. Tiene que serlo, si los genes funcionan. Por lo tanto, se trata de encontrar conexiones, no de recrear matemáticamente la clave. La dificultad criptográfica de la clave es irrelevante.
@AlexP "la maquinaria celular subyacente". ¿Te refieres a los que están hechos de proteínas que se crearon según las instrucciones del ADN?

Quimera.

gato quimera

https://www.boredpanda.com/chimera-cat-split-face-diferentes-ojos-gataquimera/

La quimera puede ser lo que se conoce como quimera genética, un fenómeno natural raro en el que un individuo está formado por células de al menos dos óvulos originales diferentes. Se fusionan para convertirse en un solo organismo, cuyo ADN proviene de dos individuos completamente diferentes.

Un organismo normal surge de una sola célula. Salvo mutación somática, cada célula de la criatura porta el mismo código genético. Su competidor puede deslizar un cabello y decodificar el genoma a partir de él.

Las quimeras como este gato pueden ocurrir naturalmente. Dos huevos se fusionan desde el principio y la criatura resultante es una mezcla equilibrada de 2 genomas. El genoma decodificado de un cabello podría no ser el mismo que el decodificado de otro.

Das un paso más allá. Tus criaturas personalizadas son todas quimeras, no de dos, sino de muchos, muchos "huevos" de ingeniería diferentes. La mayoría de estas líneas celulares tienen genomas que son deliberadamente defectuosos y una criatura que surja solo de uno de estos genomas defectuosos sería anormal o no viable. Pero juntos en su quimera, los genes mutantes de algunas células son compensados ​​por la fuerza (o simplemente la normalidad) de las células adyacentes. La combinación de células utilizadas para construir su quimera no es aleatoria; por ejemplo, una podría tener una alta población de un tipo mutante dado en el hígado, donde su producto de proteína en exceso puede rescatar el resto del organismo que es deficiente en ese producto. No lo sabrías si secuenciaras el genoma de un cabello robado.

Su competidor necesitaría secuenciar muchas, muchas células de todo el organismo, deducir qué partes son malas (¿o son malas?) y qué partes son buenas, y esperar recrear los muchos linajes utilizados y combinarlos en la proporción correcta para replicar. la criatura.

La ingeniería genética de animales es cosa vieja: puedes comprar peces brillantes diseñados en Petsmart. Pero crear una quimera a partir de líneas de ingeniería es llevar la creación de criaturas a un nivel de ciencia ficción completamente nuevo.

Siendo una respuesta creativa, esto parece algo muy difícil pero efectivo.
@val - no es super SF. En este momento, puede curar a las personas de la enfermedad de células falciformes usando un trasplante de médula ósea de alguien que no tenga células falciformes. La persona que antes tenía anemia falciforme se convertirá en una quimera con glóbulos de un individuo y el resto del cuerpo original de otro.
Siento que esta respuesta está recibiendo más votos a favor porque presenta una imagen de un gato...
@afaulconbridge: Internet es para 2 cosas, me dijeron, y una de ellas es difícil de incorporar a una idea en el intercambio de pila.
@Willk PronExchange? ¡Voy al Área 51 ahora!
Oh, ella es una gata tan hermosa

No necesita cifrar la secuencia de ADN para que otras personas no puedan usarla.

Una molécula de ADN no tiene un significado intrínseco, lo que significa que, si bien es posible que pueda discernir patrones, nunca obtendrá toda la información de un organismo simplemente observando su ADN.

Permítanme explicar esto con una analogía con el lenguaje. Si te diera un libro en un idioma que no lees, serías incapaz de entenderlo. Sabes que es un libro y sabes que tiene un significado, pero no puedes aplicarle ingeniería inversa sin probar las cosas. Por ejemplo, tomar una oración y repetirla a alguien que habla ese idioma, o reorganizar las palabras y probar si tienen el efecto deseado cuando se las dice a alguien que las entiende.

Un código, en este caso el código genético, requiere un sistema de decodificación para contener información significativa. En biología, el decodificador está constituido por muchas otras partes de la célula, incluida, entre otras, la maquinaria de transcripción que transcribe el ADN en ARN, la maquinaria de traducción que traduce el ARN en proteínas, la maquinaria epigenética que controla qué regiones deben transcribirse. , vías de señalización celular que modulan los sistemas anteriores en función de factores externos e internos, etc.

Así que todo vuelve al óvulo. No es solo una molécula de ADN por sí sola. Es una molécula de ADN en un contexto celular muy específico, y en el caso de los metazoos también es una célula en un contexto de órgano muy específico. Un óvulo humano no puede desarrollarse en su vejiga. Tiene ciertos requisitos que (típicamente) cumple el útero.

Si sus criaturas tienen reproducción sexual, puede diseñar una cepa reproductora de la criatura que dé a luz a una progenie estéril. Para evitar la posibilidad de fertilización in vitro, puede diseñarlas para que den a luz a una descendencia que carezca del equivalente de un útero, o puede realizar sistemáticamente histerectomías antes de venderlas.

Si realmente desea que sea increíblemente opaco, debe modificar la forma en que funcionan las diversas maquinarias que mencioné anteriormente:

  • Cambie los codones de inicio y finalización modificando la maquinaria transcripcional para reconocer diferentes patrones. También deberá modificar la secuencia del sitio de inicio de la transcripción.

  • Codifique el código genético haciendo que los distintos ARNt se correspondan con diferentes aminoácidos, lo que obligará a los posibles ladrones a realizar experimentos para descubrir a qué corresponde su versión patentada del código genético.

  • Si está utilizando factores de transcripción preexistentes, realice experimentos de mutagénesis dirigida para que reconozcan diferentes motivos de secuencia.

En cuanto a hacer que el ADN sea difícil de leer e interpretar, aquí hay algunas ideas:

  • Debe incluir muchos tramos muy largos de regiones repetidas en su ADN, así como transposones. Esto hace que sea mucho más difícil ensamblar el genoma completo de un organismo. Estamos empezando a ser capaces de abordar ese problema con la tercera generación de métodos de secuenciación que genera lecturas largas que pueden resolver estas secuencias repetitivas.

  • Agregue muchos pseudogenes para confundir la interpretación, estas son secuencias de ADN que parecen genes y son reconocidas por herramientas automatizadas pero no son funcionales como tales.

  • Revuelva sistemáticamente los genomas, en algunos organismos unicelulares se ha demostrado que puede cortar y ligar al azar grandes extensiones del genoma sin efectos importantes en la aptitud. Si no le importa que cada criatura sea excepcionalmente estéril, podría ser posible comenzar con un óvulo recién reorganizado sin demasiadas consecuencias negativas para la salud de la criatura. Probablemente desee mantener juntos bloques sintéticos específicos, pero si define las regiones aceptables para cortar, entonces debería estar bien.

En última instancia, desea hacer que la celda sea lo suficientemente diferente para asegurarse de que, para robar su criatura, uno tenga que estudiarla durante tanto tiempo que sea más fácil diseñar su propia criatura original. No olvides asegurarte de que las criaturas liberadas al público no puedan reproducirse.

Tienes el organismo, tienes su ADN y presumiblemente tienes la capacidad de clonar el organismo. ¿Por qué no podría mapear el genoma de la misma manera que ya lo hemos hecho con los organismos existentes? El genoma sería el diccionario de tu libro de lenguaje misterioso.
Si sigues la idea de deshacerte del útero y mantener una cepa de reproducción especial solo para la producción, entonces la clonación será imposible. Siempre será posible mapear el genoma de la misma manera que lo estamos haciendo actualmente con los organismos existentes, solo es cuestión de hacerlo prohibitivamente costoso.

Este ya es un problema resuelto, pero la solución no es el cifrado.

La solución actual es tener ADN incompleto. En particular, el ADN pierde el código de una proteína esencial en el desarrollo. Eso no es problema para ti: sabes qué proteína falta, así que la agregas a la dieta de las criaturas juveniles. Una vez que salen de su laboratorio, no queda rastro de esta misteriosa proteína o del ADN que la codifica.

Usamos esta técnica hoy para liberar organismos modificados genéticamente en la naturaleza. Como no pueden reproducirse, también se evita la dispersión no intencionada de los genes modificados.

¿No es esa también la trama de Jurassic Park?
Fascinante. ¿Puede proporcionar un enlace para obtener más información?

Para agregar a lo que dijo Mołot: en realidad no es solo código.

El ARN es leído y decodificado por los ribosomas:

El ribosoma (/ˈraɪbəˌsoʊm, -boʊ-/]) es una máquina molecular compleja, que se encuentra dentro de todas las células vivas, que sirve como sitio de síntesis biológica de proteínas (traducción). Los ribosomas unen los aminoácidos en el orden especificado por las moléculas de ARN mensajero (ARNm).

Saben cómo leer el ARN solo de una manera muy específica. Cada tres bases que entran se traducen en un aminoácido específico que se vincula en la proteína de salida. Si simplemente "cifras" una secuencia de ARN, los ribosomas la leerán sin descifrarla. La proteína de salida será completamente diferente de la original.

Además de eso, no todos los tríos de bases codifican un aminoácido. También hay un código para el "fin de la proteína". El ADN encriptado los tendría en lugares muy diferentes como mínimo.

Su ADN encriptado no sería diferente del ADN "basura", que no codifica nada significativo. El ADN humano ya está lleno de eso.

En resumen, esperamos que la bioinvestigación haga posible matar fácil y rápidamente a todos los humanos en el planeta mucho antes de que sea posible obtener todos los beneficios de curación y aumento. La probabilidad sugiere que el futuro de la bioingeniería será un infierno: ya sea una marea creciente de amenazas de virus o un estado policial masivo.
@SRM En principio, todas las herramientas ya están disponibles, es solo que carecemos de los conocimientos suficientes para armarlo todo. O tal vez ya lo hacemos, en secreto, en algunos laboratorios de guerra biológica. Imagine un virus tipo Ébola en el aire con una etapa inicial contagiosa con síntomas similares a los de la gripe.
Es un poco extraño que haya citado un pasaje con la ortografía correcta de "ribosoma" y luego haya procedido a escribirlo mal repetidamente.
@Accumulation Estoy escribiendo desde un celular. No es tan ideal como usar un teclado físico.

Combina cualquiera de los siguientes:

  1. Utilice sus propios aminoácidos patentados. Punto de bonificación: todos tienen que comprar su comida para sus criaturas y los virus solo pueden crecer en sus tanques, solo observe quién los compra. Será más difícil leer el sentido en su código genético, al menos su oponente no puede simplemente usar herramientas normales de análisis de código de ADN sin pensar por sí mismo.

  2. Para hacerlo aún más difícil: invente su propio sistema biológico. Es posible que aún desee usar cosas como "proteínas" y moléculas distintas para transferir el código genético (algo como ARN, ADN, etc.), pero cambie los aminoácidos, las nucleobases y tantas otras cosas como desee. Problemas aquí: no es fácil y puede que no sea comestible y, siempre que la criatura pueda reproducirse y "vivir", todos los que tengan suficiente dinero y tiempo pueden analizarlo.

  3. Killersolution: No regales los sistemas reproductivos. Ponga la información reproductiva relevante (con algunas especialidades patentadas) en un cromosoma especial, etc. en un solo género y nunca venda criaturas con él (y no permita que los espías los roben).

Considere también la haplodiploidía (consulte en.wikipedia.org/wiki/Haplodiploidy - what bees/ants do) con un gen que es letal en dos copias, pero tiene "medicina" para tratar. Por lo tanto, puede mantener vivas a las reinas en su laboratorio, y sus competidores no pueden.

Tengo una respuesta muy... informática para eso. Hace una década hubo un concurso de programación que básicamente imitaba la cadena ADN-ARN-proteína. No debe producir la imagen de origen, sino la imagen de destino, las operaciones de pintura fueron básicamente las instrucciones de ARN, construyendo la proteína. Se esperaba que los concursantes se entrometieran con el "ADN".

Para hacerlo más difícil y menos sencillo, la codificación del programa de "ADN" real utilizada en la tarea realizó alrededor de 20000 operaciones de copia y creación de subconjuntos en la parte más o menos completa del "texto" de ADN antes de realizar su trabajo real. Las personas que no fueron muy diligentes con los detalles de implementación tuvieron mucha menos suerte al ejecutar rápidamente este código.

Aquí están los detalles sangrientos .

imagen de origen imagen objetivo

¿Ese concurso de programación se estaba ejecutando en ribosomas en células reales?
No, el ADN y todo el escenario eran falsos.
¡No es realmente lo que quiero, pero gracias por el enlace al gran rompecabezas que intentaré resolver!

El gran problema aquí es que el organismo tiene que ser capaz de decodificar su propio ADN. Por lo tanto, el "mecanismo de descifrado" tiene que estar integrado en el organismo.

Puede hacerlo más oscuro ocultando las partes importantes en un montón de ADN basura. Puede hacer que la decodificación y la codificación sean más difíciles utilizando cosas como pares de bases no estándar y aminoácidos no estándar. Entonces, el competidor no puede simplemente usar productos listos para usar para hacer su clonación, tiene que desarrollar la misma infraestructura desde cero que su empresa usa para diseñarlos.

Pero, en última instancia, no se puede ocultar el código genético de un oponente bien financiado, porque el competidor puede realizar ingeniería inversa de lo que hace el organismo para leer su propio ADN.

Ocultar cosas en el ADN de juni no ayuda, los códigos de inicio y finalización son lo más simple de encontrar. Y el uso de bases/aminoácidos no estándar tampoco es útil, en la primera replicación ya lo perdiste.
@Renan Las bases no estándar aparentemente tienen funciones reguladoras en los humanos, pero otras partes del genoma codifican las enzimas para crear las bases no estándar y replicarlas cuando el ADN se copia durante la división celular ( ncbi.nlm.nih .gov/pubmed/28941008 )
@Renan Estaba pensando más en usar pares de bases completamente antinaturales . Ya hemos experimentado con un par SY con 2-amino-8-(2-tienil)purina(s) y piridina-2-ona (y) y un par Ds-Px con 7-(2-tienil)imidazo[4 ,5-b]piridina (Ds) y 4-[3-(6-aminohexanamido)-1-propinil]-2-nitropirrol (Px), entre algunos otros con nombres aún menos pegadizos. Obviamente, necesitará volver a diseñar la maquinaria de replicación del organismo para poder codificar y decodificar dichos pares. Pero como dije, es fundamentalmente solo un obstáculo menor.

Cada célula de tu cuerpo ya hace esto, es posible que no te hayas dado cuenta. No te diste cuenta porque no te creció una extremidad o un globo ocular adicional, lo que podría suceder si no fuera por esto.

Usted pide encriptación. Ahora, una cosa que puedes hacer con el ADN es cifrarlo, que es a lo que apuntaba la respuesta de Mołot . Esto no es tanto encriptación como simplemente oscurecer los datos. Todo lo que necesita para decodificar los datos está presente, puede ser difícil.

Si desea encriptación, entonces lo que desea es una "clave" de modo que cualquiera que conozca esta "clave" pueda decodificar los datos correctamente. Alguien que no tiene esta "clave" no puede.

Así que digo que cada célula de nuestro cuerpo hace esto, porque son diferentes. Cada célula de la piel ha "olvidado" cómo convertirse en una célula hepática. Cada célula nerviosa ha "olvidado" cómo ser un páncreas. Si alguno de ellos supiera la clave mágica que los devolvería a ser una "célula madre", entonces podrían cambiar su papel en el cuerpo. Pero sin esa clave, permanecen diferenciados.

Ahora bien, esto puede ser simplemente cifrar. Hemos hecho grandes avances en la construcción de claves que enseñan a las células cómo convertirse en células madre. Así que parece que las llaves pueden haber estado allí todo el tiempo, pero también es posible que simplemente no funcione de esa manera y que las llaves se pierdan de forma permanente.

Hay algunos ejemplos sólidos de capacidades perdidas permanentemente. Los glóbulos rojos arrojan su núcleo antes de pasar al torrente sanguíneo, por lo que realmente carecen del conocimiento para poder reproducirse.

Entonces, para cifrar realmente los datos, necesita algo que funcione como una "clave" que pueda introducir durante la construcción y eliminar después. Lo que probablemente desee es una estructura de proteína que pueda decodificar las hebras de ARN antes de que se usen para ensamblar las proteínas. En su cadena "pura" que conoce la clave, esta estructura de proteína está codificada en el ADN y se construye a medida que la criatura crece.

En algún momento introduces un virus con una señal de "matar". Esta señal desencadena un mecanismo en esa estructura que tiene un efecto similar a CRISPR que elimina la "clave" de ADN que puede producir esa estructura.

Las proteínas no duran para siempre. Entonces, después de un corto tiempo, todas las copias de esta proteína decodificadora desaparecen, y debido a que se eliminó el código para generarlas, no se crearán nuevas proteínas. Ahora tu criatura ya no tiene acceso a esas hebras de ADN cifradas.

Probablemente mantendría un ganado reproductor que nunca ha estado expuesto al virus, por lo que siguen produciendo nuevos niños con esta capacidad. Sin embargo, recomiendo guardar la secuencia en algún lugar seguro, de modo que si un virus llega a su ganado reproductor, no haya perdido sus llaves.

"Durante la construcción". Para cosas vivas que equivale a "siempre". También podría escribir esto aquí, un problema fundamental es que el cuerpo necesita saber qué hay en el ADN, no son solo datos inertes esperando ser leídos, se leen todo el tiempo.
@NathanCooper Uso el término "construcción" aquí en un sentido más comercial, como la fase anterior a la venta de la criatura. No toda la funcionalidad del cuerpo es necesaria en todo momento. Algunos solo ocurren durante la gestación o la infancia. Por ejemplo, durante el desarrollo temprano del cerebro, el cerebro envía axones que recorren una distancia notable a través de la materia blanca del cerebro. Nunca volverá a hacer esto después de tu nacimiento. También hay generadores de patrones de prueba en el ojo que se utilizan para ayudar al cerebro a asociar correctamente los axones del nervio óptico con la corteza visual.
Esos patrones solo ocurren durante una pequeña porción de unos pocos días como feto, y luego la retina nunca volverá a generar ese patrón.
También hay algunos trucos que puedes hacer con la epigenética para generar el equivalente criptográfico de nonce, pero eso se vuelve un poco más complicado, y simplemente se basa en esta idea fundamental de que la criatura no tiene las claves para desbloquear su propio ADN.

Siento que algunas de estas respuestas no cubren del todo el espectro de plausibilidad. Estoy de acuerdo en que actualmente es inviable cifrar el ADN solo porque los métodos que tenemos para leer y escribir el ADN también requieren que trabajemos en un marco de vida existente. Debido a esto, la respuesta de @ Thymine no es sensata, ya que necesitaría reescribir la totalidad de cómo funciona realmente el ADN (o, más básicamente, cómo funcionan las proteínas) para convertirlo en un "lenguaje ilegible".

Sin embargo, el ADN se puede expandir. Hay varios laboratorios que han creado nuevas "letras" de ADN. El equipo de Floyd Romesberg agregó dos nuevas "letras" y creó proteínas completamente nuevas. Pero todavía se leen y escriben utilizando una versión ampliada del marco conocido existente. La expansión de los codones disponibles, la creación de nuevos ARNm y ARNt ciertamente haría que las cosas fueran "ilegibles" por un corto tiempo, pero me imagino que necesitaría un enfoque novedoso para el ARNm y el ARNt y cómo funcionan en los nuevos codones, y los nuevos codones necesita realizar las funciones importantes, si desea que permanezca ilegible sin una investigación significativa.

Este episodio del podcast After On podría ayudarlo a comprender algunos de los conceptos básicos de este enfoque: https://after-on.com/episodes-31-60/031

Editar: para un breve artículo sobre el trabajo del equipo de Romesberg: https://www.smithsonianmag.com/smart-news/researchers-add-two-new-synthetic-letters-dnas-alphabet-180967402/

El ADN ya está encriptado. Solo tienes que cambiar la clave.

El dogma central de la biología molecular es que una molécula de ADN codifica una molécula de ARN que a su vez codifica una secuencia de aminoácidos que se pliega en una proteína. ADN a ARN a proteína. Ahora, la codificación de ADN a ARN es 1 a 1 y sencilla, cada base de ADN corresponde a su contraparte de ARN (con la excepción del uracilo, pero si comenzamos a hablar de cada excepción en biología, nunca llegaremos a ninguna parte). Sin embargo, el código de ARN a proteína es completamente arbitrario. Hay 4 bases de ARN ACGU pero 21 aminoácidos formadores de proteínas. Entonces, la vida usa una secuencia de 3 bases de ARN para codificar cada aminoácido. Estos se denominan codones y están codificados por pequeñas moléculas de ARN denominadas ARN de transferencia o ARNt.ingrese la descripción de la imagen aquí

Este código es completamente arbitrario. No hay razón para que CGA debacódigo de arginina. Simplemente lo hace. Para cambiar este código, todo lo que necesita hacer es reemplazar el ARNt responsable de emparejar la Arginina con CGA con el suyo propio que empareja CGA con un aminoácido diferente. Si reemplaza cada tRNA con su propia versión, efectivamente ha "cifrado" el genoma. Has cambiado por completo el significado de cada base de ADN en el genoma. Alguien que se limite a secuenciar el ADN de su organismo no podrá encontrarle ningún sentido. Sin saber cuál es el codón de inicio o los codones de terminación, ni siquiera puede distinguir efectivamente los genes reales del resto del genoma. No podrán agregar ningún gen funcional a su organismo hasta que descifren el nuevo código. Es importante destacar que actualmente es mucho más difícil trabajar con ARN y proteínas que con ADN, por lo que "descifrar" el nuevo código de ARNt no es trivial. Incluso puede tomar medidas adicionales para hacer esto más difícil. Ocultar sus ARNt en secuencias repetitivas que dificultan su secuenciación e incluir muchas secuencias de "pista falsa" que parecen ARNt pero que no funcionan del todo por varias razones, o incluso realizar cambios más fundamentales en el proceso de metabolismo del ARNt para que pueda No predecir el aminoácido que llevaría un ARNt determinado en función de su secuencia de ADN.

EDITAR: Para abordar la preocupación de que este "cifrado" sea demasiado fácil de descifrar. El cifrado de ARN de transferencia no será vulnerable al análisis de frecuencia por varias razones:

  1. El genoma es grande mientras que la porción “cifrada” es bastante pequeña. Solo alrededor del 1% del genoma se traducirá alguna vez en proteína. Sin conocer el código de ARNt, un atacante no tiene forma segura de identificar dónde está esta parte. Las regiones del ADN no son simplemente genes etiquetados. Esto significa que un análisis de frecuencia se verá inundado por el resto del genoma que no sigue la misma distribución de frecuencia.
  2. Describir el cifrado como monoalfabético no es exactamente correcto. Porque hay 64 codones de 3 bases diferentes posibles, pero solo 21 aminoácidos que deben codificarse. Por lo tanto, hay necesariamente muchas formas alternativas de codificar cada aminoácido . Esto es algo análogo a la sustitución homofónica y hará que el análisis de frecuencia sea aún más difícil.
  3. Otra dificultad que enfrentará el atacante es que cada base se puede interpretar en 3 “marcos” diferentes. Sin conocer el codón de inicio, no conoce el marco de la secuencia, por lo que para cualquier secuencia dada hay 3 posibles interpretaciones de la secuencia que son todas igualmente válidas sin conocer el código de ARNt.
  4. Una última complicación es la existencia de empalmes de ARN . Los genes eucarióticos contienen secuencias conocidas como intrones que son interjecciones de longitud variable en la secuencia de ADN del gen que se eliminará del ARN después de que se produzca. Esto significa que un gen no es un único bloque contiguo de mensaje, puede estar intercalado por docenas de secuencias no codificantes de longitud variable. Además, estos intrones no tienen que tener una longitud múltiplo de 3, por lo que es probable que el marco cambie después de cada intrón.
  5. El tamaño del genoma permite al creador incluir potencialmente múltiples conjuntos de genes completamente funcionales en el genoma que, desde cualquier apariencia criptográfica, son indistinguibles del artículo genuino, pero para el organismo, por supuesto, son un galimatías. Entonces, incluso si permitimos, dado todo lo anterior, que un atacante pueda identificar posibles códigos de ARNt, todavía no hay forma de que sepa cuál de las 20 copias de cada gen es realmente el conjunto funcional sin más experimentación.

Con respecto a los ataques de texto sin formato conocido, se trata simplemente de cambiar y ofuscar el genoma hasta el punto de que ya no sea reconocible.

Ahora, no estoy tratando de argumentar que este cifrado es inmune al descifrado, pero ciertamente no es trivial. En mi opinión, los medios más fáciles de descifrado probablemente serán los experimentos biológicos. Potencialmente, secuenciar el ARN y analizarlo, ya que en su mayoría contendrá secuencias exónicas, hará que el descifrado sea un poco más manejable, aunque puede combatir esto produciendo muchos ARN sin sentido que también se sientan sin siquiera ser traducidos. Otra metodología sería introducir varias secuencias conocidas en el organismo y luego buscar productos proteicos que pudieran corresponder a la secuencia introducida, pero esto sería tedioso y nuevamente existen varias contramedidas que podrían emplearse.

Excepto que los ARNt regulan la expresión , por lo que cambiar la estructura del ARNt tendrá consecuencias de gran alcance. Por ejemplo, Ile es el único AA que tiene tres a menos que lo cambies con el codón de parada, en cuyo caso también tienes que rediseñar tus polimerasas de ADN, etc.
@Punintended Para su primer punto, por supuesto que los sistemas biológicos son complejos, pero ese tipo de regulación no es imposible de explicar en un futuro en el que estamos diseñando organismos. Para su segundo punto, la cantidad de codones que corresponden a cada aminoácido no necesita mantenerse constante. Diferentes ARNt son responsables de cada par de codón-aminoácido. No hay razón para que Ile se quede 3. En su tercer punto, las ADN polimerasas no leen los codones de terminación, los ribosomas sí lo hacen usando los ARNt de codones de terminación. Puede cambiar el codón de terminación a otro codón cambiando los ARNt sin ninguna dificultad adicional.
-1 Esto sería equivalente a un cifrado de sustitución monoalfabético, que sería trivialmente derrotado a través de ataques de análisis de frecuencia. Incluso otra implementación podría ser, como máximo, equivalente al cifrado XOR, que podría ser anulado de manera trivial por un ataque de texto sin formato conocido.
@forest Intenté abordar sus inquietudes en una edición de mi respuesta. Creo que el genoma ofrece algunas complejidades adicionales para el descifrado que no habías considerado. Sin embargo, de ninguna manera soy un experto en criptografía, por lo que si ve alguna vulnerabilidad adicional, me interesaría escucharla.
@MikeNichols Todavía sería vulnerable al criptoanálisis trivial. Por ejemplo, identificar una hoja beta o una hélice alfa sería fácil de hacer incluso si no conoce los pares de codón/aminoácido y usa algo diferente a los pares de Watson-Crick. Una vez que sepas eso, puedes decodificar esos codones. La raíz del problema es que los mismos codones especifican isoleucina, por lo que si sabe que, digamos, AGG está encriptado para isoleucina, sabe que todas las instancias de AGG son ese mismo aminoácido.

Cifrado homomórfico

El cifrado homomórfico le permite realizar operaciones arbitrarias en datos cifrados. No necesita descifrarlo, solo necesita un esquema de cifrado que lo permita.

Hay compiladores homomórficos que pueden compilar un código fuente que ya está encriptado para evitar la ingeniería inversa.

Puede tomar el mismo enfoque, encriptar su ADN, desarrollar un ribosoma que pueda crear proteínas a partir del ADN encriptado y listo. Nadie puede leer tu ADN y modificarlo.

Lo único es que el cifrado homomórfico todavía se está explorando y no hay aplicaciones del mundo real que lo usen regularmente. También ralentiza las operaciones por un margen enorme. Todavía es un proceso en desarrollo.

Podría haber una manera.

En primer lugar, querrá agregar muchas más proteínas al ADN para contaminarlo, pero no debe mezclarlas con la secuencia que necesita su organismo. Los genes que no están activos se llaman genes recesivos. Puede tener una lista mucho más grande de genes recesivos, que sería imposible detectar el dominante. Poner genes de extremidades humanas a un caracol como genes recesivos será un buen paso en esa dirección.

Esos genes recesivos, impedirán cualquier desarrollo posterior o copia del organismo. Imagínese esto como "sal" agregada al ADN, que resultará en una enfermedad mortal instantánea si se modifica. Todavía es necesario dividir el ADN para que el organismo crezca, pero los genes recesivos no se mezclarán con los dominantes. Tal vez también deberías tener una lista enorme de enfermedades mortales que pondrás al azar en tu organismo.

La clonación sería posible aunque.

"Puedes tener una lista mucho más grande de genes recesivos, que sería imposible detectar el dominante". - dos problemas. 1) no todos los genes recesivos están realmente inactivos. 2) Una vez que conoce la cadena de aminoácidos, puede encontrar con bastante facilidad un gen que la codificó, sin importar dónde se encuentre.
1) ¿"Añadir más proteínas al ADN para contaminarlo"? El ADN está lleno de histonas en su estado natural, pero es bastante fácil deshacerse de ellas; ese es un paso clave en cualquier purificación de ADN , y las histonas han evolucionado específicamente para unirse al ADN. 2) ¿ alelos recesivos ? Por lo general, tienen secuencias increíblemente similares a los alelos dominantes. 3) La clonación es exactamente lo que está tratando de evitar. Desnuclear un óvulo huésped, insertar el ADN y son dorados