Tabla de consulta de 12 a 6

Question

Tabla de consulta de 12 a 6

UPC
RAM
cache
Física

Vendicar decariano

Tengo una aplicación donde 12 bits de entrada necesitan generar 6 bits de salida de manera configurable por el usuario. Por supuesto, esto requiere el uso de una tabla de búsqueda basada en RAM.

Me di cuenta de que la RAM estática más rápida disponible tiene un tiempo de acceso de aproximadamente 10 ns, lo que limita la velocidad de acceso a la tabla de búsqueda a 100 Mhz.

¿Cómo logran los microprocesadores acceder a sus cachés internas en 1 ciclo de reloj, generalmente 30 veces más rápido que esto? ¿La velocidad del chip RAM está limitada por su bus de comunicación externo o es algo más?

Vendicar decariano

Obviamente. La pregunta ya contenía esa información y preguntaba por qué era así, específicamente qué propiedades de la caché RAM la hacen tan rápida, cuando es computacionalmente más complejo acceder, ya que el acceso debe pasar por controles realizados por un controlador de caché.

Oskar Skog

Lo siento, debo haberme quedado ciego o algo así.

Respuestas (1)

Tabla de consulta de 12 a 6

Obviamente. La pregunta ya contenía esa información y preguntaba por qué era así, específicamente qué propiedades de la caché RAM la hacen tan rápida, cuando es computacionalmente más complejo acceder, ya que el acceso debe pasar por controles realizados por un controlador de caché.

finbarr · Answer 1

finbarr

La memoria caché en chip está diseñada como parte de los circuitos de interfaz de memoria y está optimizada para la velocidad a expensas de otras consideraciones, como el consumo de energía y el área del troquel, que pueden hacerla poco práctica para tamaños más grandes. Tampoco es generalmente accesible para el usuario, por lo que sus circuitos de direccionamiento y rutas de datos pueden simplificarse. Todo eso en combinación con la falta de inductancias y capacitancias parásitas y el almacenamiento en búfer necesario para admitir el acceso fuera del chip lo hace considerablemente más rápido.

Cuéntenos más sobre su aplicación, ya que puede haber otras opciones disponibles.

Vendicar decariano

Deseo explorar la posibilidad de producir un dispositivo computacional programable genérico, de n bits de ancho, que genere n bits de salida. Se admitirán operaciones de 2**k.

finbarr

Estaba más interesado en el tipo de áreas de aplicación a las que apuntaba que requerirían más de 100 MHz de rendimiento.

Vendicar decariano

Continúa.... selección arbitraria de bits consecutivos al mismo tiempo que cualquier otra operación en cualquier otro conjunto de bits consecutivos independientes.

Vendicar decariano

Propósito, General Computacional. Un elemento computacional general que se utiliza para reemplazar múltiples tipos de elementos computacionales que se encuentran en un microprocesador y para brindar una flexibilidad única al especificar instrucciones adicionales que son específicas de la aplicación.

Vendicar decariano

Tal elemento computacional se puede hacer. La pregunta es, ¿son los transistores lo suficientemente rápidos para que el tiempo de establecimiento del resultado sea lo suficientemente corto como para ser práctico?

Vendicar decariano

Al colocar los bits de selección de código de operación en los bits de dirección de orden superior, seguidos de las entradas A, B y C, solo quedan dos bits para conectar en cascada. L y R, dado que los bits superiores ya han convergido en una solución, ¿hay tiempo suficiente para que 2 bits de selección menos significativos se unan en cascada sobre un registro de n bits? Creo que sí. ¿Debería canalizarse tal instrucción porque potencialmente toma más de 1 ciclo?

finbarr

Las preguntas sobre si las cosas van a ser lo suficientemente rápidas dependen más bien de lo que significa "lo suficientemente rápido". Si 100 MHz no es lo suficientemente rápido, ¿qué velocidad está buscando?

Vendicar decariano

Este sistema de comentarios realmente apesta.

Vendicar decariano

El sistema de mensajes dejó caer un segmento 2**k operaciones deben ser compatibles. Cada bit toma como entrada A, BC, Li y Ri. L y genera una salida O, Lo, Ro, FF se asigna a algún registro de bandera, C, OV, S, Z, etc. Lo se envía a Ri del siguiente bit consecutivo, y Ro se envía a Li del bit anterior. poco.

finbarr

Su pregunta era sobre cómo el caché en el chip es más rápido que la RAM fuera del chip, le sugiero que haga una nueva pregunta específicamente relacionada con su diseño donde pueda hacerla con más detalle.

Tabla de consulta de 12 a 6

Vendicar decariano

Vendicar decariano

Oskar Skog

Respuestas (1)

finbarr

Vendicar decariano

finbarr

Vendicar decariano

Vendicar decariano

Vendicar decariano

Vendicar decariano

finbarr

Vendicar decariano

Vendicar decariano

finbarr

Promedio de tiempo para dos cachés, cpu y ram

¿Cómo lee la CPU los datos de la RAM?

¿Qué determina el tamaño máximo de un caché de CPU?

Aumentar el tamaño de la línea de caché cuando el caché y la RAM no funcionan de forma asíncrona

Política de escritura de caché de CPU: ¿desalojar ya está sucio? + almacenamiento de dirección de memoria

¿Se almacenan en caché los recorridos de la tabla de páginas?

¿Puede ejecutar un procesador de clase x86 sin ramless?

¿Qué hace la CPU 8086 con los datos devueltos desde una dirección en la RAM?

¿Diferencia entre cachés de 2 y 4 vías?

¿Cómo puede el caché ser tan rápido?