Validación y bring-up del TC1
Los dos vídeos muestran el arranque (bring-up) y la validación exitosa del Test Chip 1 (TC1). Demuestran que el chip es capaz de arrancar Linux y ejecutar un conjunto representativo de benchmarks computacionales, confirmando tanto la corrección funcional como la integración a nivel de sistema de dos de los núcleos integrados en TC1.
Ambos sistemas ejecutan una distribución de Linux generada con Buildroot, basada en la versión 6.12.11 del kernel de Linux. El software stack incluye paquetes esenciales de espacio de usuario, soporte para bibliotecas compartidas y herramientas estándar de línea de comandos necesarias para ejecutar y validar cargas de trabajo. La demostración también muestra cómo el sistema operativo detecta e informa correctamente de las extensiones arquitectónicas RISC-V soportadas, validando además la compatibilidad hardware–software.
TC1 Lagarto Ox
El primer vídeo (TC1-Lagarto-Ox-video) se centra en el proceso de arranque de Linux ejecutándose en Lagarto Ox, uno de los tres núcleos integrados en TC1. Lagarto Ox es un procesador RISC-V out-of-order de seis vías, diseñado y desarrollado íntegramente en el BSC. La secuencia de arranque exitosa confirma la correcta interacción entre el procesador, el subsistema de memoria y la infraestructura de periféricos.
Para validar las capacidades computacionales, el vídeo incluye la ejecución de varios benchmarks numéricos: producto escalar (dot product), AXPY, multiplicación de matriz dispersa por vector (SpMV), multiplicación de matriz densa por vector (GEMV), multiplicación de matrices densas (GEMM), fused multiply-add (FMA) y gradientes conjugados (CG). El resultado de cada benchmark se muestra en pantalla, confirmando la corrección funcional y proporcionando también indicaciones preliminares de rendimiento.
Además, este primer vídeo explora el impacto de técnicas básicas de optimización del compilador, como el loop unrolling, ilustrando cómo las estrategias de generación de código influyen en la eficiencia de ejecución. Estos ejemplos destacan la importancia de las optimizaciones del compilador para extraer rendimiento de microarquitecturas RISC-V modernas out-of-order.
TC1 Lagarto Ka+VPU
El segundo vídeo (TC1-Lagarto-Ka+VPU) destaca la ejecución de Lagarto Ka, otro de los tres núcleos integrados en TC1. Lagarto Ka es un procesador RISC-V out-of-order de dos vías, también diseñado íntegramente en el BSC. Una característica clave de este núcleo es la integración de una Vector Processing Unit (VPU), que permite soporte para la extensión vectorial de RISC-V (RVV). Esta capacidad permite ejecutar instrucciones vectoriales y acelerar cargas de trabajo paralelas en datos, ampliando su aplicabilidad en dominios computacionalmente intensivos.
En esta segunda demostración, la validación numérica se centra en dos kernels representativos: la operación AXPY y la multiplicación de matrices densas (GEMM). Estos benchmarks se seleccionaron para evaluar tanto las rutas de ejecución escalar como vectorial, así como para analizar el comportamiento de la unidad de procesamiento vectorial (VPU) integrada en Lagarto Ka. Para ambos kernels se exploraron diferentes precisiones numéricas, ejecutando las cargas de trabajo con elementos de punto flotante de precisión simple y doble.
En conjunto, ambos vídeos demuestran el funcionamiento correcto de los núcleos, incluyendo el arranque del sistema y la ejecución de cargas de trabajo, validando tanto la funcionalidad escalar como vectorial. En particular, confirman la correcta integración de la unidad vectorial dentro de la microarquitectura del procesador y su adecuada exposición a través de la pila de software.
En general, esta demostración representa un paso importante en la validación de TC1, confirmando el correcto funcionamiento del procesador, el sistema operativo y la pila de software, al tiempo que proporciona indicadores tempranos de rendimiento de la plataforma. También aporta evidencia adicional de la madurez funcional de TC1 y de la versatilidad de sus diseños de núcleos heterogéneos.