Resolucion correccion errores PPT
Otros Documentos
Ver licitación
{# full_text keeps real newlines; whitespace-pre-wrap renders them
(so no |linebreaks filter, which would double the spacing). #}
<!-- image -->
<!-- image -->
<!-- image -->
Resolución 36/2026, de la Presidencia de la Agencia Estatal de Meteorología, por la que se corrigen errores del PPT del expediente de contratación 202500000285, Contrato mixto de suministro, instalación, interconexión, soporte y garantía de un sistema de supercomputación distribuido en dos clústeres para la Agencia Estatal de Meteorología, parcialmente financiado por el PRTR - NextGen EU
Advertidos errores en el PPT del expediente de contratación 202500000285, procede su corrección en términos indicados en los siguientes tenores literales:
En el epígrafe 2.1.1.8 Tabla de requisitos formales
## Donde dice:
| GEN_005 | La documentación deberá entregarse en formato editable y mantenerse actualizada durante todo el contrato, incluyendo cambios realizados durante pruebas de aceptación FAT/SAT. | MRQ |
|-----------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| GEN_005 | La documentación deberá entregarse en formato standard (html o pdf) y ser accesible online, además de mantenerse actualizada durante todo el contrato, incluyendo cambios realizados durante pruebas de aceptación FAT/SAT. | MRQ |
|-----------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| GEN_007 | La solución deberá garantizar interoperabilidad completa entre el clúster interno de AEMET y el clúster externo mediante IX-CPDs (Lote 3 del Contrato Unificado de Comunicaciones). | MRQ |
|-----------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| GEN_007 | La solución deberá garantizar interoperabilidad completa entre el clúster interno de AEMET y el clúster externo mediante IX-CPDs | MRQ |
|-----------|------------------------------------------------------------------------------------------------------------------------------------|-------|
En el epígrafe 2.2.1 Requisitos físicos del CPD de AEMET
## Donde dice:
| HPCINT_001 | Espacio destinado a la Zona HPC. El sistema se instalará en la Zona HPC del CPD de AEMET, con una superficie útil aproximada de 84,60 m² (≈235 baldosas de 60×60 cm), libre de pilares y disponible una vez desinstalado el HPC actual. La disposición deberá permitir encaminamiento de fibra y cableado hacia los puntos de interconexión del clúster externo. | MQR |
|--------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
<!-- image -->
## Debe decir
| HPCINT_001 | Espacio destinado a la Zona HPC. El sistema se instalará en la Zona HPC del CPD de AEMET, con una superficie útil aproximada de 84,60 m² (≈235 baldosas de 60×60 cm), disponible una vez desinstalado el HPC actual. La disposición deberá permitir encaminamiento de fibra y cableado hacia los puntos de interconexión del clúster externo. | MQR |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| HPCINT_003 | Capacidad de carga estructural. La losa del CPD dispone de una sobrecarga admisible de 2 kN/m². Cualquier disposición del nuevo HPC que exceda este límite requerirá el diseño, proyecto visado, instalación y legalización de una subestructura auxiliar de transmisión de cargas, sin afectar a la operación del CPD. | MQR |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCINT_003 | Capacidad de carga estructural. La losa del CPD dispone de una sobrecarga admisible de 2 kN/m². Se proyectará, una subestructura auxiliar de trasmisión de cargas desde el soporte del nuevo HPC a la losa de planta, de manera que no se sobrepasen las sobrecargas de uso para las que fueron calculadas, justificándose el diseño y los cálculos de dicha subestructura mediante certificado técnico, con informe firmado por técnico competente y visado por el Colegio Profesional correspondiente. Cualquier disposición del nuevo HPC que exceda este límite de carga requerirá de un refuerzo de la estructura existente y, tanto su diseño como los cálculos justificativos de éste, se documentarán mediante un proyecto redactado y firmado por técnico competente y visado por el Colegio Profesional correspondiente, sin afectar a la operación del CPD. El alcance y estructura del certificado técnico y/o del proyecto será aprobado previamente por el Servicio de Obras e Instalaciones de la AEMET. | MQR |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| HPCINT_008 | Requisitos ambientales básicos. La sala deberá mantener condiciones operativas de temperatura y humedad compatibles con la ASHRAE Clase A1/A2. La distribución deberá integrarse con el sistema de puertas frías y los evaporadores y condensadores existentes. | MQR |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
<!-- image -->
<!-- image -->
HPCINT\_008
<!-- image -->
Requisitos ambientales básicos. La sala deberá mantener condiciones operativas de temperatura y humedad compatibles con la ASHRAE Clase A1/A2.
En el epígrafe 2.2.3 Requisitos de refrigeración del CPD de AEMET
## Donde dice:
La solución de refrigeración que se instale para dar servicio al nuevo sistema de supercomputación deberá garantizar la disipación térmica necesaria para soportar de forma segura y continua la carga de trabajo prevista, integrándose completamente con la infraestructura existente del CPD de AEMET. El diseño, dimensionamiento, ubicación, canalización e implementación del sistema deberán cumplir con los requisitos técnicos del edificio, su estructura y sus limitaciones energéticas, así como con la normativa aplicable en materia de instalaciones térmicas y eficiencia energética.
Las actuaciones deberán realizarse en coordinación con el Servicio de Obras e Instalaciones de AEMET, que supervisará tanto el diseño técnico como la ejecución. La instalación deberá respetar la arquitectura actual del CPD, que cuenta con evaporadores instalados en sala técnica, condensadores situados en cubierta, canalizaciones a través de falso techo y patinillo técnico, y una potencia frigorífica actualmente instalada de 423,60 kW.
Cualquier elemento que obstaculice la instalación de las nuevas unidades deberá ser retirado o trasladado por el adjudicatario. En caso de que las cargas estructurales superen los límites admisibles, deberá proyectarse una subestructura auxiliar o un refuerzo estructural, ambos debidamente calculados, firmados por técnico competente y visados por el Colegio Profesional correspondiente.
## Debe decir:
La solución de refrigeración que se instale para dar servicio al nuevo sistema de supercomputación deberá garantizar la disipación térmica necesaria para soportar de forma segura y continua la carga de trabajo prevista, integrándose completamente con la infraestructura existente del CPD de AEMET, garantizando que las cargas térmicas del HPC sean refrigeradas por su propio sistema de refrigeración y no suponga una sobrecarga para el sistema de refrigeración del resto del CPD. El diseño, dimensionamiento, ubicación, canalización e implementación del sistema deberán cumplir con los requisitos técnicos del edificio, su estructura y sus limitaciones energéticas, así como con la normativa aplicable en materia de instalaciones térmicas y eficiencia energética.
Las actuaciones deberán realizarse en coordinación con el Servicio de Obras e Instalaciones de AEMET, que supervisará tanto el diseño técnico como la ejecución. La instalación deberá respetar y ser independientes de las instalaciones de refrigeración existentes para el CPD.
3
MQR
<!-- image -->
<!-- image -->
Las nuevas unidades de refrigeración exterior deberán situarse en la cubierta de la planta segunda, preferiblemente sobre el espacio liberado tras la desinstalación de la refrigeración del actual HPC. Cualquier elemento que obstaculice la instalación de las nuevas unidades de refrigeración deberá ser objeto de demolición o traslado previo por el adjudicatario, siempre en coordinación con el Servicio de Obras e Instalaciones de la AEMET y siguiendo sus prescripciones.
Para transmitir las cargas del sistema de refrigeración a la estructura del edificio se instalarán bancadas realizadas con perfiles metálicos de acero laminado apoyados sobre enanos de hormigón armado, recrecidos sobre los pilares existentes de la planta inferior, rematados por placas de anclaje y conectados mediante taladros y resina epoxi, de manera similar a las existentes en la cubierta actualmente. Deberá justificarse el diseño de esta infraestructura de apoyo y transmisión de cargas del sistema de refrigeración, cálculos de armados, secciones de perfiles y cualquier elemento estructural necesario, mediante proyecto redactado y firmado por técnico competente y visado por el Colegio Profesional correspondiente.
## Donde dice:
| HPCINT_025 | Las unidades exteriores (condensadores u otros elementos) deberán situarse en la cubierta de la planta segunda, en el espacio liberado tras la desinstalación del sistema existente. | MQR |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCINT_025 | Las unidades exteriores (condensadores u otros elementos) deberán situarse en la cubierta de la planta segunda, en el espacio liberado tras la desinstalación del sistema existente, cumpliendo con la normativa vigente. | MQR |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| HPCINT_030 | Si la instalación supera los límites de carga, se deberá proyectar una subestructura auxiliar de transmisión de cargas a los pilares existentes. | MQR |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_031 | La subestructura o refuerzos deberán justificarse mediante proyecto técnico firmado y visado por técnico competente. | MQR |
## Debe decir:
| HPCINT_030 | En caso necesario, para transmitir las cargas del sistema de refrigeración a la estructura del edificio se instalarán bancadas realizadas con perfiles metálicos de acero laminado apoyados sobre enanos de hormigón armado, recrecidos sobre los pilares existentes de la planta inferior, rematados por placas de anclaje y conectados mediante taladros y resina epoxi | MQR |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
<!-- image -->
HPCINT\_031
<!-- image -->
Deberá justificarse el diseño de la infraestructura de apoyo y transmisión de cargas del sistema de refrigeración, mediante proyecto redactado y firmado por técnico competente y visado por el Colegio Profesional correspondiente.
En el epígrafe 2.2.4 Arquitectura de las instalaciones
## Donde dice:
El clúster deberá estar organizado en racks de cómputo, racks de almacenamiento, racks de red e infraestructura auxiliar, siguiendo una distribución lógica que optimice el flujo de aire, la separación entre rutas eléctricas A/B y la infraestructura de refrigeración existente basada en pasillo frío/pasillo caliente y puertas frías.
## Debe decir:
El clúster deberá estar organizado siguiendo una distribución lógica que optimice el flujo de aire, la separación entre rutas eléctricas A/B y la infraestructura de refrigeración existente del resto del CPD.
## Donde dice:
| HPCINT_038 | El diseño del clúster deberá organizarse en racks de cómputo, gestión, almacenamiento y red, con disposición alineada a la arquitectura del CPD. | MQR |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCINT_038 | El diseño del clúster deberá organizarse siguiendo una distribución lógica que optimice el flujo de aire, la separación entre rutas eléctricas A/B y la infraestructura de refrigeración existente | MQR |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| HPCINT_040 | El clúster deberá instalarse siguiendo la configuración de pasillo frío/pasillo caliente y ser totalmente compatible con el sistema de puertas frías existente. | MQR |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
MQR
<!-- image -->
<!-- image -->
| HPCINT_040 | El clúster deberá instalarse de forma que sea totalmente compatible con el resto del CPD | MQR |
|--------------|--------------------------------------------------------------------------------------------|-------|
## Donde dice:
| HPCINT_045 | Los nodos del clúster deberán conectarse mediante redes de alta velocidad compatibles con el entorno HPC (InfiniBand u otras equivalentes), integradas con el CPD. | MQR |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCINT_045 | Los nodos del clúster deberán conectarse mediante redes de alta velocidad y baja latencia compatibles con el entorno HPC (InfiniBand u otras equivalentes), integradas con el CPD. | MQR |
|--------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
En el epígrafe 2.2.5 Conectividad a la red de comunicaciones y cableado
## Donde dice:
- Red de interconexión de alta velocidad (Fabric):
Características mínimas:
Basada en tecnologías abiertas:
- o InfiniBand HDR/NDR o Ethernet ≥ 100 Gb/s (preferiblemente 200/400 Gb/s según partición).
- o Latencias ultrabajas con soporte para RDMA o tecnología equivalente.
- o Arquitectura sin contención (non-blocking), con capacidad de escalado y compatibilidad con topologías fat-tree, dragonfly(+) o equivalentes.
- o La red deberá permitir la federación lógica de ambos clústeres, garantizando que las cargas HPC y los modelos operativos puedan ejecutarse de forma distribuida sin degradación significativa.
Cuando se requiera interconectar servicios o particiones específicos entre CPDs mediante Fabric, el adjudicatario deberá proporcionar las pasarelas, gateways o mecanismos de encapsulación necesarios para mantener las prestaciones y la seguridad.
## Debe decir:
- Red de interconexión de alta velocidad (Fabric):
<!-- image -->
## Características mínimas:
Basada en tecnologías abiertas:
- o InfiniBand NDR (400Gbps) o basada en Ethernet equivalente
- o Latencias ultrabajas con soporte para RDMA o tecnología equivalente.
- o Arquitectura sin contención (non-blocking), con capacidad de escalado y compatibilidad con topologías fat-tree, dragonfly(+) o equivalentes.
## Donde dice:
| HPCINT_052 | Red Fabric (interconexión HPC de baja latencia): El adjudicatario deberá desplegar la red de interconexión HPC basada en InfiniBand HDR/NDR o Ethernet ≥ 100/200/400 Gb/s según partición. La red deberá ser non-blocking, con soporte RDMA, arquitecturas tipo fat- tree o dragonfly(+), capacidad de federación entre clústeres, y mecanismos de encapsulación/gateway cuando sea necesario unir particiones entre CPDs. | MRQ |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCINT_052 | Red Fabric (interconexión HPC de baja latencia): El adjudicatario deberá desplegar la red de interconexión HPC basada en InfiniBand NDR o Ethernet ≥ 400Gb/s según partición. La red deberá ser non- blocking, con soporte RDMA, arquitecturas tipo fat-tree o dragonfly(+) | MRQ |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| HPCINT_058 | Interconexión entre CPDs para red de almacenamiento: Ahora responsabilidad del adjudicatario. Se deberá proveer fibra óptica, transceptores, gateways y mecanismos de cifrado específicos para garantizar integridad y rendimiento en el acceso a almacenamiento remoto entre ambos CPDs. | MRQ |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
<!-- image -->
<!-- image -->
## Debe decir:
| HPCINT_058 | Interconexión entre CPDs para red de almacenamiento. Se deberá proveer fibra óptica, transceptores, gateways y mecanismos de cifrado específicos para garantizar integridad y rendimiento en el acceso a almacenamiento remoto entre ambos CPDs. | MRQ |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| HPCINT_060 | Conectividad interna del sistema HPC: El adjudicatario deberá conectar correctamente los nodos de administración, login, visualización, DTN, almacenamiento y gestión conforme a la topología definida, garantizando redundancia, rutas alternativas ausência de contención en tráfico crítico. | TRQ |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCINT_060 | Conectividad interna del sistema HPC: El adjudicatario deberá conectar correctamente los nodos de administración, login, visualización, DTN, almacenamiento y gestión conforme a la topología definida, garantizando redundancia, rutas alternativas ausencia de contención en tráfico crítico. | MRQ |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
En el epígrafe 2.2.6 Instalación e Integración de CPD de AEMET
## En el segundo párrafo:
## Donde dice:
La integración del equipo no se limita a su ubicación física, sino que también exige compatibilidad con las rutas de cableado y canalizaciones existentes. Tanto la red de datos, como las redes de gestión, OOB, Fabric y almacenamiento, deberán conectarse empleando las rutas ya establecidas en el CPD, recurriendo a nuevas canalizaciones únicamente cuando resulte imprescindible para enlazar con el clúster externo. Esta conectividad deberá además alcanzar capacidades muy elevadas, garantizando interfaces redundantes de alta velocidad, capaces de suministrar un ancho de banda agregado mínimo de 800 Gbps, para integrarse sin restricciones en las redes internas de alto rendimiento de AEMET.
## Debe decir:
<!-- image -->
<!-- image -->
<!-- image -->
La integración del equipo no se limita a su ubicación física, sino que también exige compatibilidad con las rutas de cableado y canalizaciones existentes. Todas estas redes deberán seguir un diseño coherente con el resto de redes de AEMET, recurriendo a nuevo cableado y canalizaciones cuando sea imprescindible. Esta conectividad deberá además alcanzar capacidades muy elevadas, garantizando interfaces redundantes de alta velocidad, capaces de suministrar un ancho de banda agregado mínimo de 800 Gbps, para integrarse sin restricciones en las redes internas de alto rendimiento de AEMET.
## En el séptimo párrafo:
## Donde dice:
Antes de presentar la oferta, será necesario detallar las configuraciones previstas para cada fase del proyecto, describir los requisitos eléctricos y de refrigeración, estimar cargas térmicas, definir la continuidad necesaria mediante UPS o grupos electrógenos, y explicar las necesidades de espacio, pesos y posibles restricciones de instalación. Igualmente, los licitadores deberán describir todas las alternativas de refrigeración disponibles -por aire, por agua o soluciones híbridas- analizando ventajas y limitaciones de cada una. En los casos en que se emplee refrigeración por agua, será obligatorio incorporar intercambiadores térmicos intermedios para proteger la calidad del circuito.
## Debe decir:
Antes de presentar la oferta, será necesario detallar las configuraciones previstas para cada fase del proyecto, describir los requisitos eléctricos y de refrigeración, estimar cargas térmicas y explicar las necesidades de espacio, pesos y posibles restricciones de instalación. Igualmente, los licitadores deberán describir todas las alternativas de refrigeración disponibles -por aire, por agua o soluciones híbridas- analizando ventajas y limitaciones de cada una. En los casos en que se emplee refrigeración por agua, será obligatorio incorporar intercambiadores térmicos intermedios para proteger la calidad del circuito.
## En los requisitos:
## Donde dice:
| HPCINT_067 | Compatibilidad con infraestructuras existentes: El sistema se integrará con las infraestructuras actuales de climatización, energía y comunicaciones del CPD sin requerir modificaciones estructurales que afecten al servicio operativo. El licitador deberá acreditar que todo el equipamiento cumple con las limitaciones físicas y técnicas establecidas en el Anexo IV, sin exceder los parámetros definidos por AEMET. | MRQ |
|--------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
<!-- image -->
<!-- image -->
| HPCINT_067 | Compatibilidad con infraestructuras existentes: El sistema se integrará con las infraestructuras actuales de climatización, energía y comunicaciones del CPDsin requerir modificaciones estructurales que afecten al servicio operativo. Garantizando que las cargas térmicas del HPC sean refrigeradas por el sistema de refrigeración del HPC y no suponga una sobrecarga para el sistema de refrigeración del resto del CPD. El licitador deberá acreditar que todo el equipamiento cumple con las limitaciones físicas y técnicas establecidas en el Anexo IV, sin exceder los parámetros definidos por AEMET. | MRQ |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| HPCINT_069 | Rutas y canalizaciones: Todas las rutas de cableado (eléctrico, OOB, red de gestión, Fabric, almacenamiento) deberán ajustarse a las rutas existentes en el CPD. Si fueran necesarias nuevas canalizaciones para la interconexión con el clúster externo, el adjudicatario deberá diseñarlas, ejecutarlas y documentarlas con aprobación previa de CTEL. | MRQ |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCINT_069 | Rutas y canalizaciones: Todas las rutas de cableado (eléctrico, OOB, red de gestión, Fabric, almacenamiento) deberán adaptarse a las rutas existentes en el CPD. Si fueran necesarias nuevas canalizaciones, el adjudicatario deberá diseñarlas, ejecutarlas y documentarlas con aprobación previa de CTEL. | MRQ |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| HPCINT_071 | Operación térmica: El sistema deberá funcionar en el rango térmico nominal del CPD (hasta 30 °C). El licitador deberá especificar el rango completo de temperaturas soportadas y el impacto sobre rendimiento y estabilidad. | MRQ |
|--------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCINT_071 | Operación térmica: El sistema deberá funcionar en el rango térmico nominal del CPD (hasta 35 °C). El licitador deberá especificar el rango completo de temperaturas soportadas y el impacto sobre rendimiento y estabilidad. | MRQ |
|--------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
<!-- image -->
<!-- image -->
| HPCINT_079 | Como Etapa 1 de la Fase 0 o preliminar, el adjudicatario presentará una memoria con la planificación de la adecuación del entorno físico (las infraestructuras del CPD de AEMET), para la instalación de las distintas fases de su Sistema: • Fase 1: instalación clúster inicial 1 • Fase 2: instalación clúster inicial 2 • Fase 3: instalación clúster final 1 • Fase 4: instalación clúster final 2 | MQR |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCINT_079 | En la fase 1, Diseño Detallado de la Solución, el adjudicatario presentará una memoria con la planificación de la adecuación del entorno físico (las infraestructuras del CPD de AEMET), para la instalación de las distintas fases del Sistema. | MQR |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
En el epígrafe 2.2.7.2 Distribución mínima de nodos
## Donde dice:
La distribución mínima de nodos indicada en este apartado se ha determinado tomando como referencia las capacidades de cómputo y la estructura de particiones del superordenador actualmente operativo en AEMET, adaptadas a las limitaciones energéticas, térmicas y espaciales del CPD de los Servicios Centrales. No obstante, el número efectivo de nodos que deberá suministrarse y ponerse en producción vendrá condicionado, en última instancia, por los recursos necesarios para la correcta verificación del benchmark de predicción numérica del tiempo definido en este pliego.
La distribución de los nodos por partición será la siguiente (número mínimo de nodos por partición):
| Partición | Número mínimo de nodos | Descripción funcional |
|------------------------|-----------------------------------------------------------------------|--------------------------------------------------------------------|
| 233 - 3 | Nodos homogéneos destinados a la producción operativa meteorológica y | Cómputo (CPU) |
| 4 | Nodos de acceso para usuarios internos servicios automatizados. | Acceso - Login y |
| Acceso - Visualización | 4 | Nodos para pre y postproceso, validación y visualización de datos. |
| Administración | 3 | Nodos dedicados a gestión, monitorización, despliegue y control. |
<!-- image -->
Entrada/Salida (DTN)
4
<!-- image -->
Nodos de transferencia de datos entre almacenamiento y red institucional.
El sistema de refrigeración del superordenador instalado en el CPD de AEMET deberá integrarse plenamente con la capacidad frigorífica disponible en la instalación y respetar las limitaciones estructurales y operativas del centro, sin prescribir una tecnología concreta. El licitador podrá proponer la solución -por aire, por agua, híbrida o mediante cualquier otra tecnología de refrigeración adecuada para entornos HPC- que garantice el cumplimiento de los requisitos térmicos, de eficiencia energética, redundancia y continuidad de servicio establecidos en el pliego, así como su compatibilidad con la infraestructura existente y su capacidad de ampliación futura.
La contribución máxima de refrigeración por aire en la partición de cómputo no superará el 15 % de la potencia térmica total, garantizando un rendimiento estable y una operación energéticamente eficiente.
## Debe decir:
La distribución mínima de nodos indicada en este apartado se ha determinado tomando como referencia las capacidades de cómputo y la estructura de particiones del superordenador actualmente operativo en AEMET, adaptadas a las limitaciones energéticas, térmicas y espaciales del CPD de los Servicios Centrales y teniendo en cuenta las capacidades superiores e los nodos más actuales. No obstante, el número efectivo de nodos que deberá suministrarse y ponerse en producción vendrá condicionado, en última instancia, por los recursos necesarios para la correcta verificación del benchmark de predicción numérica del tiempo definido en este pliego.
La distribución de los nodos por partición será la siguiente (número mínimo de nodos por partición):
| Partición | Número mínimo de nodos | Descripción funcional |
|------------------------|---------------------------------------|--------------------------------------------------------------------|
| 160 | Nodos homogéneos producción operativa | Cómputo (CPU) destinados a la meteorológica y |
| Acceso - | 4 Nodos servicios | Login de acceso para usuarios internos y automatizados. |
| Acceso - Visualización | 8 | Nodos para pre y postproceso, validación y visualización de datos. |
| Administración | 3 | Nodos dedicados a gestión, monitorización, despliegue y control. |
<!-- image -->
<!-- image -->
| Entrada/Salida (DTN) | 4 | Nodos de transferencia de datos entre almacenamiento y red institucional. |
|------------------------|-----|-----------------------------------------------------------------------------|
El sistema de refrigeración del superordenador instalado en el CPD de AEMET deberá garantizar que las cargas térmicas del HPC sean refrigeradas por el sistema de refrigeración del HPC y no suponga una sobrecarga para el sistema de refrigeración del resto del CPD. Respetar las limitaciones estructurales y operativas del centro, sin prescribir una tecnología concreta. El licitador podrá proponer la solución -por aire, por agua, híbrida o mediante cualquier otra tecnología de refrigeración adecuada para entornos HPC- que garantice el cumplimiento de los requisitos térmicos, de eficiencia energética, redundancia y continuidad de servicio establecidos en el pliego, así como su compatibilidad con la infraestructura existente y su capacidad de ampliación futura.
En el caso de que la solución sea híbrida o por agua, la contribución máxima de refrigeración por aire en la partición de cómputo no superará el 15 % de la potencia térmica total, garantizando un rendimiento estable y una operación energéticamente eficiente.
En el epígrafe 2.2.7.3, Requisitos generales del cluster de AEMET
## Donde dice:
| HPCINT_098 | Características comunes de los nodos: Todos los nodos deberán disponer de una tarjeta de gestión remota (BMC) con, al menos, las siguientes características: • Puerto Ethernet dedicado o compartido. • Gestión remota mediante GUI HTML5 (sin dependencias Java). • Consola virtual y VMedia. • Mecanismos de protección frente a cambios no autorizados en producción. • Actualizaciones de firmware firmadas digitalmente y reversibles. • Protección ante actualizaciones no seguras de componentes internos. • Contraseña predeterminada segura y políticas de rotación. • Soporte de autenticación NIS, LDAP/IdP corporativo. • Bloqueo por IP y gestión del flujo de aire. Además, los nodos deberán disponer de sistemas de monitorización remota y alerta temprana, capaces de enviar notificaciones automáticas ante fallos potenciales de memoria o | MQR |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
<!-- image -->
<!-- image -->
| HPCINT_099 | Supervisión de fallos del sistema: La infraestructura deberá permitir la monitorización integral del estado de todos los componentes hardware y software mediante herramientas abiertas o integrables con el sistema de supervisión de AEMET. La plataforma de supervisión deberá ofrecer APIs abiertas (REST, Redfish o SNMP) que permitan la integración con sistemas de terceros y notificar cualquier fallo de hardware relevante en menos de 300 s desde su detección. | MQR |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCINT_098 | Características comunes de los nodos: Todos los nodos deberán disponer de una tarjeta de gestión remota (BMC) con, al menos, las siguientes características: • Puerto Ethernet dedicado o compartido. • Gestión remota mediante GUI HTML5 (sin dependencias Java). • Consola virtual y VMedia. • Mecanismos de protección frente a cambios no autorizados en producción. • Actualizaciones de firmware firmadas digitalmente y reversibles. • Protección ante actualizaciones no seguras de componentes internos. • Contraseña predeterminada segura y políticas de rotación. • Soporte de autenticación LDAP,SSSD,IdM o compatible con IdP corporativo corporativo. • Bloqueo por IP y gestión del flujo de aire. Además, los nodos deberán disponer de sistemas de monitorización remota y alerta temprana, capaces de enviar notificaciones automáticas ante fallos potenciales de memoria o | MQR |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_099 | Supervisión de fallos del sistema: La infraestructura deberá permitir la monitorización integral del estado de todos los componentes hardware y software mediante herramientas abiertas o integrables con el sistema de supervisión de AEMET. La plataforma de supervisión deberá ofrecer APIs abiertas (REST, Redfish o SNMP) que permitan la integración con sistemas de terceros y notificar cualquier fallo de hardware relevante en menos de 60 s desde su detección. | MQR |
## Donde dice:
| HPCINT_101 | API de supervisión y gestiónLos sistemas de supervisión y gestión deberán proporcionar APIs estandarizadas que permitan la integración con las herramientas de monitorización y gobierno de AEMET. Estas APIs deberán ofrecer información sobre el estado de salud y rendimiento de todos los componentes de la infraestructura y generar alertas ante incidencias en un máximo de 300 s. | MQR |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
<!-- image -->
<!-- image -->
En el epígrafe 2.2.8.1 Requisitos de la red fabric o de baja latencia
| HPCINT_101 | API de supervisión y gestión. Los sistemas de supervisión y gestión deberán proporcionar APIs estandarizadas que permitan la integración con las herramientas de monitorización y gobierno de AEMET. Estas APIs deberán ofrecer información sobre el estado de salud y rendimiento de todos los componentes de la infraestructura y generar alertas ante incidencias en un máximo de 60 s. | MQR |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| HPCINT_105 | Requisitos generales: La infraestructura de red deberá proporcionar una estructura de interconexión de baja latencia y alto ancho de banda que conecte todos los nodos del sistema (de cómputo, E/S, administración y visualización) tanto en el clúster principal (CPD AEMET) como en el clúster externo. La red deberá cumplir las siguientes características mínimas: • Basada en tecnología de al menos 200 Gb/s por enlace. • Ancho de banda bidireccional completo por puerto (full-duplex). • Soporte para RDMA(Remote Direct Memory Access) y optimización de comunicaciones MPI (Message Passing Interface). • Compatibilidad con mecanismos de federación entre clústeres y segmentación de tráfico HPC mediante QoS y VLAN dedicadas.El diseño deberá garantizar el equilibrio entre latencia, ancho de banda y escalabilidad futura del sistema. | MQR |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCINT_105 | Requisitos generales: La infraestructura de red deberá proporcionar una estructura de interconexión de baja latencia y alto ancho de banda que conecte todos los nodos del sistema (de cómputo, E/S, administración y visualización) tanto en el clúster principal (CPD AEMET) como en el clúster externo. La red deberá cumplir las siguientes características mínimas: • Basada en tecnología de al menos 400 Gb/s. • Ancho de banda bidireccional completo (full dúplex ) por enlace de 200 Gb/s). • Soporte para RDMA(Remote Direct Memory Access) y optimización de comunicaciones MPI (Message Passing Interface). • Compatibilidad con mecanismos de federación entre clústeres y segmentación de tráfico HPC mediante QoS y VLAN dedicadas.El diseño deberá garantizar el equilibrio entre latencia, ancho de banda y escalabilidad futura del sistema. | MQR |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
En el epígrafe 2.2.9 Requisitos de la partición de cómputo
## Donde dice:
<!-- image -->
<!-- image -->
| HPCINT_125 | Número mínimo de nodos: La partición de cómputo del CPD de AEMET deberá disponer de un mínimo de 233 nodos homogéneos en arquitectura, memoria, CPU y conectividad, equivalentes o superiores en rendimiento a los actualmente en operación en AEMET. Esta cifra garantiza la continuidad de la capacidad operativa de los modelos de predicción meteorológica y climatológica. | MQR |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCINT_125 | Número mínimo de nodos: La partición de cómputo del CPD de AEMET deberá disponer de un mínimo de 160 nodos homogéneos en arquitectura, memoria, CPU y conectividad, equivalentes o superiores en rendimiento a los actualmente en operación en AEMET. Esta cifra garantiza la continuidad de la capacidad operativa de los modelos de predicción meteorológica y climatológica. | MQR |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| HPCINT_127 | Tecnología de CPULa CPU de los nodos deberá estar basada en arquitectura x86-64 o ARM o equivalente, con un mínimo de 64 núcleos físicos por CPU y al menos 2 CPU por nodo. Cada núcleo deberá ofrecer un rendimiento pico ≥ 20 Gflops FP64.Frecuencia base ≥ 2.6 GHz o frecuencia sostenible en carga. Turbo sostenido en cargas vectoriales. El rendimiento agregado del conjunto de la partición deberá ser coherente con el dimensionamiento energético del CPD (≤ 360kW IT + frío). | MQR |
|--------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCINT_127 | Tecnología de CPULa CPU de los nodos deberá estar basada en arquitectura x86-64 o equivalente, con un mínimo de 72 núcleos físicos por CPU y al menos 2 CPU por nodo. Cada núcleo deberá ofrecer un rendimiento pico ≥ 25Gflops FP64.Frecuencia base ≥ 2.6 GHz o frecuencia sostenible en carga. Turbo sostenido en cargas vectoriales. El rendimiento agregado del conjunto de la partición deberá ser coherente con el dimensionamiento energético del CPD (≤ 360kW IT + frío). | MQR |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
<!-- image -->
<!-- image -->
| HPCINT_129 | Memoria DRAM: • Cada nodo deberá disponer de un mínimo de 480 GB de memoria DDR5 (o LPDDR5) o superior. • Los nodos deberán configurarse para saturar todos los canales de memoria disponibles, garantizando el máximo ancho de banda de acceso. | MQR |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_130 | Requisitos de red: Los nodos deberán estar equipados con: • 1 NIC conectada a la red Fabric de baja latencia, con ≥ 200 Gb/s full-duplex.La NIC fabric sea PCIe Gen5×16 o equivalente. • 1 NIC dual (2 puertos × 10/25 GbE) conectada a la red de gestión en banda (MNG-IB), con soporte PXE y arranque remoto. • 1 NIC 1 GbE dedicada al BMC, conectada a la red OOB.La conexión a los conmutadores deberá garantizar redundancia y tolerancia a fallos. | MQR |
| HPCINT_131 | Arquitectura de interconexión: Se valorará positivamente que las interfaces Fabric de cada nodo se conecten a switches distintos, reduciendo la dependencia de un único punto de fallo y mejorando la resiliencia. | MQR |
## Debe decir:
En el epígrafe 2.2.11.1 Requisitos de los nodos de login
| HPCINT_129 | Memoria DRAM: • Cada nodo deberá disponer de un mínimo de 512 GB de memoria DDR5 (o LPDDR5) o superior. • Los nodos deberán configurarse para saturar todos los canales de memoria disponibles, garantizando el máximo ancho de banda de acceso. | MQR |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_130 | Requisitos de red: Los nodos deberán estar equipados con: • 1 NIC con 2 puertos conectados a la red Fabric de baja latencia (≥ 200 Gb/s por puerto, 400 Gb/s agregados) full-duplex.La NIC fabric sea PCIe Gen5×16 o equivalente. • 1 NIC dual (2 puertos × 10/25 GbE) conectada a la red de gestión en banda (MNG-IB), con soporte PXE y arranque remoto. • 1 NIC 1 GbE dedicada al BMC, conectada a la red OOB.La conexión a los conmutadores deberá garantizar redundancia y tolerancia a fallos. | MQR |
| HPCINT_131 | Arquitectura de interconexión: Las interfaces Fabric de cada nodo deben estar conectadas a switches distintos, reduciendo la dependencia de un único punto de fallo y mejorando la resiliencia. | MQR |
## Donde dice:
<!-- image -->
<!-- image -->
| HPCINT_165 | Requisitos comunes de los nodos Deberá cumplir el requisito HPCINT_009 comunes a todos los nodos. | MQR |
|--------------|-----------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCINT_165 | Requisitos comunes de los nodos Deberá cumplir el requisito HPCINT_098 comunes a todos los nodos. | MQR |
|--------------|-----------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| HPCINT_170 | Instalación de software: Los nodos de login deberán permitir la instalación de todas las aplicaciones, librerías y entornos de usuario utilizados en el sistema de producción, incluyendo compiladores, frameworks de análisis y herramientas de gestión de datos. Se valorará positivamente la compatibilidad y homogeneidad del entorno software con los nodos de cómputo, para garantizar portabilidad y reproducibilidad de las cargas de trabajo. | MQR |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCINT_170 | Instalación de software: Los nodos de login deberán permitir la instalación de todas las aplicaciones, librerías y entornos de usuario utilizados en el sistema de producción, incluyendo compiladores, frameworks de análisis y herramientas de gestión de datos. Se deberá asegurar la compatibilidad y homogeneidad del entorno software con los nodos de cómputo, para garantizar portabilidad y reproducibilidad de las cargas de trabajo. | MQR |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| HPCINT_174 | Alta disponibilidad de la partición de login: La partición de login deberá operar en alta disponibilidad, permitiendo que la pérdida de uno o varios nodos no afecte a la capacidad de acceso. Se valorará la disponibilidad de balanceo automático de conexiones (round-robin DNS, load-balancer TCP equivalente). | TQR |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCINT_174 | Alta disponibilidad de la partición de login: La partición de login deberá operar en alta disponibilidad, permitiendo que la pérdida de uno o varios nodos no afecte a la capacidad de acceso. Se valorará la disponibilidad de balanceo automático de conexiones (round-robin DNS, load-balancer TCP equivalente). | MQR |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
<!-- image -->
## En el epígrafe 2.2.11.2 Requisitos de los nodos de visualización
## Donde dice:
| HPCINT_175 | Número de nodos de visualización: Deberán proporcionarse al menos 4 nodos de visualización dedicados a la representación y análisis gráfico de resultados generados por los modelos de predicción meteorológica y climatológica de AEMET. Estos nodos deberán garantizar un acceso fluido y seguro para los usuarios autorizados desde la red corporativa. | MQR |
|--------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCINT_175 | Número de nodos de visualización: Deberán proporcionarse al menos 8 nodos de visualización dedicados a la representación y análisis gráfico de resultados generados por los modelos de predicción meteorológica y climatológica de AEMET. Estos nodos deberán garantizar un acceso fluido y seguro para los usuarios autorizados desde la red corporativa. | MQR |
|--------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| HPCINT_185 | Compatibilidad CUDA/ROCm + librerías científicas: El software deberá incluir stack de librerías optimizadas en GPU (cuDNN, cuBLAS, OpenGL, Mesa, Vulkan u otras), compatibles con las herramientas meteorológicas empleadas por AEMET. | TQR |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCINT_185 | Compatibilidad CUDA/ROCm + librerías científicas: El software deberá incluir stack de librerías optimizadas en GPU (cuDNN, cuBLAS, OpenGL, Mesa, Vulkan u otras), compatibles con las herramientas meteorológicas empleadas por AEMET. | MQR |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
En el epígrafe 2.2.12.1 Hot Tier (alto rendimiento)
## Donde dice:
Nivel de muy altas prestaciones, con una capacidad neta mínima de 1 PB, destinado a los datos activos de operación y a los resultados recientes de simulaciones meteorológicas y climatológicas.
## Debe decir:
Nivel de muy altas prestaciones, con una capacidad neta mínima de 2 PB, destinado a los datos activos de operación y a los resultados recientes de simulaciones meteorológicas y climatológicas.
<!-- image -->
<!-- image -->
<!-- image -->
En el epígrafe 2.2.12.6 Requisitos formales de almacenamiento y movimiento de datos
## Donde dice:
| HPCINT_192 | Red de almacenamiento dedicada Se valorará la incorporación de una red físicamente separada para el tráfico de almacenamiento entre los nodos del sistema y la infraestructura de datos, con capacidad suficiente (≥400 Gb/s agregados) y prestaciones que garanticen los niveles de rendimiento requeridos. Esta red podrá integrarse con los Data Movers (DTN) encargados de la transferencia de grandes volúmenes de datos hacia sistemas internacionales (ECMWF, Copernicus, etc.) e infraestructura de nube externa. | MQR |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCINT_192 | Red de almacenamiento dedicada Se valorará la incorporación de una red físicamente separada para el tráfico de almacenamiento entre los nodos del sistema y la infraestructura de datos, con capacidad suficiente (≥400 Gb/s agregados) y prestaciones que garanticen los niveles de rendimiento requeridos. Esta red podrá integrarse con los Data Movers (DTN) encargados de la transferencia de grandes volúmenes de datos hacia sistemas internacionales (ECMWF, Copernicus, etc.) e infraestructura de nube externa. | TQR |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| HPCINT_194 | Capacidad: El sistema deberá disponer de una capacidad neta y usable mínima de 1 PB, dedicada al almacenamiento de los datos activos asociados a la ejecución operativa de modelos numéricos, análisis meteorológicos, climatología operativa y procesos de asimilación. Esta capacidad deberá ser expandible sin interrupción del servicio y con posibilidad de integración con el nivel Cold Tier. | MQR |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_195 | Rendimiento El sistema de almacenamiento deberá proporcionar un rendimiento agregado equivalente, al menos, a: • 2 GB/s por nodo de cómputo en lectura. • 1,6 GB/s por nodo de cómputo en escritura. El rendimiento deberá demostrarse mediante la ejecución del benchmark IOR en condiciones equivalentes a las de operación real. En ningún caso se requerirá superar un rendimiento agregado de 100 GB/s en lectura y 80 GB/s en escritura para la totalidad de los nodos de cómputo. Asimismo, deberá soportar al menos 1.000 operaciones de E/S por nodo de cómputo, demostrables mediante benchmark IOZONE. La infraestructura deberá mantener un rendimiento sostenido durante la ejecución simultánea de trabajos de predicción y | MQR |
<!-- image -->
<!-- image -->
| | climatología, garantizando latencias reducidas incluso en entornos de concurrencia elevada. | |
|------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCINT_196 | Mejora de capacidad y rendimiento: Se valorará la provisión de una infraestructura que exceda las especificaciones mínimas en términos de capacidad, rendimiento sostenido o eficiencia energética, especialmente si contribuye a mejorar los tiempos de ciclo de predicción, el acceso a datos climatológicos o la interoperabilidad con las plataformas multicloud. | TRQ |
| HPCINT_197 | Capacidad: El sistema deberá disponer de una capacidad neta y usable mínima de 10 PB, dedicada al almacenamiento de datos a largo plazo, incluyendo resultados de simulaciones meteorológicas y climatológicas y productos derivados. Deberá ser ampliable y modular, garantizando la continuidad del servicio durante las expansiones de capacidad y el mantenimiento evolutivo. | MQR |
| HPCINT_198 | Rendimiento El sistema de almacenamiento del Cold Tier deberá proporcionar un rendimiento agregado equivalente, al menos, al 10% del rendimiento ofrecido por el Hot Tier, demostrable mediante los benchmarks IOR e IOZONE. Deberá garantizar un acceso eficiente para procesos de recuperación de datos, verificación de productos, generación de indicadores climáticos y transferencia hacia sistemas externos (RAICES, ECMWF, Copernicus, etc.). | MQR |
## Debe decir:
| HPCINT_194 | Capacidad: El sistema deberá disponer de una capacidad neta y usable mínima de 2 PB, dedicada al almacenamiento de los datos activos asociados a la ejecución operativa de modelos numéricos, análisis meteorológicos, climatología operativa y procesos de asimilación. Esta capacidad deberá ser expandible sin interrupción del servicio y con posibilidad de integración con el nivel Cold Tier. | MQR |
|--------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_195 | Rendimiento El sistema de almacenamiento deberá proporcionar un rendimiento agregado equivalente, al menos, a: • 2 GB/s por nodo de cómputo en lectura. • 1,6 GB/s por nodo de cómputo en escritura. El rendimiento deberá demostrarse mediante la ejecución del benchmark IOR en condiciones equivalentes a las de operación real. En ningún el rendimiento agregado deberá ser inferior a 300 GB/s en lectura y 250 GB/s en escritura para la totalidad de los nodos de cómputo. Asimismo, deberá soportar al menos 20.000 operaciones de E/S por nodo de cómputo para | MQR |
<!-- image -->
<!-- image -->
| | ficheros de tamaño 4K, demostrables mediante benchmark IOZONE. La infraestructura deberá mantener un rendimiento sostenido durante la ejecución simultánea de trabajos de predicción y climatología, garantizando latencias reducidas incluso en entornos de concurrencia elevada. | |
|------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCINT_196 | Mejora de capacidad y rendimiento: Se valorará la provisión de una infraestructura que exceda las especificaciones mínimas en términos de capacidad, rendimiento sostenido o eficiencia energética, especialmente si contribuye a mejorar los tiempos de ciclo de predicción, el acceso a datos climatológicos o la interoperabilidad con las plataformas multicloud. | TRQ |
| HPCINT_197 | Capacidad: El sistema de almacenamiento del Cold Tier deberá disponer de una capacidad neta y usable mínima de 10 PB, dedicada al almacenamiento de datos a largo plazo, incluyendo resultados de simulaciones meteorológicas y climatológicas y productos derivados. Deberá ser ampliable y modular, garantizando la continuidad del servicio durante las expansiones de capacidad y el mantenimiento evolutivo. | MQR |
| HPCINT_198 | Rendimiento El sistema de almacenamiento del Cold Tier deberá proporcionar un rendimiento agregado equivalente, al menos, al 25 %del rendimiento ofrecido por el Hot Tier, demostrable mediante los benchmarks IOR e IOZONE. Deberá garantizar un acceso eficiente para procesos de recuperación de datos, verificación de productos, generación de indicadores climáticos y transferencia hacia sistemas externos (RAICES, ECMWF, Copernicus, etc.). | MQR |
En el epígrafe 2.2.13 Requisitos del suministro, instalación y certificación de la instalación en CPD de AEMET
## Donde dice:
La instalación incluirá el montaje físico de racks, interconexión de energía, redes (fabric, gestión, OOB, almacenamiento, backbone), cableado estructurado, instalación de sensores ambientales y conexión a los sistemas de monitorización del CPD (cuando proceda). Asimismo, se deberá realizar la instalación del software de sistema, drivers, firmware, planificador de recursos, componentes de seguridad, NIS o integración con LDAP corporativo e instalación del stack HPC/IA completo.
## Debe decir:
La instalación incluirá el montaje físico de racks, interconexión de energía, redes (fabric, gestión, OOB, almacenamiento, backbone), cableado estructurado, instalación
<!-- image -->
<!-- image -->
de sensores ambientales y conexión a los sistemas de monitorización del CPD (cuando proceda). Asimismo, se deberá realizar la instalación del software de sistema, drivers, firmware, planificador de recursos, componentes de seguridad o integración LDAP, SSSD, IdM o compatible con IdP corporativo e instalación del stack HPC/IA completo.
En el epígrafe 2.3.1.1 Requisitos físicos del CPD externo
## Donde dice:
En materia de telecomunicaciones, el CPD externo deberá ser carrier-neutral, con salas MMR redundantes (al menos dos), entrada diversificada de fibra y disponibilidad de conectividad de alta capacidad. Será imprescindible su integración completa con el servicio IX-CPDs del Contrato Unificado de Comunicaciones de la AGE (Lote 3), garantizando conectividad L2 y L3 entre ambos centros de datos, con rutas A/B completamente independientes. Asimismo, el CPD deberá permitir el despliegue de las redes necesarias para las particiones HPC/IA: red Fabric, red de gestión, red OOB, red de almacenamiento y red troncal de integración con AEMET.
## Debe decir:
En materia de telecomunicaciones, el CPD externo deberá ser carrier-neutral, con salas MMR redundantes (al menos dos), entrada diversificada de fibra y disponibilidad de conectividad de alta capacidad, garantizando conectividad L2 y L3 entre ambos centros de datos, con rutas A/B completamente independientes. Asimismo, el CPD deberá permitir el despliegue de las redes necesarias para las particiones HPC/IA: red Fabric, red de gestión, red OOB, red de almacenamiento y red troncal de integración con AEMET.
## Donde dice:
| HPCEXT_016 | Soporte para red Fabric de alta velocidad (InfiniBand HDR/NDR o Ethernet ≥100 Gbps). | MRQ |
|--------------|----------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCEXT_016 | Soporte para red Fabric de alta velocidad (InfiniBand NDR o Ethernet equivalente ≥400 Gbps). | MRQ |
|--------------|------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| HPCEXT_018 | Posibilidad de red dedicada de almacenamiento (Ethernet ≥100 Gbps) separada de Fabric. | TQR |
|--------------|------------------------------------------------------------------------------------------|-------|
<!-- image -->
## Debe decir:
HPCEXT\_018
Posibilidad de red dedicada de almacenamiento (InfiniBand NDR o Ethernet equivalente ≥400 Gbps) separada de Fabric.
En el epígrafe 2.3.1.2 Requisitos eléctricos del CPD externo
## Donde dice:
El CPD de AEMET deberá proporcionar una infraestructura eléctrica capaz de soportar la instalación del nuevo clúster HPC/IA, garantizando la estabilidad, redundancia y continuidad del suministro eléctrico necesarias para un sistema crítico. La alimentación deberá estar dimensionada para cargas densas por rack, contemplando la coexistencia de nodos de computación, nodos de administración, almacenamiento y equipamiento de red de alta capacidad.
## Debe decir:
El CPD externo deberá proporcionar una infraestructura eléctrica capaz de soportar la instalación del nuevo clúster HPC/IA, garantizando la estabilidad, redundancia y continuidad del suministro eléctrico necesarias para un sistema crítico. La alimentación deberá estar dimensionada para cargas densas por rack, contemplando la coexistencia de nodos de computación, nodos de administración, almacenamiento y equipamiento de red de alta capacidad.
## Donde dice:
El CPD de AEMET deberá contar además con grupos electrógenos redundados , capaces de mantener la operación continuada en caso de una interrupción prolongada. Toda la infraestructura deberá encontrarse en configuración N+1 o superior , tanto en SAIs como en grupos electrógenos, de manera que el fallo de un elemento no interrumpa el servicio.
## Debe decir:
El CPD externo deberá contar además con grupos electrógenos redundados , capaces de mantener la operación continuada en caso de una interrupción prolongada. Toda la infraestructura deberá encontrarse en configuración N+1 o superior , tanto en SAIs como en grupos electrógenos, de manera que el fallo de un elemento no interrumpa el servicio.
## Donde dice:
<!-- image -->
TQR
<!-- image -->
<!-- image -->
| HPCEXT_032 | Disponibilidad de grupos electrógenos redundados capaces de mantener operación continuada en caso de interrupciones prolongadas. Asegurarán un mínimo de autonomía de 72 horas. | MRQ |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCEXT_032 | Disponibilidad de grupos electrógenos redundados capaces de mantener operación continuada en caso de interrupciones prolongadas. Asegurarán un mínimo de autonomía de 48 horas. | MRQ |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| HPCEXT_049 | El CPD deberá garantizar capacidad de disipación suficiente para soportar la carga térmica máxima del clúster en funcionamiento nominal y degradado. El diseño del CPD deberá soportar una carga térmica inicial estimada de XXX kW, ampliable sin rediseño estructural. | MRQ |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCEXT_049 | El CPD deberá garantizar capacidad de disipación suficiente para soportar la carga térmica máxima del clúster en funcionamiento nominal y degradado. El diseño del CPD deberá soportar una carga térmica inicial estimada de 40 kW, ampliable sin rediseño estructural. | MRQ |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
En el epígrafe 2.3.1.6 Especificaciones técnicas
## Donde dice:
Ambos centros estarán conectados mediante una interconexión extremo-a-extremo específicamente diseñada por AEMET, con capacidad suficiente para la replicación asíncrona del almacenamiento, la transferencia de datasets masivos y la movilidad de cargas entre colas SLURM. Esta interconexión permitirá compartir configuraciones, imágenes, software y datos operativos replicados, habilitando una operación federada de ambos entornos y garantizando que el CPD externo disponga de la información necesaria para asumir la operación cuando se active el modo de contingencia.
## Debe decir:
<!-- image -->
<!-- image -->
Ambos centros estarán conectados mediante una interconexión extremo-a-extremo específicamente diseñada para AEMET, con capacidad suficiente para la replicación asíncrona del almacenamiento, la transferencia de datasets masivos y la movilidad de cargas entre colas SLURM. Esta interconexión permitirá compartir configuraciones, imágenes, software y datos operativos replicados, habilitando una operación federada de ambos entornos y garantizando que el CPD externo disponga de la información necesaria para asumir la operación cuando se active el modo de contingencia.
En el epígrafe 2.3.1.6.2 Distribución mínima de nodos
## Donde dice:
La distribución mínima de nodos establecida para el clúster alojado en el CPD externo se ha definido tomando como referencia las capacidades actuales del sistema HPC en operación en AEMET, ampliadas para dar respuesta a los requerimientos específicos de este entorno. A diferencia del CPD de AEMET, cuyo dimensionamiento está condicionado por los límites energéticos y estructurales de las instalaciones existentes, el clúster del CPD externo deberá disponer de una capacidad de procesamiento claramente superior a la del clúster interno, de manera que pueda asumir simultáneamente las actividades de desarrollo, experimentación, entrenamiento de modelos de inteligencia artificial y ejecución de cargas de producción en caso de contingencia. En consecuencia, el número efectivo de nodos que deberá suministrarse quedará determinado por los recursos necesarios para garantizar el rendimiento operacional, la continuidad del servicio en escenarios de conmutación y el cumplimiento íntegro del benchmark de predicción numérica del tiempo definido en este pliego, no pudiendo interpretarse la distribución mínima indicada como un límite superior ni como restricción tecnológica.
## Debe decir:
La distribución mínima de nodos establecida para el clúster alojado en el CPD externo se ha definido tomando como referencia las capacidades actuales del sistema HPC en operación en AEMET, ampliadas para dar respuesta a los requerimientos específicos de este entorno y teniendo en cuenta las capacidades superiores de los nodos más actuales. A diferencia del CPD de AEMET, cuyo dimensionamiento está condicionado por los límites energéticos y estructurales de las instalaciones existentes, el clúster del CPD externo deberá disponer de una capacidad de procesamiento claramente superior a la del clúster interno, de manera que pueda asumir simultáneamente las actividades de desarrollo, experimentación, entrenamiento de modelos de inteligencia artificial y ejecución de cargas de producción en caso de contingencia. En consecuencia, el número efectivo de nodos que deberá suministrarse quedará determinado por los
<!-- image -->
<!-- image -->
recursos necesarios para garantizar el rendimiento operacional, la continuidad del servicio en escenarios de conmutación y el cumplimiento íntegro del benchmark de predicción numérica del tiempo definido en este pliego, no pudiendo interpretarse la distribución mínima indicada como un límite superior ni como restricción tecnológica.
## Donde dice:
La distribución de nodos es:
| Partición | Nº mínimo de nodos | Descripción |
|-------------------------|----------------------|---------------------------------------------------------------------------------------|
| Cómputo (CPU) | 233 - 235 | Nodos homogéneos destinados a cargas HPC masivas, I+D y respaldo del clúster interno. |
| Cómputo acelerado (GPU) | 40-60 | Nodos GPU de última generación para IA, LLM y entrenamiento distribuido. |
| Acceso - Login | 4 | Acceso interactivo de usuarios federados. |
| Acceso - Visualización | 4 | Visualización remota, análisis interactivo, postproceso. |
| Administración | 3 | Monitorización, despliegue y gobierno del sistema. |
| Entrada/Salida (DTN) | 4 | Movimientos de datos de alta velocidad y replicación entre CPDs. |
## Debe decir:
La distribución de nodos es:
| Partición | Nº mínimo de nodos | Descripción |
|-------------------------|----------------------|---------------------------------------------------------------------------------------|
| Cómputo (CPU) | 160 | Nodos homogéneos destinados a cargas HPC masivas, I+D y respaldo del clúster interno. |
| Cómputo acelerado (GPU) | 20 | Nodos GPU de última generación para IA, LLM y entrenamiento distribuido. |
<!-- image -->
<!-- image -->
En el epígrafe 2.3.1.6.3 Requisitos generales del clúster en CPD externo
| Acceso - Login | 4 | Acceso interactivo de usuarios federados. |
|------------------------|-----|------------------------------------------------------------------|
| Acceso - Visualización | 8 | Visualización remota, análisis interactivo, postproceso. |
| Administración | 3 | Monitorización, despliegue y gobierno del sistema. |
| Entrada/Salida (DTN) | 4 | Movimientos de datos de alta velocidad y replicación entre CPDs. |
## Donde dice:
| HPCEXT_090 | Características comunes de los nodos: Se exigirá el cumplimiento de los requisitos HPCINT_009 | MRQ |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_091 | Supervisión y gestión: El sistema deberá permitir monitorización integral mediante APIs abiertas (REST, Redfish, SNMP), con capacidad para notificar fallos críticos en menos de 300 segundos. | MRQ |
## Debe decir:
| HPCEXT_090 | Características comunes de los nodos: Se exigirá el cumplimiento de los requisitos HPCINT_098 | MRQ |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_091 | Supervisión y gestión: El sistema deberá permitir monitorización integral mediante APIs abiertas (REST, Redfish, SNMP), con capacidad para notificar fallos críticos en menos de 60 segundos. | MRQ |
## Donde dice:
| HPCEXT_099 | Capacidades MLOps: El entorno software deberá incluir herramientas de MLOps para soportar entrenamiento, validación, despliegue y monitorización de modelos de IA aplicados en AEMET. | TRQ |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
En el epígrafe 2.3.1.7 Redes de interconexión
| HPCEXT_099 | Capacidades MLOps: El entorno software deberá incluir herramientas de MLOps para soportar entrenamiento, validación, despliegue y monitorización de modelos de IA aplicados en AEMET. | MRQ |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
<!-- image -->
## Donde dice:
El diseño deberá basarse en tecnologías abiertas de interconexión de baja latencia (InfiniBand HDR/NDR o Ethernet ≥200 Gb/s), garantizando compatibilidad funcional, equivalencia de rendimiento y simetría operativa respecto al clúster del CPD de AEMET. Esta red deberá soportar tráfico HPC intensivo, operaciones colectivas de MPI críticas para la ejecución de modelos meteorológicos y cargas de IA a gran escala, así como comunicaciones de almacenamiento en caso de integrarse con la red de datos del sistema.
## Debe decir:
El diseño deberá basarse en tecnologías abiertas de interconexión de baja latencia (InfiniBand HDR/NDR o Ethernet ≥400 Gb/s), garantizando compatibilidad funcional, equivalencia de rendimiento y simetría operativa respecto al clúster del CPD de AEMET. Esta red deberá soportar tráfico HPC intensivo, operaciones colectivas de MPI críticas para la ejecución de modelos meteorológicos y cargas de IA a gran escala, así como comunicaciones de almacenamiento en caso de integrarse con la red de datos del sistema.
En el epígrafe 2.3.1.7.1 Requisitos de la red fabric o de baja latencia
## Donde dice:
| HPCEXT_106 | Requisitos generales: La red Fabric del CPD externo deberá proporcionar una estructura de interconexión de baja latencia y alto ancho de banda, equivalente en prestaciones a la del CPD de AEMET, conectando todos los nodos del clúster (CPU, GPU, E/S, administración, login y visualización). La red deberá estar basada en tecnología ≥200 Gb/s por puerto, full-duplex, con soporte paraRDMA y optimización de comunicaciones MPI. El diseño deberá respetar los mismos límites de profundidad y latencia establecidos para el clúster interno, garantizando que la topología del fabric permita la trazabilidad completa de rutas y el cumplimiento del número máximo de saltos (hops) definido en este pliego. Asimismo, la infraestructura de red deberá ser compatible con los mecanismos de federación entre clústeres previstos en este contrato, permitiendo la integración lógica de servicios, segmentación de tráfico y coordinación entre planificadores, sin requerir continuidad física entre las redes Fabric de ambos | MRQ |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
<!-- image -->
<!-- image -->
## Debe decir:
| HPCEXT_106 | Requisitos generales: La red Fabric del CPD externo deberá proporcionar una estructura de interconexión de baja latencia y alto ancho de banda, equivalente en prestaciones a la del CPD de AEMET, conectando todos los nodos del clúster (CPU, GPU, E/S, administración, login y visualización). La red deberá estar basada en tecnología ≥400 Gb/s por puerto, full-duplex, con soporte paraRDMA y optimización de comunicaciones MPI. El diseño deberá respetar los mismos límites de profundidad y latencia establecidos para el clúster interno, garantizando que la topología del fabric permita la trazabilidad completa de rutas y el cumplimiento del número máximo de saltos (hops) definido en este pliego. Asimismo, la infraestructura de red deberá ser compatible con los mecanismos de federación entre clústeres previstos en este contrato, permitiendo la integración lógica de servicios, segmentación de tráfico y coordinación entre planificadores, sin requerir continuidad física entre las redes Fabric de ambos | MRQ |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
En el epígrafe 2.3.1.7.2 Requisitos de la red de gestión
## Donde dice:
La red de gestión del CPD externo deberá integrarse con la red de gestión del CPD de AEMET a través del servicio IX-CPDs (Lote 3 del Contrato Unificado de Comunicaciones) .
## Debe decir:
La red de gestión del CPD externo deberá integrarse con la red de gestión del CPD de AEMET a través del servicio IX-CPDs .
En el epígrafe 2.3.1.8 Requisitos de la partición de cómputo
## Donde dice:
| HPCEXT_126 | GPU de última generación: Los nodos GPU deberán integrar GPUs de última generación , adecuadas para entrenamiento e inferencia de modelos de IA, con memoria HBM ≥ 80 GB por GPU y capacidades de computación masiva en precisión mixta. Las GPUs deberán ser compatibles con CUDA, HIP o ROCm, según la arquitectura ofertada, garantizando soporte para los entornos de IA y HPC utilizados en AEMET. | MRQ |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
<!-- image -->
<!-- image -->
<!-- image -->
| HPCEXT_127 | Memoria de los nodos CPU: Cada nodo CPU deberá contar con al menos 480 GB de memoria DDR5 o superior, saturando todos los canales de memoria disponibles. | MRQ |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCEXT_126 | GPU de última generación: Los nodos GPU deberán integrar al menos 8 GPUs de última generación por nodo , adecuadas para entrenamiento e inferencia de modelos de IA, con memoria HBM≥80 GB por GPU y capacidades de computación masiva en precisión mixta. Las GPUs deberán ser compatibles con CUDA, HIP o ROCm, según la arquitectura ofertada, garantizando soporte para los entornos de IA y HPC utilizados en AEMET. | MRQ |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_127 | Memoria de los nodos CPU: Cada nodo CPU deberá contar con al menos 512 GB de memoria DDR5 o superior, saturando todos los canales de memoria disponibles. | MRQ |
## Donde dice:
| HPCEXT_129 | Rendimiento mínimo CPU: Las CPUs deberán ofrecer al menos 20 GFLOPS FP64 por core y un mínimo de 64 cores por CPU y cada nodo deberá incorporar al menos 2 CPU por nodo | MRQ |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCEXT_129 | Rendimiento mínimo CPU: Las CPUs deberán ofrecer al menos 25 GFLOPS FP64 por core y un mínimo de 72 cores por CPU y cada nodo deberá incorporar al menos 2 CPU por nodo | MRQ |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| HPCEXT_136 | Escalabilidad: El diseño deberá permitir ampliaciones en número de nodos CPU y GPU sin rediseño completo de la red fabric ni del almacenamiento sin requerir modificaciones en el CPD interno de AEMET. | TRQ |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
<!-- image -->
<!-- image -->
| HPCEXT_137 | Optimización para IA: Se valorará incluir nodos GPU adicionales, GPUs de mayor capacidad o configuraciones con 8 GPUs por nodo para entrenamientos a gran escala. | TRQ |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCEXT_136 | Escalabilidad: El diseño deberá permitir ampliaciones en número de nodos CPU y GPU sin rediseño completo de la red fabric ni del almacenamiento sin requerir modificaciones en el CPD externo de AEMET. | MRQ |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_137 | Optimización para IA: Se valorará incluir nodos GPU adicionales, GPUs de mayor capacidad o configuraciones con más de 8 GPUs por nodo para entrenamientos a gran escala. | TRQ |
En el epígrafe 2.3.1.9 Requisitos de la partición de administración
## Donde dice:
- Servicios de autenticación y directorio integrables con la infraestructura de AEMET (IdP/LDAP).
## Debe decir:
- Servicios de autenticación y directorio integrables con la infraestructura de AEMET (LDAP, SSSD, IdM o compatible con IdP corporativo).
## Donde dice:
| HPCEXT_138 | Tamaño mínimo de la partición: La partición de administración del clúster externo deberá incluir al menos 3 nodos físicos, configurados en alta disponibilidad. | MRQ |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCEXT_138 | Requisitos generales: La partición de administración alojará todos los servicios de control, gestión y orquestación del sistema, incluyendo el gestor de colas, monitorización, autenticación, despliegue y mantenimiento automatizado. El tamaño de la partición será suficiente para | MRQ |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
<!-- image -->
## Donde dice:
| HPCEXT_142 | Almacenamiento de administración: La partición de administración deberá disponer de un almacenamiento compartido de ≥ 200 TB netos, accesible únicamente a través de la red de gestión y aislado física y lógicamente del almacenamiento de cómputo. El sistema deberá soportar: retención mínima de 1 año para logs y 2 años para auditoría, backups diferenciales diarios de bases de datos de configuración control, disponibilidad continua y compatibilidad con las políticas de supervisión y gestión del clúster. | MRQ |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCEXT_142 | Almacenamiento de la partición de administración: Los nodos compartirán un almacenamiento dedicado de al menos 200 TB netos, destinado a: • Software y herramientas de gestión. • Bases de datos de configuración y control con copias de seguridad diferenciales diarias (mínimo 1 año). • Registros de sistema agregados (mínimo 1 año). • Registros de auditoría y métricas de rendimiento (mínimo 2 años). • Telemetría energética y de estado del sistema.El almacenamiento deberá estar conectado a la red de gestión (MNG-IB), accesible por todos los nodos, y ser físicamente independiente del almacenamiento de cómputo. La configuración deberá ser resistente al fallo simultáneo de al menos dos bloques básicos independientes (nodos de almacenamiento, controladores o chasis). | MRQ |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
<!-- image -->
soportar el funcionamiento ininterrumpido del clúster y garantizar la continuidad operativa. Deberá contar con al menos 3 nodos físicos dedicados, configurados de forma redundante.
<!-- image -->
<!-- image -->
| HPCEXT_148 | Alta disponibilidad de servicios: Los servicios críticos de la partición de administración deberán ejecutarse en alta disponibilidad (HA), en configuraciones activo/pasivo o activo/activo, garantizando continuidad operativa ante la pérdida de al menos dos nodos. La recuperación del servicio deberá producirse en menos de 60 segundos, y el diseño de HA deberá ser equivalente a lo exigido en HPCINT_052, sin impacto significativo en la operación. | MRQ |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_149 | Monitorización y coherencia: El licitador proporcionará herramientas que verifiquen en todo momento el estado y configuración de hardware y software, integrables con SLURM/WLM. | TRQ |
## Debe decir:
| HPCEXT_148 | Alta disponibilidad de servicios: Los servicios críticos de la partición de administración deberán ejecutarse en alta disponibilidad (HA), en configuraciones activo/pasivo o activo/activo, garantizando continuidad operativa ante la pérdida de al menos dos nodos. La recuperación del servicio deberá producirse en menos de 60 segundos, y el diseño de HA deberá ser equivalente a lo exigido en HPCINT_152, sin impacto significativo en la operación. | MRQ |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_149 | Monitorización y coherencia: El licitador proporcionará herramientas que verifiquen en todo momento el estado y configuración de hardware y software, integrables con SLURM/WLM. | MRQ |
En el epígrafe 2.3.1.10 Requisitos de la partición de acceso o front-end
## Donde dice:
- Puente de interconexión seguro hacia el directorio corporativo (LDAP/IdP) y las redes internas de AEMET.
## Debe decir:
- Puente de interconexión seguro hacia el directorio corporativo (LDAP, SSSD, IdM o compatible con IdP corporativo) y las redes internas de AEMET.
En el epígrafe 2.3.1.10.1 Requisitos de los nodos de login
## Donde dice:
<!-- image -->
<!-- image -->
| HPCEXT_155 | Requisitos comunes: todos los nodos deberán cumplir las características comunes establecidas para los nodos del sistema (BMC, monitorización avanzada, firmware firmado, seguridad, etc.) deberán cumplir los requisitos comunes definidos para los nodos del sistema (Requisito HCPINT_009) | MRQ |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCEXT_155 | Requisitos comunes: todos los nodos deberán cumplir las características comunes establecidas para los nodos del sistema (BMC, monitorización avanzada, firmware firmado, seguridad, etc.) deberán cumplir los requisitos comunes definidos para los nodos del sistema (Requisito HPCINT_098) | MRQ |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| HPCEXT_165 | Seguridad: los nodos deberán soportar credenciales NIS con la posibilidad de integrarse con el IdP corporativo de AEMET (LDAP/SSO), aplicar políticas de aislamiento multiusuario y registrar la actividad y deberán estar segmentados conforme a las políticas de Telemática de AEMET. | MRQ |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCEXT_165 | Seguridad: los nodos deberán soportar credenciales con la posibilidad de integrarse con el IdP corporativo de AEMET (LDAP, SSSD, IdM o compatible con IdP corporativo ), aplicar políticas de aislamiento multiusuario y registrar la actividad y deberán estar segmentados conforme a las políticas de Telemática de AEMET. | MRQ |
|--------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
En el epígrafe 2.3.1.10.2 Requisitos de los nodos de visualización
## Donde dice:
| HPCEXT_168 | Número mínimo de nodos de visualización: el clúster externo deberá incluir al menos 4 nodos de visualización, equivalentes funcionalmente a los del CPD de AEMET garantizando acceso fluido y seguro para usuarios autorizados, equivalente funcionalmente al entorno del CPD de AEMET. | MRQ |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
<!-- image -->
<!-- image -->
| HPCEXT_168 | Número mínimo de nodos de visualización: el clúster externo deberá incluir al menos 8 nodos de visualización, equivalentes funcionalmente a los del CPD de AEMET garantizando acceso fluido y seguro para usuarios autorizados, equivalente funcionalmente al entorno del CPD de AEMET. | MRQ |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
En el epígrafe 2.3.1.11.1.1 Hot Tier (alto rendimiento)
## Donde dice:
- Capacidad neta mínima de 1 PB,
## Debe decir:
- Capacidad neta mínima de 2 PB,
En el epígrafe 2.3.1.11.7 Replicación asíncrona y soporte a continuidad operativa
## Donde dice:
La replicación se aplicará exclusivamente sobre los datasets designados como persistentes o críticos mediante políticas de gestión jerárquica (ILM/HSM), sin requerir replicación del Hot Tier en tiempo real ni de espacios efímeros (p. ej., Scratch).
## Debe decir:
La replicación se aplicará exclusivamente sobre los datasets designados como persistentes o críticos mediante políticas de gestión jerárquica (ILM/HSM), sin requerir replicación a tiempo real del Hot Tier en tiempo real ni de espacios efímeros (p. ej., Scratch).
En el epígrafe 2.3.1.11.8 Requisitos formales de almacenamiento y movimiento de datos
## Donde dice:
| HPCEXT_191 | Capacidad El sistema deberá disponer de una capacidad neta y usable mínima de 1 PB, dedicada al almacenamiento de los datos activos asociados a la ejecución operativa de modelos numéricos, análisis meteorológicos, climatología operativa y procesos de asimilación. Esta capacidad deberá ser expandible sin interrupción del servicio y con posibilidad de integración con el nivel Cold Tier. | MQR |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
<!-- image -->
<!-- image -->
| HPCEXT_192 | Rendimiento El sistema de almacenamiento deberá proporcionar un rendimiento agregado equivalente, al menos, a: • 2 GB/s por nodo de cómputo en lectura. • 1,6 GB/s por nodo de cómputo en escritura. El rendimiento deberá demostrarse mediante la ejecución del benchmark IOR en condiciones equivalentes a las de operación real. En ningún caso se requerirá superar un rendimiento agregado de 100 GB/s en lectura y 80 GB/s en escritura para la totalidad de los nodos de cómputo. Asimismo, deberá soportar al menos 10.000 operaciones de E/S por nodo de cómputo, demostrables mediante benchmark IOZONE. La infraestructura deberá mantener un rendimiento sostenido durante la ejecución simultánea de trabajos de predicción y climatología, garantizando latencias reducidas incluso en entornos de concurrencia elevada. | MQR |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCEXT_191 | Capacidad El sistema deberá disponer de una capacidad neta y usable mínima de 2 PB, dedicada al almacenamiento de los datos activos asociados a la ejecución operativa de modelos numéricos, análisis meteorológicos, climatología operativa y procesos de asimilación. Esta capacidad deberá ser expandible sin interrupción del servicio y con posibilidad de integración con el nivel Cold Tier. | MQR |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_192 | Rendimiento El sistema de almacenamiento deberá proporcionar un rendimiento agregado equivalente, al menos, a: • 2 GB/s por nodo de cómputo en lectura. • 1,6 GB/s por nodo de cómputo en escritura. El rendimiento deberá demostrarse mediante la ejecución del benchmark IOR en condiciones equivalentes a las de operación real. En ningún el rendimiento agregado deberá ser inferior a 300 GB/s en lectura y 250 GB/s en escritura para la totalidad de los nodos de cómputo. Asimismo, deberá soportar al menos 20.000 operaciones de E/S por nodo de cómputo para ficheros de tamaño 4K, demostrables mediante benchmark IOZONE. La infraestructura deberá mantener un rendimiento sostenido durante la ejecución simultánea de trabajos de predicción y climatología, garantizando latencias reducidas incluso en entornos de concurrencia elevada. | MQR |
## Donde dice:
<!-- image -->
<!-- image -->
| HPCEXT_195 | Rendimiento El sistema de almacenamiento del Cold Tier deberá proporcionar un rendimiento agregado equivalente, al menos, al 10% del rendimiento ofrecido por el Hot Tier, demostrable mediante los benchmarks IOR e IOZONE. Deberá garantizar un acceso eficiente para procesos de recuperación de datos, verificación de productos, generación de indicadores climáticos y transferencia hacia sistemas externos (RAICES, ECMWF, Copernicus, etc.). | MQR |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCEXT_195 | Rendimiento El sistema de almacenamiento del Cold Tier deberá proporcionar un rendimiento agregado equivalente, al menos, al 25% del rendimiento ofrecido por el Hot Tier, demostrable mediante los benchmarks IOR e IOZONE. Deberá garantizar un acceso eficiente para procesos de recuperación de datos, verificación de productos, generación de indicadores climáticos y transferencia hacia sistemas externos (RAICES, ECMWF, Copernicus, etc.). | MQR |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| HPCEXT_204 | Replicación entre CPDs mediante ILM/HSM: El sistema de almacenamiento del CPD externo deberá soportar replicación asíncrona desde el Cold Tier del CPD interno hacia el Cold Tier del CPD externo, empleando políticas de gestión del ciclo de vida de datos (ILM/HSM). La replicación será incremental, segura, verificable mediante checksums y orientada a datasets climatológicos, de archivo datos operativos recientes. No se requiere replicación del Hot Tier ni de áreas efímeras (Scratch). | MQR |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCEXT_204 | Replicación entre CPDs mediante ILM/HSM: El sistema de almacenamiento del CPD externo deberá soportar replicación asíncrona desde el Cold Tier del CPD interno hacia el Cold Tier del CPD externo, empleando políticas de gestión del ciclo de vida de datos (ILM/HSM). La replicación será incremental, segura, verificable mediante checksums y orientada a datasets climatológicos, de archivo datos operativos recientes. No se requiere replicación a tiempo real del Hot Tier ni de áreas efímeras (Scratch). | MQR |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
<!-- image -->
## Donde dice:
| HPCEXT_206 | Procedimientos de DR orientados a cadenas operativas: El adjudicatario deberá proporcionar procedimientos técnicos (runbooks) que describan cómo activar la ejecución de cadenas operativas en el CPD externo utilizando los datos replicados, incluyendo: • identificación de datasets críticos, • pasos de restauración desde el Cold Tier, • criterios de conmutación, • y dependencias con DTN, IX-CPDs y mecanismos de autenticación. Estos procedimientos deberán permitir alcanzar los objetivos de RPO y RTO definidos por AEMET. | TQR |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| HPCEXT_206 | Procedimientos de DR orientados a cadenas operativas: Se valorará que el adjudicatario proporcione procedimientos técnicos (runbooks) que describan cómo activar la ejecución de cadenas operativas en el CPD externo utilizando los datos replicados, incluyendo: • identificación de datasets críticos, • pasos de restauración desde el Cold Tier, • criterios de conmutación, • y dependencias con DTN, IX-CPDs y mecanismos de autenticación. Estos procedimientos deberán permitir alcanzar los objetivos de RPO y RTO definidos por AEMET. | TQR |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
En el epígrafe 2.3.1.12 Requisitos del suministro, instalación y certificación de la instalación en CPD externo
## Donde dice:
La instalación incluirá el montaje físico de racks, interconexión de energía, redes (fabric, gestión, OOB, almacenamiento, backbone), cableado estructurado, instalación de sensores ambientales y conexión a los sistemas de monitorización del CPD (cuando proceda). Asimismo, se deberá realizar la instalación del software de sistema, drivers, firmware, planificador de recursos, componentes de seguridad, uso de credenciales NIS con posibilidad de integración con LDAP corporativo e instalación del stack HPC/IA completo.
<!-- image -->
<!-- image -->
## Debe decir:
La instalación incluirá el montaje físico de racks, interconexión de energía, redes (fabric, gestión, OOB, almacenamiento, backbone), cableado estructurado, instalación de sensores ambientales y conexión a los sistemas de monitorización del CPD (cuando proceda). Asimismo, se deberá realizar la instalación del software de sistema, drivers, firmware, planificador de recursos, componentes de seguridad, uso de credenciales de acceso con posibilidad de integración con LDAP, SSSD, IdM o compatible con IdP corporativo e instalación del stack HPC/IA completo.
En el epígrafe 2.4 Suministro de licencias y derechos de uso del software del sistema HPC
## Donde dice:
- Sistemas operativos para todas las particiones del clúster externo (cómputo CPU, GPU, administración, login/visualización, DTN y E/S).
## Debe decir:
- Sistemas operativos para todas las particiones de ambos cluster (cómputo CPU, GPU, administración, login/visualización, DTN y E/S).
## Donde dice:
Posibilidad de integración con el esquema de seguridad y autenticación corporativa (LDAP/IdP de AEMET).
## Debe decir:
- Posibilidad de integración con el esquema de seguridad y autenticación corporativa (LDAP, SSSD, IdM o compatible con IdP corporativo).
En el epígrafe 2.4.1Tabla de requisitos formales comunes exigibles al software de ambos clústeres
## Donde dice:
| LICSOFT_013 | El sistema deberá incluir licencias para las herramientas de transferencia paralela soportadas en los DTN (Globus, GridFTP, FDT, BBcp, Rsync paralelizado). | TRQ |
|---------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
<!-- image -->
<!-- image -->
<!-- image -->
| LICSOFT_014 | Se deberán incluir licencias para APIs y herramientas de federación con sistemas externos (ECMWF, EUMETNET, Copernicus) si fueran necesarias para flujos automáticos. | TRQ |
|---------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| LICSOFT_013 | El sistema deberá incluir licencias para las herramientas de transferencia paralela soportadas en los DTN (Globus, GridFTP, FDT, BBcp, Rsync paralelizado). | MRQ |
|---------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| LICSOFT_014 | Se deberán incluir licencias para APIs y herramientas de federación con sistemas externos (ECMWF, EUMETNET, Copernicus) si fueran necesarias para flujos automáticos. | MRQ |
## Donde dice:
| LICSOFT_021 | Gestión de usuarios e integración LDAP corporativo: Se podrán utilizar cuentas NIS con la posibilidad de que la infraestructura pueda integrarse con el servicio de directorio corporativo LDAP/IdP de AEMET, garantizando autenticación centralizada y alta disponibilidad, evitando puntos únicos de fallo. El sistema deberá respetar las políticas de seguridad establecidas por AEMET, y permitir la segmentación por roles y unidades funcionales. | MQR |
|---------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
En el epígrafe 2.4.3 Entorno software y librerías del sistema en el clúster externo
| LICSOFT_021 | Gestión de usuarios e integración LDAP corporativo: Se podrán utilizar cuentas NIS con la posibilidad de que la infraestructura pueda integrarse con el servicio de directorio corporativo LDAP, SSSD, IdM o compatible con IdP corporativo, garantizando autenticación centralizada y alta disponibilidad, evitando puntos únicos de fallo. El sistema deberá respetar las políticas de seguridad establecidas por AEMET, y permitir la segmentación por roles y unidades funcionales. | MQR |
|---------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| LICSOFT_038 | Integración con LDAP/IdP corporativo: El clúster externo utilizará cuentas NIS con la posibilidad de integrarse con el sistema de identidad corporativo de AEMET (LDAP/IdP), garantizando autenticación centralizada, alta disponibilidad y ausencia de puntos únicos de fallo. Deberá respetar políticas de seguridad de AEMET y segmentación multiusuario. | MRQ |
|---------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
<!-- image -->
## Debe decir:
| LICSOFT_038 | Integración con LDAP/IdP corporativo: El clúster externo utilizará cuentas NIS con la posibilidad de integrarse con el sistema de identidad de AEMET LDAP, SSSD, IdM o compatible con IdP corporativo garantizando autenticación centralizada, alta disponibilidad y ausencia de puntos únicos de fallo. Deberá respetar políticas de seguridad de AEMET y segmentación multiusuario. | MRQ |
|---------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| LICSOFT_042 | Informes de rendimiento: Se deberán proporcionar herramientas/API para generación de informes del gestor de cargas (WLM), incluyendo métricas por usuario, grupo o trabajo. Se valorará integración con herramientas corporativas como DynaTrace o Prometheus. | TRQ |
|---------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| LICSOFT_042 | Informes de rendimiento: Se deberán proporcionar herramientas/API para generación de informes del gestor de cargas (WLM), incluyendo métricas por usuario, grupo o trabajo. Se valorará integración con herramientas corporativas como DynaTrace o Prometheus. | MRQ |
|---------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| LICSOFT_046 | Software para servicios de IA y analítica avanzada: Se valorará la inclusión de librerías y frameworks que faciliten IA+HPC: TensorFlow, PyTorch, XGBoost, Scikit-learn, JAX, RAPIDS, así como herramientas MLOps compatibles con los pipelines operativos de AEMET. | TRQ |
|---------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| LICSOFT_046 | Software para servicios de IA y analítica avanzada: Se valorará la inclusión de librerías y frameworks que faciliten IA+HPC: TensorFlow, PyTorch, XGBoost, Scikit-learn, JAX, RAPIDS, así como herramientas MLOps compatibles con los pipelines operativos de AEMET. | MRQ |
|---------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
En el epígrafe 2.6.2 Infraestructura física y espacio en racks
## Donde dice:
<!-- image -->
<!-- image -->
<!-- image -->
El adjudicatario deberá proporcionar espacio dedicado para el clúster externo en racks de características adecuadas para hardware HPC y GPU de alta densidad. Estos racks deberán ofrecer capacidad térmica suficiente para disipar cargas superiores a 25 kW, con posibilidad de ampliación a 30-40 kW en configuraciones que lo requieran, y estarán equipados con puertas perforadas, cerraduras seguras y sistemas de gestión de cableado que faciliten intervenciones y auditorías.
El CPD deberá disponer de un suelo técnico elevado con una altura mínima que permita una distribución eficiente del aire frío o el paso de cableado estructurado, y con capacidad de carga suficiente para sistemas pesados típicos de supercomputación. La sala deberá contar con pasillos frío y caliente confinados o con sistemas equivalentes que garanticen la ausencia de mezcla de flujos térmicos, optimizando la eficiencia energética y la estabilidad ambiental. La accesibilidad al equipamiento deberá estar asegurada tanto por la parte frontal como posterior para permitir tareas de mantenimiento sin afectar a otros sistemas, y deberán existir canalizaciones y bandejas adecuadas para fibra y cobre, con etiquetado permanente y normalizado.
## Debe decir:
El adjudicatario deberá proporcionar espacio dedicado para el clúster externo en racks de características adecuadas para hardware HPC y GPU de alta densidad. Estos racks deberán ofrecer capacidad térmica suficiente para disipar cargas superiores a 40 kW, con posibilidad de ampliación a 60-80 kW en configuraciones que lo requieran, y estarán equipados con puertas perforadas, cerraduras seguras y sistemas de gestión de cableado que faciliten intervenciones y auditorías.
La sala deberá contar con pasillos frío y caliente confinados o con sistemas equivalentes que garanticen la ausencia de mezcla de flujos térmicos, optimizando la eficiencia energética y la estabilidad ambiental. La accesibilidad al equipamiento deberá estar asegurada tanto por la parte frontal como posterior para permitir tareas de mantenimiento sin afectar a otros sistemas, y deberán existir canalizaciones y bandejas adecuadas para fibra y cobre, con etiquetado permanente y normalizado.
En el epígrafe 2.6.4 Refrigeración y climatización
## Donde dice:
El adjudicatario deberá garantizar que la capacidad de refrigeración es suficiente para mantener condiciones térmicas estables incluso bajo cargas HPC intensivas y continuadas. La capacidad frigorífica disponible deberá ser de al menos 30 kW por rack, con redundancia N+1 o equivalente. Los parámetros ambientales deberán mantenerse dentro de los rangos establecidos por ASHRAE para equipos de clase A1/A2, con monitorización continua de temperatura y humedad, y alarmas integradas para notificar cualquier desviación significativa.
<!-- image -->
## Debe decir:
El adjudicatario deberá garantizar que la capacidad de refrigeración es suficiente para mantener condiciones térmicas estables incluso bajo cargas HPC intensivas y continuadas. La capacidad frigorífica disponible deberá ser de al menos 40 kW por rack, con redundancia N+1 o equivalente. Los parámetros ambientales deberán mantenerse dentro de los rangos establecidos por ASHRAE para equipos de clase A1/A2, con monitorización continua de temperatura y humedad, y alarmas integradas para notificar cualquier desviación significativa.
En el epígrafe 2.6.10 Tabla de requisitos formales
## Donde dice:
| CPDEXT_003 | Cada rack deberá soportar una potencia mínima continua ≥ 25 kW, ampliable a 30-40 kWen configuraciones de alta densidad o presencia de nodos GPU. | MRQ |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| CPDEXT_004 | El suelo técnico deberá contar con capacidad de carga ≥ 12 kN/m² y una altura mínima de 60 cm, permitiendo circulación de aire frío o cableado inferior sin restricciones. | MRQ |
## Debe decir:
| CPDEXT_003 | Cada rack deberá soportar una potencia mínima continua ≥ 40 W, ampliable a 60-80 kW en configuraciones de alta densidad o presencia de nodos GPU. | MRQ |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| CPDEXT_004 | En caso de existencia de suelo técnico, deberá contar con capacidad de carga ≥ 12 kN/m² y una altura mínima de 60 cm, permitiendo circulación de aire frío o cableado inferior sin restricciones. | MRQ |
## Donde dice:
| CPDEXT_010 | La refrigeración deberá garantizar una capacidad mínima ≥ 30 kW por rack y estabilidad térmica frente a cargas sostenidas HPC/GPU. | MRQ |
|--------------|--------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| CPDEXT_010 | La refrigeración deberá garantizar una capacidad mínima ≥ 40 kW por rack y estabilidad térmica frente a cargas sostenidas HPC/GPU. | MRQ |
|--------------|--------------------------------------------------------------------------------------------------------------------------------------|-------|
<!-- image -->
<!-- image -->
<!-- image -->
En el epígrafe 2.7 Servicios de soporte técnico y administración integral del sistema
## Donde dice:
El adjudicatario será responsable de proporcionar un servicio integral de soporte técnico y administración del clúster HPC externo, cubriendo todas las actividades necesarias para asegurar su correcto funcionamiento, su explotación continua 24×7 y su integración transparente con el ecosistema tecnológico de AEMET. Este servicio constituye un elemento esencial del contrato, ya que deberá garantizar no solo la estabilidad del entorno HPC, sino también la continuidad de la cadena operativa meteorológica y climatológica de AEMET.
El soporte abarcará desde la gestión y operación del hardware y software del clúster externo, hasta la asistencia directa en la instalación, optimización y adaptación de aplicaciones científicas y operativas, así como la migración progresiva de cargas desde el sistema HPC actualmente en explotación en AEMET. El adjudicatario actuará como socio tecnológico de AEMET durante todo el ciclo de vida contractual, asegurando que el sistema permanece en perfecto estado de operación y que evoluciona de manera coherente con las necesidades del servicio.
## Debe decir:
El adjudicatario será responsable de proporcionar un servicio integral de soporte técnico y administración de los dos clústeres que conforman el sistema HPC de AEMET, cubriendo todas las actividades necesarias para asegurar su correcto funcionamiento, su explotación continua 24×7 y su integración transparente con el ecosistema tecnológico de AEMET. Este servicio constituye un elemento esencial del contrato, ya que deberá garantizar no solo la estabilidad del entorno HPC, sino también la continuidad de la cadena operativa meteorológica y climatológica de AEMET.
El soporte abarcará desde la gestión y operación del hardware y software de ambos clúster, hasta la asistencia directa en la instalación, optimización y adaptación de aplicaciones científicas y operativas, así como la migración progresiva de cargas desde el sistema HPC actualmente en explotación en AEMET. El adjudicatario actuará como socio tecnológico de AEMET durante todo el ciclo de vida contractual, asegurando que el sistema permanece en perfecto estado de operación y que evoluciona de manera coherente con las necesidades del servicio.
En el epígrafe 2.7.1 Alcance general del servicio
## Donde dice:
El adjudicatario deberá proporcionar un servicio integral que abarque:
<!-- image -->
<!-- image -->
- Operación continua del clúster externo (24×7×365), incluyendo monitorización, análisis de eventos, mantenimiento correctivo y preventivo.
- Administración avanzada de sistemas, cubriendo Linux, redes de alta capacidad, almacenamiento paralelo, planificadores de colas, contenedores y software científico.
- Soporte directo a la cadena operativa de AEMET, garantizando que todos los componentes del ecosistema HPC que sustentan predicción, climatología y procesos de IA funcionan correctamente.
- Instalación, optimización y puesta a punto de aplicaciones operativas, incluidas aquellas que actualmente se ejecutan en el HPC principal.
- Adaptación, compilación y validación de código científico, asegurando su correcta portabilidad a la arquitectura del clúster externo.
- Soporte especializado para la migración de cargas, incluyendo benchmarks, pruebas de escalabilidad, validación numérica y ajuste del rendimiento.
- Coordinación técnica continua con las Unidades de Coordinación de Telemática de AEMET, garantizando alineamiento en configuración, seguridad y políticas operativas.
## Debe decir:
El adjudicatario deberá proporcionar un servicio integral que abarque:
- Operación continúa de ambos clúster (24×7×365), incluyendo monitorización, análisis de eventos, mantenimiento correctivo y preventivo.
- Administración avanzada de sistemas, cubriendo Linux, redes de alta capacidad, almacenamiento paralelo, planificadores de colas, contenedores y software científico.
- Soporte directo a la cadena operativa de AEMET, garantizando que todos los componentes del ecosistema HPC que sustentan predicción, climatología y procesos de IA funcionan correctamente.
- Instalación, optimización y puesta a punto de aplicaciones operativas, incluidas aquellas que actualmente se ejecutan en el HPC principal.
- Adaptación, compilación y validación de código científico, asegurando su correcta portabilidad a la arquitectura de ambos cluster.
- Soporte especializado para la migración de cargas, incluyendo benchmarks, pruebas de escalabilidad, validación numérica y ajuste del rendimiento.
- Coordinación técnica continua con las Unidades de Coordinación de Telemática de AEMET, garantizando alineamiento en configuración, seguridad y políticas operativas.
En título del epígrafe 2.7.2
## Donde dice:
Equipo técnico insitu
<!-- image -->
## Debe decir:
Equipo técnico
## Dentro de este mismo epígrafe
## Donde dice:
Para garantizar un nivel adecuado de supervisión y capacidad de intervención inmediata, el adjudicatario deberá disponer en el CPD externo de un equipo mínimo de dos especialistas en supercomputación, presentes físicamente durante el horario laboral (lunes a viernes).
## Debe decir:
Para garantizar un nivel adecuado de supervisión y capacidad de intervención inmediata, el adjudicatario deberá disponer de un equipo mínimo de dos especialistas en supercomputación, al menos uno presente físicamente en el emplazamiento de HPC interno de AEMET durante el horario laboral (lunes a viernes).
En el epígrafe 2.7.3 Soporte 24x7
## Donde dice:
El centro de soporte dispondrá de personal especializado en:
- HPC,
- almacenamiento,
- redes avanzadas,
- software científico,
- contenedores y virtualización ligera.
## Donde dice:
El centro de soporte dispondrá de personal especializado en:
- HPC,
- almacenamiento,
- redes avanzadas,
En el título del epígrafe 2.7.7
## Donde dice:
2.7.7 Requisitos formales exigibles al servicio de housing
<!-- image -->
<!-- image -->
## Donde dice:
2.7.7 Requisitos de servicio de soporte técnico y administración integral del sistema
## Dentro de este mismo epígrafe
## Donde dice:
| OPSYS_008 | El adjudicatario deberá gestionar y mantener el almacenamiento paralelo multitier del sistema, incluyendo Hot Tier, Cold Tier y Data Movers, asegurando disponibilidad, rendimiento, consistencia POSIX, snapshots, cuotas, QoS y replicación hacia el CPD principal mediante IX-CPDs. | MRQ |
|-------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| OPSYS_008 | El adjudicatario deberá gestionar y mantener el almacenamiento paralelo multitier del sistema, incluyendo Hot Tier, Cold Tier y Data Movers, asegurando disponibilidad, rendimiento, consistencia POSIX, snapshots, cuotas, QoS y replicación entre los dos clústeres mediante IX-CPDs. | MRQ |
|-------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Donde dice:
| OPSYS_011 | El adjudicatario deberá habilitar un canal de soporte experto para usuarios avanzados de HPC y IA, integrado con los sistemas de ticketing corporativos de AEMET (ServiceNow o los que se indiquen). El soporte incluirá dudas técnicas, optimización de jobs, compilación y uso eficiente del clúster. | TRQ |
|-------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| OPSYS_012 | Se deberá proporcionar formación continua a administradores y usuarios avanzados de AEMET en HPC, IA, MLOps, contenedores, redes de alto rendimiento, compilación optimizada y buenas prácticas de uso del sistema. | TRQ |
| OPSYS_013 | El adjudicatario generará informes mensuales de operación, que deberán incluir: disponibilidad, rendimiento, incidencias, eventos de red, monitorización de DTN, consumo energético, métricas del WLM, optimización del uso del clúster y recomendaciones de mejora. | TRQ |
| OPSYS_014 | Se deberá proporcionar asistencia técnica completa en auditorías, de seguridad, PRTR, DNSH y revisiones de seguridad o conformidad normativa, aportando documentación, evidencias y registros requeridos por AEMET o por organismos reguladores. | TRQ |
## Debe decir:
| OPSYS_011 | Se valorará habilitar un canal de soporte experto para usuarios avanzados de HPC y IA, integrado con los sistemas de ticketing corporativos de AEMET (ServiceNow o los que se indiquen). El | TRQ |
|-------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
<!-- image -->
<!-- image -->
<!-- image -->
| | soporte incluirá dudas técnicas, optimización de jobs, compilación y uso eficiente del clúster. | |
|-----------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| OPSYS_012 | Se valorará la formación continua a administradores y usuarios avanzados de AEMET en HPC, IA, MLOps, contenedores, redes de alto rendimiento, compilación optimizada y buenas prácticas de uso del sistema. | TRQ |
| OPSYS_013 | Se valorará la generación de informes mensuales de operación, que deberán incluir: disponibilidad, rendimiento, incidencias, eventos de red, monitorización de DTN, consumo energético, métricas del WLM, optimización del uso del clúster y recomendaciones de mejora. | TRQ |
| OPSYS_014 | Se valorará proporcionar asistencia técnica completa en auditorías, de seguridad, PRTR, DNSH y revisiones de seguridad o conformidad normativa, aportando documentación, evidencias y registros requeridos por AEMET o por organismos reguladores. | TRQ |
## Donde dice:
| OPSYS_016 | El adjudicatario deberá proporcionar dos especialistas HPC in situ en el CPD externo, en horario laboral de lunes a viernes, dedicados a la supervisión, operación diaria, soporte a usuarios, pruebas, compilación, optimización y mejoras de rendimiento del entorno. | MRQ |
|-------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
## Debe decir:
| OPSYS_016 | El adjudicatario deberá proporcionar dos especialistas HPC, al menos uno in situ en el CPD interno, en horario laboral de lunes a viernes, dedicados a la supervisión, operación diaria, soporte a usuarios, pruebas, compilación, optimización y mejoras de rendimiento del entorno. | MRQ |
|-------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
En el epígrafe 7.5 Servicio de housing del clúster externo (CPDEXT)
## Donde dice:
- Coste sin IVA: 2.880.000,00 €
## Debe decir:
- Coste sin IVA: 2.630.000,00 €
En el epígrafe 7.9 Resumen precio de las diferentes prestaciones
## Donde dice:
| Prestación | Apartado PPT | Acrónimo | Cuantía SIN IVA |
|--------------|----------------|------------|-------------------|
<!-- image -->
<!-- image -->
| Suministro e instalación de Clúster en CPD de AEMET | 2.2 | HPCINT | 9.000.000,00 € |
|------------------------------------------------------------------------|---------------|---------------|------------------|
| Suministro e instalación de Clúster en CPD externo | 2.3 | HPCEXT | 12.600.000,00 € |
| Suministro de licencias y derechos de uso del software del sistema HPC | 2.4 | LICSOFT | 2.764.800,00 € |
| Suministro de Interconexión extremo-extremo entre CPDs (IXCPD) | 2.5 | IXCPD | 1.300.000,00 € |
| Servicio de housing para el clúster externo | 2.6 | CPDEXT | 2.880.000,00 € |
| Servicios de soporte técnico y administración integral del sistema | 2.7 | OPSYS | 3.041.280,00 € |
| Servicios de formación específica al personal técnico de AEMET | 2.8 | TRAINING | 100.000,00 € |
| Servicios de eventual desinstalación y retirada | 2.9 | UNDEPLOY | 250.000,00 € |
| | | | 31.686.080,00 |
| TOTAL SIN IVA | TOTAL SIN IVA | TOTAL SIN IVA | € |
| TOTAL CON IVA | TOTAL CON IVA | TOTAL CON IVA | 38.340.156,80 € |
## Debe decir:
| Prestación | Apartado PPT | Acrónimo | Cuantía SIN IVA |
|------------------------------------------------------------------------|----------------|------------|-------------------|
| Suministro e instalación de Clúster en CPD de AEMET | 2.2 | HPCINT | 9.000.000,00 € |
| Suministro e instalación de Clúster en CPD externo | 2.3 | HPCEXT | 12.600.000,00 € |
| Suministro de licencias y derechos de uso del software del sistema HPC | 2.4 | LICSOFT | 2.764.800,00 € |
<!-- image -->
<!-- image -->
| Suministro de Interconexión extremo-extremo entre CPDs (IXCPD) | 2.5 | IXCPD | 1.300.000,00 € |
|--------------------------------------------------------------------|---------------|---------------|------------------|
| Servicio de housing para el clúster externo | 2.6 | CPDEXT | 2.630.000,00 € |
| Servicios de soporte técnico y administración integral del sistema | 2.7 | OPSYS | 3.041.280,00 € |
| Servicios de formación específica al personal técnico de AEMET | 2.8 | TRAINING | 100.000,00 € |
| Servicios de eventual desinstalación y retirada | 2.9 | UNDEPLOY | 250.000,00 € |
| TOTAL SIN IVA | TOTAL SIN IVA | TOTAL SIN IVA | 31.686.080,00 € |
| TOTAL CON IVA | TOTAL CON IVA | TOTAL CON IVA | 38.340.156,80 € |
En el Anexo IV: Características de la infraestructura del CPD de AEMET. Pag 200
## Donde dice:
- Cualquier unidad de refrigeración exterior deberá situarse en la cubierta de la planta segunda, preferiblemente sobre el espacio liberado tras la desinstalación de la refrigeración del actual HPC (ver detalle de la planta tercera).
## Debe decir:
- Cualquier unidad de refrigeración exterior deberá situarse en la cubierta de la planta segunda, preferiblemente sobre el espacio liberado tras la desinstalación de la refrigeración del actual HPC, cumpliendo con la normativa normativa vigente (ver detalle de la planta tercera).
En el Anexo VII. Formulario de requisitos formales de obligada cumplimentación
Anexo con todos los cambios consolidados
| Requisitos apartado 2.1.1.8 | Requisitos apartado 2.1.1.8 | Requisitos apartado 2.1.1.8 | Requisitos apartado 2.1.1.8 | Requisitos apartado 2.1.1.8 |
|-------------------------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------|-------------------------------|-------------------------------|---------------------------------------|
| Requisito | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| GEN_001 | La adquisición de todo el equipamiento, software, licencias, infraestructura asociada y servicios deberá realizarse en modalidad de compra en propiedad, sin | MRQ | | |
<!-- image -->
<!-- image -->
| | mecanismos de alquiler, renting o licencias temporales que limiten la disponibilidad futura. | |
|---------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| GEN_002 | El adjudicatario deberá asegurar el cumplimiento de los principios DNSH establecidos en el Reglamento (UE) 2021/241 y de la normativa de NextGenerationEU, aportando la documentación requerida por auditorías PRTR. | MRQ |
| GEN_003 | Los equipos deberán cumplir la normativa europea de diseño ecológico (Directiva 2009/125/CE) y el RD 219/2013 sobre restricción de sustancias peligrosas, aportando certificación CE y documentación de conformidad. | MRQ |
| GEN_004 | El adjudicatario deberá entregar toda la documentación técnica y funcional: manuales, diagramas, inventarios, configuraciones, documentación DNSH y procedimientos operativos. | MRQ |
| GEN_005 | La documentación deberá entregarse en formato standard (html o pdf) y ser accesible online, además de mantenerse actualizada durante todo el contrato, incluyendo cambios realizados durante pruebas de aceptación FAT/SAT. | MRQ |
| GEN_006 | La solución deberá integrarse plenamente con los sistemas de gestión corporativos de AEMET (monitorización, IdP, IToM, planificador etc.). | MRQ |
| GEN_007 | La solución deberá garantizar interoperabilidad completa entre el clúster interno de AEMET y el clúster externo mediante IX- | MRQ |
| GEN_008 | El sistema no deberá introducir dependencias propietarias no declaradas, bloqueos tecnológicos o restricciones de uso que limiten la evolución futura de la infraestructura. | MRQ |
<!-- image -->
<!-- image -->
| GEN_009 | El adjudicatario deberá garantizar el cumplimiento de requisitos de seguridad física, control de acceso, inventario, auditoría y registro para todo el equipamiento suministrado. | MRQ | | |
|---------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|---------------------------|---------------------------|---------------------------------------|
| GEN_010 | Se requerirá disponibilidad de personal técnico cualificado durante las fases de despliegue, configuración, pruebas FAT/SAT y puesta en producción. | TRQ | | |
| GEN_011 | Las condiciones establecidas serán de obligado cumplimiento durante toda la vida útil del contrato, incluyendo soporte, actualizaciones y garantías. | MRQ | | |
| Requisitos apartado 2.2.1 | Requisitos apartado 2.2.1 | Requisitos apartado 2.2.1 | Requisitos apartado 2.2.1 | Requisitos apartado 2.2.1 |
| Requisito | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| HPCINT_001 | Capacidad de carga estructural. La losa del CPD dispone de una sobrecarga admisible de 2 kN/m². Se proyectará, una subestructura auxiliar de trasmisión de cargas | | | |
| HPCINT_001 | desde el soporte del nuevo HPC a la losa de planta, de manera que no se sobrepasen las sobrecargas de uso para las que fueron calculadas, justificándose el diseño y los cálculos de dicha subestructura mediante certificado técnico, con | MQR | | |
| HPCINT_001 | Cualquier disposición del nuevo HPC que exceda este límite de carga requerirá de un refuerzo de la estructura existente y, tanto su diseño como los cálculos justificativos de éste, se documentarán mediante un proyecto redactado y firmado por técnico competente y visado por el Colegio Profesional | | | |
<!-- image -->
<!-- image -->
| | correspondiente, sin afectar a la operación del CPD. El alcance y estructura del certificado técnico y/o del proyecto será aprobado previamente por el Servicio de Obras e Instalaciones de la AEMET. | |
|------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCINT_002 | Suelo técnico elevado. El suelo técnico existente presenta una altura aproximada de 35 cm sobre la losa, con baldosas de 60×60 cm. El adjudicatario deberá verificar su compatibilidad con el nuevo HPC y, en caso necesario, reforzarlo o sustituirlo siguiendo las prescripciones del Servicio de | MQR |
| HPCINT_003 | Obras e Instalaciones. Capacidad de carga estructural. La losa del CPD dispone de una sobrecarga admisible de 2 kN/m². Se proyectará, una subestructura auxiliar de trasmisión de cargas desde el soporte del nuevo HPC a la losa de planta, de manera que no se sobrepasen las sobrecargas de uso para las que fueron calculadas, justificándose el diseño y los cálculos de dicha subestructura mediante certificado técnico, con informe firmado por técnico competente y visado por el Colegio Profesional correspondiente. Cualquier disposición del nuevo HPC que exceda este límite de carga requerirá de un refuerzo de la estructura existente y, tanto su diseño como los cálculos justificativos de éste, se documentarán mediante un | MQR |
<!-- image -->
<!-- image -->
| | previamente por el Servicio de Obras e Instalaciones de la AEMET. | |
|------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|------|
| HPCINT_004 | Alturas y limitaciones físicas. Las alturas interiores son: 2,40 mentre suelo técnico y falso techo (3,08m en la sala), 45 cm entre falso techo y forjado superior, y anchura mínima de acceso de 0,95 m. Los racks no superarán 2.000mmde altura y deberán permitir el paso bajo bandejas de cableado superiores. | MQR |
| HPCINT_005 | Accesos y transporte de equipos. No existe muelle de carga; el acceso requiere salvar escalones y realizar maniobras en un pasillo previo. El suministrador deberá planificar el transporte y entrada de equipos con personal especializado y visita previa obligatoria. | INFO |
| HPCINT_006 | Puertas y accesos al CPD. El acceso principal al CPD cuenta con puertas de 2,02mde altura y 1,20mde anchura mínima. El licitador deberá confirmar la maniobrabilidad de racks y equipamiento de gran formato. | INFO |
| HPCINT_007 | Encaminamientos y canalizaciones. Las canalizaciones para potencia, fibra y cobre deberán instalarse respetando la separación física existente y el paso por falso techo y patinillos definidos en los planos del CPD. Se garantizará doble ruta A/B para interconexión con el CPD externo. | MQR |
| HPCINT_008 | Requisitos ambientales básicos. La sala deberá mantener condiciones operativas de temperatura y humedad compatibles con la ASHRAE Clase A1/A2. | MQR |
| HPCINT_009 | Compatibilidad con la infraestructura existente. El nuevo HPC deberá integrarse con el espacio, las bandejas, las | MQR |
<!-- image -->
<!-- image -->
| | canalizaciones y las infraestructuras auxiliares actuales, sin comprometer la operación del CPD ni interferir con los equipos no incluidos en el contrato. | | | |
|---------------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|---------------------------|---------------------------|---------------------------------------|
| HPCINT_010 | Documentación técnica previa a instalación. El adjudicatario deberá aportar planos, pesos, puntos de carga, distribución, footprint de racks y requisitos de espacio para verificar compatibilidad estructural y de acceso antes de la instalación. | INFO | | |
| Requisitos apartado 2.2.2 | Requisitos apartado 2.2.2 | Requisitos apartado 2.2.2 | Requisitos apartado 2.2.2 | Requisitos apartado 2.2.2 |
| Requisito | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| HPCINT_011 | Potencia disponible para el nuevo HPC. La sala CPD de AEMET dispone de suministro eléctrico trifásico 50 Hz, 3×400 Vac entre líneas y 230 Vac entre línea y neutro, con una potencia contratada de 600 kWy un centro de transformación de 1 000 kVA (≈800 kW). Considerando el consumo del edificio (≈240 kW) y las cargas no renovables del CPD, la potencia disponible para el nuevo HPC se estima en ≈360 kW(IT + refrigeración). El adjudicatario deberá garantizar que la solución propuesta opera dentro de esta envolvente, implementando mecanismos de power capping dinámico configurables por software e incluyendo un plan energético de operación para consumo por nodo, rack y rama. | MQR | | |
| HPCINT_012 | Distribución eléctrica por ramas A/B. El CPD dispone de dos ramas eléctricas totalmente independientes (A y B), cada una respaldada por su propio SAI y grupo electrógeno (GE): Rama A = red + GE_A →SAI_A →Cuadro A, Rama B = red + GE_B →SAI_B→ Cuadro B. Cada rama suministra alimentación 3F + N + PE con una capacidad operativa aproximada | MQR | | |
<!-- image -->
<!-- image -->
| | de 300kW por rama. Toda la infraestructura del nuevo HPC deberá conectarse a ambas ramas con entrada dual A/B para garantizar resiliencia. | |
|------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCINT_013 | Redundancia eléctrica obligatoria. Todos los equipos IT del nuevo HPC deberán incorporar fuentes redundantes (PSU dual hot-swap) conectadas a ramas diferentes (A/B). Cada rack deberá integrar PDUs independientes por rama, certificadas y con capacidad suficiente para el consumo previsto en carga máxima. | MQR |
| HPCINT_014 | Canalizaciones, protecciones y cableado. El adjudicatario deberá ejecutar todas las canalizaciones, protecciones, bandejas, cableados, líneas de acometida y cuadros secundarios necesarios para conectar los equipos del HPC desde los cuadros principales del CPD, cumpliendo el REBT y la UNE-EN 50600. Se deberá garantizar la segregación física entre rutas A y B. | MQR |
| HPCINT_015 | Compatibilidad con SAI y grupos electrógenos. El diseño eléctrico del HPC deberá ser plenamente compatible con los SAIs existentes (SAI_A y SAI_B) y sus potencias útiles instaladas (400 kWcada uno), así como con los grupos electrógenos GE_A (520 kW) y GE_B (388 kW). El suministrador deberá verificar que la corriente de arranque, cargas transitorias y picos de consumo no comprometen la operación del CPD. | MQR |
| HPCINT_016 | Legalización y certificación. Toda modificación, ampliación o adecuación eléctrica deberá entregarse legalizada, certificada y documentada, sin afectar al funcionamiento actual del CPD ni a los servicios en producción. Los | MQR |
<!-- image -->
<!-- image -->
| | trabajos deberán coordinarse con el Servicio de Obras e Instalaciones. | | | |
|---------------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|---------------------------|---------------------------|---------------------------------------|
| HPCINT_017 | Estudios eléctricos obligatorios. El licitador deberá aportar estudio de selectividad, cálculo de cortocircuitos, estimación de consumos por rack, curva de cargas, impacto sobre SAIs y grupos electrógenos y determinación del peor caso de consumo simultáneo. | INFO | | |
| HPCINT_018 | Entrega de diagramas y planos. El licitador deberá entregar esquemas unifilares, diagramas A/B completos, planos de implantación eléctrica, rutas de cableado, layout de PDUs y detalle de protecciones y cuadros | INFO | | |
| HPCINT_019 | secundarios. Eficiencia energética y DNSH. La propuesta deberá cumplir criterios de eficiencia energética y DNSH, optimizando el rendimiento energético del HPC mediante herramientas de monitorización eléctrica, métricas de consumo y gestión térmico-eléctrica. | MQR | | |
| HPCINT_020 | Mejoras técnicas valorables. Se valorarán soluciones eléctricas avanzadas: PDUs inteligentes con metering por salida, análisis armónico (THD), sistemas de predicción de consumo, balanceo automático A/B y optimización energética por nodo o rack. | TRQ | | |
| Requisitos apartado 2.2.3 | Requisitos apartado 2.2.3 | Requisitos apartado 2.2.3 | Requisitos apartado 2.2.3 | Requisitos apartado 2.2.3 |
| Requisito | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| HPCINT_021 | El sistema de refrigeración deberá disipar la totalidad de la potencia térmica generada por el nuevo HPC, nodos, redes y almacenamiento. | MQR | | |
| HPCINT_022 | La solución deberá incorporar una redundancia mínima n+1 en los | MQR | | |
<!-- image -->
<!-- image -->
| | elementos críticos del sistema frigorífico. | |
|------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|------|
| HPCINT_023 | El licitador aportará los cálculos justificativos del dimensionamiento frigorífico, incluyendo cargas térmicas máximas, márgenes de seguridad y métodos de cálculo. | INFO |
| HPCINT_024 | El licitador describirá la tipología del sistema de refrigeración propuesto (puertas frías, contención térmica, refrigeración líquida, sistemas híbridos, expansión directa, etc.). | INFO |
| HPCINT_025 | Las unidades exteriores ( condensadores u otros elementos) deberán situarseen la cubierta de la planta segunda, en el espacio liberado tras la desinstalación del sistema existente, cumpliendo con la normativa vigente. | MQR |
| HPCINT_026 | El adjudicatario retirará o reubicará cualquier elemento que impida la instalación de los nuevos equipos de refrigeración, en coordinación con el Servicio de Obras e Instalaciones de AEMET. | MQR |
| HPCINT_027 | Las canalizaciones frigoríficas deberán discurrir obligatoriamente por el falso techo del CPD y el patinillo técnico, conforme a los planos oficiales de AEMET. | MQR |
| HPCINT_028 | Las tuberías frigoríficas deberán ser de cobre deshidratado con aislamiento elastomérico, o equivalente con prestaciones térmicas y mecánicas iguales o superiores. | MQR |
| HPCINT_029 | El licitador presentará planos preliminares de implantación del sistema de refrigeración en el CPD. | INFO |
| HPCINT_030 | En caso necesario, para transmitir las cargas del sistema de refrigeración a la estructura del edificio se instalarán bancadas realizadas con perfiles metálicos de acero laminado apoyados sobre enanos de hormigón armado, recrecidos sobre los pilares | MQR |
<!-- image -->
<!-- image -->
| | existentes de la planta inferior, rematados por placas de anclaje y conectados mediante taladros y resina epoxi | | | |
|---------------------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|---------------------------|---------------------------|---------------------------------------|
| HPCINT_031 | Deberá justificarse el diseño de la infraestructura de apoyo y transmisión de cargas del sistema de refrigeración, mediante proyecto redactado y firmado por técnico competente y visado por el Colegio Profesional correspondiente. | MQR | | |
| HPCINT_032 | El licitador detallará soportes, bancadas metálicas, anclajes y sistemas de fijación necesarios para la instalación. | INFO | | |
| HPCINT_033 | El adjudicatario será responsable de la legalización del sistema y de todos los permisos, tasas y trámites administrativos. | MQR | | |
| HPCINT_034 | El diseño del sistema frigorífico deberá cumplir la normativa aplicable y contar con aprobación previa del Servicio de Obras e Instalaciones de AEMET. | MQR | | |
| HPCINT_035 | El licitador deberá aportar un plan de obra y coordinación, incluyendo fases, hitos y compatibilidad con las infraestructuras existentes. | INFO | | |
| HPCINT_036 | El sistema deberá cumplir con los requisitos de eficiencia energética y DNSH, incluyendo criterios de sostenibilidad y bajo impacto ambiental. | MQR | | |
| Requisitos apartado 2.2.4 | Requisitos apartado 2.2.4 | Requisitos apartado 2.2.4 | Requisitos apartado 2.2.4 | Requisitos apartado 2.2.4 |
| Requisito | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| HPCINT_037 | La arquitectura física del clúster deberá adaptarse al espacio disponible del CPD, respetando pasillos, alturas, suelo técnico y estructuras existentes. | MQR | | |
| HPCINT_038 | El diseño del clúster deberá organizarse siguiendo una distribución lógica que optimice el flujo de aire, la separación entre rutas eléctricas A/B y la | MQR | | |
<!-- image -->
<!-- image -->
| | infraestructura de refrigeración existente | |
|------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|------|
| HPCINT_039 | La distribución del clúster deberá respetar la separación física de rutas eléctricas y de comunicaciones (A/B), con doble alimentación y doble encaminamiento. | MQR |
| HPCINT_040 | El clúster deberá instalarse de forma que sea totalmente compatible con el resto del CPD | MQR |
| HPCINT_041 | El licitador deberá detallar la arquitectura completa del clúster, incluyendo nodos de cómputo, login, gestión, visualización, almacenamiento y redes internas. | INFO |
| HPCINT_042 | Los racks del clúster deberán permitir acceso frontal y posterior, zonas de servicio adecuadas y mantenimiento en caliente sin interrumpir la operación. | MQR |
| HPCINT_043 | El diseño deberá prever la escalabilidad futura del clúster, permitiendo ampliaciones sin rediseñar la arquitectura actual ni afectar a la operación. | MQR |
| HPCINT_044 | Se aportarán planos detallados de implantación del clúster: footprint de racks, distribución térmica, rutas A/B, y esquema de particiones. | INFO |
| HPCINT_045 | Los nodos del clúster deberán conectarse mediante redes de alta velocidad y baja latencia compatibles con el entorno HPC (InfiniBand u otras equivalentes), integradas con el CPD. | MQR |
| HPCINT_046 | La arquitectura del clúster deberá garantizar la integración plena con el sistema HPC externo mediante la red de interconexión entre CPDs. | MQR |
| HPCINT_047 | Las instalaciones del clúster deberán cumplir normativa eléctrica, térmica y estructural del CPD, sin comprometer equipos existentes. | MQR |
| HPCINT_048 | El adjudicatario deberá coordinar la implantación con el Servicio de | MQR |
<!-- image -->
<!-- image -->
| | Obras e Instalaciones y con Telemática de AEMET. | | | |
|---------------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|---------------------------|---------------------------|---------------------------------------|
| HPCINT_049 | El licitador deberá documentar la arquitectura lógica del clúster: particiones, red de gestión, red de acceso, red de computación y servicios auxiliares. | INFO | | |
| HPCINT_050 | Se valorarán mejoras en la arquitectura del clúster que optimicen eficiencia energética, modularidad, resiliencia y capacidad de operación distribuida. | TRQ | | |
| Requisitos apartado 2.2.5 | Requisitos apartado 2.2.5 | Requisitos apartado 2.2.5 | Requisitos apartado 2.2.5 | Requisitos apartado 2.2.5 |
| Requisito | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| HPCINT_051 | Conectividad integral entre CPD de AEMET y CPD externo: Será responsabilidad del adjudicatario proporcionar, instalar y dejar operativa toda la infraestructura necesaria para la interconexión extremo-a-extremo entre ambos CPDs. Esto incluirá fibra óptica de alta capacidad, canalizaciones, bandejas, módulos ópticos, transceptores y switches específicos para la interconexión entre clústeres. La arquitectura deberá ser dual, redundante y libre de puntos únicos de fallo (SPOF). Asimismo, deberá integrarse plenamente con el backbone de AEMET bajo la supervisión de la Unidad de Coordinación de Telemática (CTEL). | MRQ | | |
| HPCINT_052 | Red Fabric (interconexión HPC de baja latencia): El adjudicatario deberá desplegar la red de interconexión HPC basada en InfiniBand NDR o Ethernet ≥ 400Gb/s según partición. La red deberá ser non-blocking, con soporte RDMA, arquitecturas tipo fat-tree o dragonfly(+) | MRQ | | |
<!-- image -->
<!-- image -->
| HPCINT_053 | Interconexión Fabric entre CPDs: Cuando la operación requiera extender servicios de Fabric entre CPDs, el adjudicatario deberá proporcionar pasarelas, gateways o mecanismos de túnel que garanticen latencias mínimas, seguridad y compatibilidad con MPI y protocolos HPC. | TRQ |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_054 | Red de gestión -Nivel OOB (fuera de banda): El adjudicatario deberá desplegar una red OOB redundante (rutas A/B) con acceso seguro a BMC/IPMI/Redfish, totalmente aislada del resto de redes y plenamente integrada en la red OOB corporativa de AEMET. | MRQ |
| HPCINT_055 | Red de gestión -Nivel en banda (IB-MNG): Se deberá desplegar una red de gestión en banda dedicada a administración del sistema operativo, PXE, SSH, monitorización y servicios internos. Deberá soportar autenticación robusta, segmentación por VLAN y control de acceso por roles. | MRQ |
| HPCINT_056 | Interconexión de redes de gestión entre CPDs: El adjudicatario deberá implementar la interconexión cifrada entre las redes de gestión de ambos CPDs, con redundancia física y lógica, evitando cualquier SPOF y garantizando supervisión unificada. | MRQ |
| HPCINT_057 | Red dedicada de almacenamiento: El adjudicatario deberá desplegar una red física y lógicamente dedicada al tráfico de almacenamiento entre nodos, DTN y sistemas de almacenamiento de alto rendimiento y gran capacidad. Debe estar separada de la red Fabric, salvo implementación justificada con aislamiento VLAN/QoS equivalente. | MRQ |
| HPCINT_058 | Interconexión entre CPDs para red de almacenamiento. Se deberá proveer fibra óptica, transceptores, gateways y mecanismos de cifrado específicos para garantizar | MRQ |
<!-- image -->
<!-- image -->
| | integridad y rendimiento en el acceso a almacenamiento remoto entre ambos CPDs. | |
|------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCINT_059 | Integración con el backbone institucional: El adjudicatario deberá instalar y configurar un mínimo de dos switches redundantes por CPD, con al menos 4 puertos ≥100 Gb/s por switch y 800 Gb/s agregados como mínimo. Estos switches constituirán los puntos de demarcación entre el HPC y el backbone de AEMET. | MRQ |
| HPCINT_060 | Conectividad interna del sistema HPC: El adjudicatario deberá conectar correctamente los nodos de administración, login, visualización, DTN, almacenamiento y gestión conforme a la topología definida, garantizando redundancia, rutas alternativas y ausencia de contención en tráfico crítico. | TRQ |
| HPCINT_061 | Canalización y cableado estructurado: El adjudicatario deberá proyectar, suministrar e instalar canalizaciones, fibra óptica, latiguillos, bandejas y cableado estructurado siguiendo los estándares internos de CTEL y las normas UNE/ISO de cableado de CPD. | MRQ |
| HPCINT_062 | Etiquetado profesional y documentación: Todos los cables, equipos, paneles y puertos deberán estar etiquetados en ambos extremos, con sistema impreso, resistente y normalizado según CTEL. El adjudicatario deberá entregar planos, inventarios, esquemas de red, direccionamiento y topologías como parte de la aceptación. | MRQ |
| HPCINT_063 | Asignación de direccionamiento IP: La Unidad de Coordinación de Telemática (CTEL) asignará los rangos IP, VLAN y nomenclatura de | MRQ |
<!-- image -->
<!-- image -->
| | red. El adjudicatario deberá ajustarse estrictamente a dichas asignaciones y no podrá habilitar direcciones no autorizadas. | | | |
|---------------------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|---------------------------|---------------------------|---------------------------------------|
| HPCINT_064 | Seguridad en redes inter-CPD: Toda la interconexión entre CPDs (gestión, almacenamiento, Fabric cuando aplique y red de usuario) deberá implementar cifrado extremo-a-extremo, protecciones anti-spoofing, segmentación y aislamiento. | MRQ | | |
| HPCINT_065 | Supervisión y monitorización de red: El adjudicatario deberá integrar todos los switches, gateways, enlaces y componentes de red en los sistemas de monitorización corporativos (Zabbix, NetBox, Prometheus), exponiendo métricas de estado, rendimiento y alarmas. | TRQ | | |
| Requisitos apartado 2.2.6 | Requisitos apartado 2.2.6 | Requisitos apartado 2.2.6 | Requisitos apartado 2.2.6 | Requisitos apartado 2.2.6 |
| Requisito | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| HPCINT_066 | Ubicación e integración en el CPD de AEMET: El sistema deberá instalarse en la Zona HPC del CPD de AEMET, conforme a las condiciones estructurales, energéticas y térmicas establecidas en el Anexo IV. La infraestructura suministrada deberá ser plenamente operable bajo las condiciones ambientales y energéticas existentes, integrándose física y funcionalmente con el entorno CPD sin requerir interrupciones del servicio. | MRQ | | |
| HPCINT_067 | Compatibilidad con infraestructuras existentes: El sistema se integrará con las infraestructuras actuales de climatización, energía y comunicaciones del CPD sin requerir modificaciones estructurales que afecten al | MRQ | | |
<!-- image -->
<!-- image -->
| | servicio operativo. Garantizando que las cargas térmicas del HPC sean refrigeradas por el sistema de refrigeración del HPC y no suponga una sobrecarga para el sistema de refrigeración del resto del CPD. El licitador deberá acreditar que todo el equipamiento cumple con las limitaciones físicas y técnicas establecidas en el Anexo IV, sin exceder los parámetros definidos por AEMET. | |
|------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCINT_068 | Documentación técnica y dimensional: La oferta deberá incluir planos, imágenes, pesos, dimensiones, cargas, distribución en racks y requisitos ambientales del equipamiento. Toda la documentación deberá ser compatible con las condiciones de espacio de la Zona HPC, validadas previamente con CTEL. | MRQ |
| HPCINT_069 | Rutas y canalizaciones: Todas las rutas de cableado (eléctrico, OOB, red de gestión, Fabric, almacenamiento) deberán adaptarse a las rutas existentes en el CPD. Si fueran necesarias nuevas canalizaciones, el adjudicatario deberá diseñarlas, ejecutarlas y documentarlas con aprobación previa de CTEL. | MRQ |
| HPCINT_070 | Conectividad de red y ancho de banda: El sistema deberá disponer de interfaces físicas de red redundantes con ancho de banda agregado mínimo de 800 Gbps, con al menos 4 puertos ≥100 Gbps, compatibles con las redes internas de alto rendimiento de AEMET. Estas interfaces permitirán la integración con redes HPC, gestión y almacenamiento. | MRQ |
| HPCINT_071 | Operación térmica: El sistema deberá funcionar en el rango térmico nominal del CPD (hasta 35 °C). El licitador deberá especificar el rango completo de temperaturas soportadas y el impacto sobre rendimiento y estabilidad. | MRQ |
<!-- image -->
<!-- image -->
| HPCINT_072 | Operación en rango de humedad: El sistema deberá ser capaz de operar en un rango de humedad relativa del 20 %al 70 %sin condensación. El licitador deberá detallar la tolerancia del hardware y los efectos de variaciones extremas. | MRQ |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_073 | Plan de instalación e integración: El adjudicatario deberá presentar un plan completo que incluya cronograma, fases, despliegue, validaciones eléctrica y térmica, y pruebas de aceptación. CTEL deberá validar todas las fases. | MRQ |
| HPCINT_074 | Registro energético y sensórica: La solución deberá incluir sensorización avanzada (potencia, temperatura, caudales, flujo térmico) a nivel de nodo y rack, exportable al sistema SCADA/BMS de AEMET. | TRQ |
| HPCINT_075 | Software de monitorización en tiempo real: El adjudicatario deberá proveer un sistema de monitorización accesible vía web segura (HTTPS), con protocolos SNMP, Redfish o IPMI, mostrando métricas de CPU, GPU, memoria, almacenamiento, redes y energía. | TRQ |
| HPCINT_076 | Límite de consumo energético: El sistema no deberá superar los 360 kW (IT + frío), ni los 300kW por rama en modo contingente (loss of one feed). Se deberá incluir un sistema de medición y power capping dinámico. | MRQ |
| HPCINT_077 | Elementos de conectividad y accesorios: Se deberán suministrar PDUs, regletas, latiguillos, paneles, bandejas, accesorios de sujeción y todos los elementos necesarios para conectar el sistema a electricidad, climatización y red. | MRQ |
| HPCINT_078 | Buenas prácticas de despliegue e identificación: Toda la infraestructura deberá instalarse aplicando las mejores prácticas de ingeniería de CPDs, con etiquetado | TRQ |
<!-- image -->
<!-- image -->
| | profesional y trazabilidad completa conforme a las normas de AEMET. | |
|------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCINT_079 | En la fase 1 Diseño Detallado de la Solución el adjudicatario presentará una memoria con la planificación de la adecuación del entorno físico (las infraestructuras del CPD de AEMET), para la instalación de las distintas fases del Sistema. | MQR |
| HPCINT_080 | El adjudicatario se responsabilizará de ejecutar con la debida antelación, de acuerdo con la planificación del punto anterior del requistio CPDINT_038 y asumiendo los costes, todas las actuaciones de adecuación de las infraestructuras del CPD de AEMET necesarias para la instalación de las distintas fases de su sistema, como resultado de requerimientos adicionales o superiores a lo disponible (o planificado) en las fechas de la instalación según se especifica en el ANEXO V. Dichas actuaciones podrán incluir: a) Conexión a los cuadros eléctricos específicos y adicionales (si bien, habrá un cuadro disponible una vez retirado el actual sistema HPC) b) Sistemas de refrigeración propios para su equipamiento c) Realización de estructuras de refuerzo del suelo técnico y de redistribución de cargas en los forjados cuando exista riesgo de sobrepasar su resistencia. En este caso, realizarán las pruebas pertinentes que permitan garantizar la seguridad de la solución adoptada En ningún caso serán admisibles propuestas que impliquen la ampliación de la capacidad del centro de transformación ni de las líneas de suministro eléctrico | MQR |
<!-- image -->
<!-- image -->
| HPCINT_081 | El transporte de todo el equipamiento del Sistema HPC (y el necesario de soporte) en cualquiera de sus fases, el acceso del mismo al CPD a través del edificio y su instalación incluyendo la conexión a los cuadros eléctricos de AEMET será responsabilidad del suministrador y sin costes para AEMET. Los licitadores se ocuparán por sus propios medios de garantizar el acceso adecuado de sus equipos al CPD de AEMET y de que ningún obstáculo bajo el suelo técnico de dicho CPD les cause problemas durante la instalación del equipamiento. Es aconsejable una visita a las instalaciones de AEMET para cumplir este punto adecuadamente | MQR |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_082 | Los licitadores proporcionarán junto con la oferta, y en forma detallada, lo siguiente: a) Las configuraciones del equipamiento a instalar en las distintas fases (con esquemas de la misma) b) Los requerimientos de suministro eléctrico (incluyendo los relativos a su calidad y la tolerancia frente a fluctuaciones en el voltaje). Entre estos requisitos declararán el consumo eléctrico máximo de todo el equipamiento que deban instalar (incluyendo refrigeración adicional) y qué parte de él necesita de continuidad, bajo UPS y/o grupo electrógeno c) Los requerimientos de refrigeración d) Los tamaños (espacio ocupado teniendo en cuenta las zonas de acceso y servicio) y pesos de los diferentes equipos a instalar, incluyendo las cargas promedio por metro cuadrado y los puntos de apoyo e) Posibles restricciones a aplicar en cuanto a distancias entre el equipamiento a instalar y otros existentes f) También se informará, en su caso, de la necesidad de un sistema externo de ventilación | MQR |
<!-- image -->
<!-- image -->
| | forzada para asegurar su adecuada refrigeración | |
|------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|------|
| HPCINT_083 | Los licitadores proporcionarán los detalles de todas las alternativas de refrigeración que están disponibles para su equipo, como refrigeración por aire, por agua, total o parcial, incluyendo una evaluación de las ventajas y cualquier desventaja de cada solución propuesta | INFO |
| HPCINT_084 | La calidad del agua dentro del sistema de enfriamiento no puede ser garantizada por ningún estándar particular, consecuentemente si el equipamiento del sistema HPC va a ser enfriado por agua, los licitadores deberán proveer transformadores de calor intermedios | MQR |
| HPCINT_085 | Los licitadores declararán si el equipo ofrecido requiere la provisión de ventilación externa forzada para asegurar una refrigeración adecuada. La provisión de refrigeración forzada no debería reducir considerablemente la capacidad de AEMET de instalar otro equipo dentro de su CPD | INFO |
| HPCINT_086 | Los licitadores declararán si el Sistema puede ser conectado directamente a la red eléctrica o si debe ser conectado a un sistema | INFO |
<!-- image -->
<!-- image -->
| | de alimentación ininterrumpida (UPS) | | | |
|-----------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----------------------------|-----------------------------|---------------------------------------|
| HPCINT_087 | Si el sistema está predominantemente refrigerado por aire, antes de presentar las ofertas, los licitadores deben asegurarse de que se pueda lograr una refrigeración adecuada por aire dentro del CPD, y explicar cómo se puede lograr esto sin tener un efecto perjudicial sobre otros equipos dentro de la sala. Si se requiere ventilación forzada externamente, los licitadores deben indicarlo, y no debe reducir significativamente la capacidad de AEMET para instalar otro equipo dentro del CPD | MQR | | |
| HPCINT_088 | Si se requieren unidades de tratamiento de aire en el CPD, se deberá realizar una inspección del sitio antes de presentar su oferta para identificar las ubicaciones para que las unidades cumplan con sus requisitos de enfriamiento | MQR | | |
| HPCINT_089 | Los licitadores deben aceptar que AEMET apague temporalmente el Sistema o cualquier parte del Sistema según sea necesario. El tiempo de estas paradas temporales a petición de AEMET no contabilizaría en los requisitos de disponibilidad | MQR | | |
| Requisitos apartado 2.2.7.3 | Requisitos apartado 2.2.7.3 | Requisitos apartado 2.2.7.3 | Requisitos apartado 2.2.7.3 | Requisitos apartado 2.2.7.3 |
| Requisito | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| HPCINT_090 | Todos los nodos del clúster deben estar estrechamente acoplados dentro de un solo grupo a través de una interconexión de alto rendimiento, lo que debe hacer posible ejecutar de manera eficiente un solo programa intensivo de comunicación MPI, en todos estos nodos. | MQR | | |
<!-- image -->
<!-- image -->
| HPCINT_091 | Todos los nodos de aplicación en el clúster deben ser idénticos salvo por la cantidad de memoria instalada. | MQR |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_092 | Exceptuando la versión, el sistema operativo y el resto del software que se proporciona con el clúster para cada tipo de nodos deberán ser idénticos en todas las fases. | MQR |
| HPCINT_093 | Los licitadores deberán describir qué estándares cumple la aritmética de coma flotante | INFO |
| HPCINT_094 | utilizada por el cluster Los licitadores deberán suministrar una completa y detallada descripción de la arquitectura del clúster, indicando cuales de las características descritas son particularmente relevantes para el cálculo de altas prestaciones y qué diferencias existen entre ambos. Como mínimo, la descripción del hardware debe incluir: a) un diagrama de la arquitectura dentro de los distintos tipos de nodo que muestre: • procesadores • memoria • interconexión entre los procesadores y la latencia MPI y el ancho de banda alcanzables • buses (memoria y E/S) b) un diagrama esquemático de la arquitectura del clúster, mostrando los componentes más importantes y cómo se interconectan: • nodos (resaltando cualquiera que tenga un propósito específico, aplicación, E/S, …). | MQR |
| HPCINT_095 | La configuración del hardware utilizado para el suministro de las prestaciones comprometidas para el clúster.Deberá especificarse de forma detallada en la oferta. La configuración del hardware utilizado para el compromiso de prestaciones del clúster final deberá facilitarse con la suficiente antelación a su instalación. | MQR |
<!-- image -->
<!-- image -->
| HPCINT_096 | Plataforma integrada: La infraestructura a suministrar deberá constituir una plataforma integrada y completamente operativa, incluyendo todo el hardware, software y componentes auxiliares necesarios para prestar el servicio a los usuarios y gestionar el sistema dentro del entorno del CPD de AEMET. La oferta deberá incluir todos los elementos de gestión, monitorización, almacenamiento, red, energía y refrigeración necesarios para garantizar el funcionamiento estable y continuo del sistema. | MQR |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_097 | Tiempo de reinicio: Cada partición funcional del sistema (cómputo, acceso, administración, E/S) deberá poder reiniciarse completamente en menos de 60 minutos, garantizando la recuperación del servicio en condiciones normales o | MQR |
| HPCINT_098 | Características comunes de los nodos: Todos los nodos deberán disponer de una tarjeta de gestión remota (BMC) con, al menos, las siguientes características: • Puerto Ethernet dedicado o compartido. • Gestión remota mediante GUI HTML5 (sin dependencias Java). • Consola virtual y VMedia. • Mecanismos de protección frente a cambios no autorizados en producción. • Actualizaciones de firmware firmadas digitalmente y reversibles. • Protección ante actualizaciones no seguras de componentes internos. • Contraseña predeterminada segura y políticas de rotación. • Soporte de autenticación LDAP,SSSD,IdM o compatible con | MQR |
<!-- image -->
<!-- image -->
| | IdP corporativo corporativo. • Bloqueo por IP y gestión del flujo de aire. Además, los nodos deberán disponer de sistemas de monitorización remota y alerta temprana, capaces de enviar notificaciones automáticas ante fallos potenciales de memoria o discos antes de la pérdida de servicio. | |
|------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCINT_099 | Supervisión de fallos del sistema: La infraestructura deberá permitir la monitorización integral del estado de todos los componentes hardware y software mediante herramientas abiertas o integrables con el sistema de supervisión de AEMET. La plataforma de supervisión deberá ofrecer APIs abiertas (REST, Redfish o SNMP) que permitan la integración con sistemas de terceros y notificar cualquier fallo de hardware relevante en menos de 60 s desde su detección. | MQR |
| HPCINT_100 | Potencia del nodo y medición de energíaEl sistema deberá permitir la medición precisa (± 5 %) de la potencia y energía consumida por cada nodo, rack o grupo de racks, sin afectar significativamente al rendimiento. Los datos energéticos deberán integrarse con la monitorización general del CPD (BMS/SCADA) y con el sistema de gestión del clúster. | MQR |
| HPCINT_101 | API de supervisión y gestiónLos sistemas de supervisión y gestión deberán proporcionar APIs estandarizadas que permitan la integración con las herramientas de monitorización y gobierno de AEMET. Estas APIs deberán ofrecer | MQR |
<!-- image -->
<!-- image -->
| | información sobre el estado de salud y rendimiento de todos los componentes de la infraestructura y generar alertas ante incidencias en un máximo de 60 s. | |
|------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCINT_102 | Consumo energético máximo: El consumo máximo del equipamiento IT instalado en el CPD de AEMET no podrá superar en ningún caso los 360 kW(IT + frío), con un límite de 300kW por rama en modo contingente ( loss of one feed ). El adjudicatario deberá garantizar el cumplimiento de estos límites mediante políticas de power capping dinámico, ajustables por software y monitorizadas durante las pruebas | MQR |
| HPCINT_103 | de aceptación. Refrigeración: El sistema deberá estar diseñado para refrigeración por aire asistida u otro mecanismo. La contribución máxima de refrigeración por aire no superará el 15 %de la potencia térmica total, y el sistema incluirá mecanismos de control y sensórica térmica integrados con la monitorización de AEMET. | MQR |
| HPCINT_104 | Cumplimiento con la normativa europea DNSH y ecológicaEl equipamiento deberá cumplir con los principios de no causar un perjuicio significativo (DNSH) establecidos en el Reglamento (UE) 2021/241 y con los requisitos de diseño ecológico de la Directiva 2009/125/CE. La oferta deberá incluir: • Documentación técnica del fabricante que acredite el cumplimiento de los requisitos de diseño ecológico aplicables. • Documentación acreditativa del marcado CE, garantizando el cumplimiento de la normativa europea sobre sustancias restringidas conforme al Real | MQR |
<!-- image -->
<!-- image -->
| | Decreto 219/2013, de 22 de marzo.El adjudicatario será responsable de conservar y entregar toda la documentación justificativa requerida para auditorías de cumplimiento PRTR y DNSH. | | | |
|-----------------------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----------------------------|-----------------------------|---------------------------------------|
| Requisitos apartado 2.2.8.1 | Requisitos apartado 2.2.8.1 | Requisitos apartado 2.2.8.1 | Requisitos apartado 2.2.8.1 | Requisitos apartado 2.2.8.1 |
| Requisito | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| HPCINT_105 | Requisitos generales: La infraestructura de red deberá proporcionar una estructura de interconexión de baja latencia y alto ancho de banda que conecte todos los nodos del sistema (de cómputo, E/S, administración y visualización) tanto en el clúster principal (CPD AEMET) como en el clúster externo. La red deberá cumplir las siguientes características mínimas: • Basada en tecnología de al menos 400 Gb/s. • Ancho de banda bidireccional completo (full dúplex ) por enlace de 200 Gb/s). • Soporte para RDMA(Remote Direct Memory Access) y optimización de comunicaciones MPI (Message Passing Interface). • Compatibilidad con mecanismos de federación entre clústeres y segmentación de tráfico HPC mediante QoS y VLAN dedicadas.El diseño deberá garantizar el equilibrio entre latencia, ancho de banda y escalabilidad futura del sistema. | MQR | | |
<!-- image -->
<!-- image -->
| HPCINT_106 | Ancho de banda efectivo: La estructura de red deberá proporcionar ancho de banda de bisección completo (full bisection bandwidth), sin contención entre los nodos de cómputo en las operaciones colectivas típicas de HPC y modelización meteorológica. | MQR |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_107 | Topología de red: Se requiere una topología sin bloqueo, basada en fat-tree o dragonfly (+), que asegure rutas alternativas en caso de fallo de enlace y soporte de reconfiguración dinámica.La elección de la topología deberá estar justificada en la oferta técnica conforme al equilibrio entre rendimiento, consumo y escalabilidad. | MQR |
<!-- image -->
<!-- image -->
| | Todos los nodos del sistema (cómputo, E/S, administración, login y visualización) deberán estar conectados a la red de interconexión de altas prestaciones conforme al diseño arquitectónico aprobado por AEMET. Las conexiones deberán garantizar un rendimiento consistente, baja latencia y compatibilidad con los estándares abiertos definidos en el Anexo V. La red de interconexión deberá cumplir, como mínimo, las siguientes condiciones: Latencia hop-to-hop inferior a 2 µs, entendida como la latencia port-to- port a través de un switch, incluyendo encaminamiento | |
|------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCINT_108 | La latencia extremo a extremo entre dos nodos de cómputo deberá corresponderse con los valores típicos de las interconexiones HPC de última generación, debiendo el licitador declarar explícitamente las métricas obtenidas para: • mensajes cortos (≤ 64 bytes), • mensajes medianos (4-64 KB), • operaciones colectivas (all- reduce, barrier, all-to-all). Las conexiones entre nodos y | MQR |
<!-- image -->
<!-- image -->
| | La topología propuesta (fat-tree, dragonfly(+), o equivalente) deberá garantizar rutas alternativas sin aumentar la profundidad del árbol de conmutación. El licitador deberá declarar el número de niveles del fabric y justificar expresamente el cumplimiento del límite de hops. El diseño deberá soportar encaminamiento adaptativo, RDMAy comunicación MPI optimizada, garantizando baja latencia, mínimo jitter y rendimiento sostenido para cargas HPC y meteorológicas. El licitador deberá aportar en la oferta la topología completa del fabric, su profundidad, el número máximo de saltos, las latencias nominales del fabricante y las latencias esperadas en producción para la escala total del sistema. | |
|------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCINT_109 | Capacidades de supervisión y gestión: La red deberá integrar un sistema de administración centralizada y monitorización en tiempo casi real de rendimiento, tráfico, latencia y estado de salud de los enlaces.Cada switch de la red Fabric deberá disponer de: • Puerto de gestión fuera de banda (1 GbE) independiente del tráfico de datos. • Soporte para SNMP, Redfish o API REST para su integración con las plataformas de supervisión de AEMET (Zabbix, NetBox u otras). | MQR |
<!-- image -->
<!-- image -->
| HPCINT_110 | Características avanzadas de la red: La red deberá soportar las siguientes capacidades avanzadas: • Computación en red (in-network computing) para acelerar operaciones colectivas (reducción, broadcast, gather, etc.). • Mecanismos de enrutamiento adaptativo para evitar congestiones. • Autorreconfiguración y autorreparación, con detección automática de cambios en la topología y redireccionamiento dinámico de tráfico. • QoS jerárquico para priorizar tráfico de producción operativa frente a tareas experimentales. | MQR |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_111 | La red de interconexión de altas prestaciones debe ser resistente a fallos y ser capaz de enrutar las comunicaciones automáticamente ante fallos o enlaces degradados sin pérdidas en el ancho de banda agregado y sin interrupciones apreciables en el flujo. Los licitadores deben explicar los mecanismos de failover y recuperación y la duración estimada para cualquier interrupción en las comunicaciones. Los benchmarks deben ser ejecutados en las condiciones de resistencia a fallos y alta disponibilidad que se apliquen a la red de interconexión de altas prestaciones. El licitador deberá ejecutar las pruebas de ancho de banda, latencia y all-to-all con un 5-10% de enlaces deshabilitados para demostrar comportamiento en | MQR |
| HPCINT_112 | Redundancia eléctrica en los conmutadores: Cada conmutador de la red Fabric deberá estar equipado con fuentes de alimentación redundantes (PSU dual), intercambiables en caliente y | MQR |
<!-- image -->
<!-- image -->
| | conectadas a ramas de alimentación A/B independientes del CPD, asegurando continuidad de servicio ante fallo eléctrico de una línea. | |
|------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|------|
| HPCINT_113 | Los licitadores deberán explicar, y en caso afirmativo describir, si disponen de alguna funcionalidad de la red de interconexión de altas prestaciones que permita aislar ciertos flujos de trabajo por razones de seguridad o rendimiento. | INFO |
| HPCINT_114 | Dimensionado del fabric: El fabric de interconexión del sistema HPC deberá estar dimensionado de forma que proporcione un rendimiento estable, predecible y adecuado para cargas de trabajo intensivas en comunicaciones, propias de los modelos meteorológicos operativos de AEMET. El diseño deberá basarse en una arquitectura moderna y eficiente que garantice baja latencia, alto ancho de banda agregado y una escalabilidad futura sin degradación del servicio. El licitador deberá describir de forma completa la arquitectura del | MQR |
<!-- image -->
<!-- image -->
| experimentales, podrá admitirse un oversubscription moderado únicamente si se justifica de manera clara en la oferta técnica y siempre que no afecte a los recursos de producción. Asimismo, el licitador deberá proporcionar la descripción detallada del oversubscription por niveles, el ancho de banda efectivo resultante y los mecanismos que garanticen un rendimiento sostenido bajo diferentes patrones de carga. La oferta técnica deberá incluir diagramas o esquemas que permitan evaluar con precisión la distribución, profundidad y dimensionado del fabric, así como su adecuación a las necesidades de AEMET. |
|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
<!-- image -->
<!-- image -->
| HPCINT_115 | Escalabilidad y límites de profundidad del fabric: El diseño del fabric deberá permitir la ampliación posterior del sistema sin introducir nuevos niveles de conmutación ni incrementar la profundidad jerárquica de la red. La topología utilizada no podrá incorporar más de tres niveles de switches y la ruta más larga entre dos nodos de cómputo no podrá superar los tres saltos (hops), tanto en la configuración inicial como en su evolución futura. El licitador deberá declarar explícitamente el número de niveles del fabric, el número máximo de hops node-to- node y la distribución de switches en cada nivel. El crecimiento del sistema deberá realizarse manteniendo la latencia extremo a extremo dentro de los valores típicos de las interconexiones HPC de última generación. La ampliación del número de nodos no deberá implicar un aumento significativo del jitter, del número de hops ni del ancho de banda agregado disponible para operaciones colectivas. El licitador deberá aportar una matriz de escalabilidad prevista, describiendo el impacto en latencias, rutas y ancho de banda para distintos escenarios de crecimiento. La oferta técnica deberá incluir las latencias nominales publicadas por el fabricante para los elementos del fabric, así como las latencias | MQR |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
<!-- image -->
<!-- image -->
| | óptimo en cargas operativas y experimentales. | | | |
|-----------------------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----------------------------|-----------------------------|---------------------------------------|
| Requisitos apartado 2.2.8.2 | Requisitos apartado 2.2.8.2 | Requisitos apartado 2.2.8.2 | Requisitos apartado 2.2.8.2 | Requisitos apartado 2.2.8.2 |
| Requisito | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| HPCINT_116 | Red de gestión general: El sistema deberá disponer de una red Ethernet físicamente dedicada para la gestión, monitorización y acceso administrativo a todos los nodos y componentes del sistema. • La sobresuscripción máxima de la topología no superará 4:1. • La red deberá ser redundante en enlaces y conmutadores de agregación, de forma que la pérdida de un conmutador o enlace no afecte a la estabilidad global, salvo en los de acceso. La red de gestión deberá mantener conectividad operativa ante la pérdida de enlaces o | MQR | | |
84
<!-- image -->
<!-- image -->
| | conmutadores, soportando mecanismos automáticos de conmutación y reencaminamiento (failover). .• Se deberán definir dos subredes lógicas (VLAN): una de gestión en banda (MNG-IB) y otra fuera de banda (MNG-OOB). • La red estará integrada con la infraestructura de comunicaciones del CPD de AEMET conforme a las políticas de segmentación de Telemática. | |
|------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCINT_117 | Conectividad de los nodos: • Red de gestión en banda (MNG- IB): empleada para la administración e implementación de nodos de cómputo y datos, instalación de sistemas operativos, monitorización de rendimiento y tráfico del gestor de cargas de trabajo. • Red de gestión fuera de banda (MNG-OOB): dedicada a la administración de los BMC/IPMI/Redfish de todos los equipos del sistema (nodos, almacenamiento, red y chasis). Esta red deberá estar aislada físicamente y lógicamente, con autenticación reforzada y cifrado TLS. | MQR |
| HPCINT_118 | Capacidades de supervisión y gestión: La red de gestión deberá permitir la administración centralizada y la recopilación casi en tiempo real de información de rendimiento y estado (por ejemplo, mediante sFlow, NetFlow o Redfish).Cada conmutador de la red dispondrá de un puerto OOB de gestión (1 GbE) conectado a la red MNG-OOB. | MQR |
<!-- image -->
<!-- image -->
| HPCINT_119 | Conmutadores de agregación: • Los conmutadores de agregación deberán disponer de puertos de al menos 100 GbE para conexión con los switches de acceso y nodos de administración. • Deberán soportar enrutamiento estático y dinámico (OSPF, BGP, MP-BGP, OSPFv3). • El licitador definirá el número y configuración para cumplir los tiempos de reinstalación y monitorización exigidos .• Estos conmutadores se conectarán al backbone interno de AEMET mediante dos enlaces redundantes de al menos 100 GbE. | MQR |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_120 | Switches de acceso • Puertos de acceso 1 GbE para interfaces OOB. • Puertos de acceso 10/25 GbE para la red de gestión en banda. • Puertos 100 GbE para nodos de administración y almacenamiento de gestión. • Puertos de enlace ascendente 100 GbE hacia los conmutadores de agregación.Los switches deberán ser apilables o interconectables con redundancia MLAG. | MQR |
| HPCINT_121 | Capacidades de red: Los conmutadores de la red de gestión deberán soportar: • IPv4 e IPv6 completos. • Protocolos MLAG o MC-LAG equivalente, LAG, LACP, VLAN y los estándares IEEE 802.x, ACLs, port mirroring, flowcontrol, un mínimo de 256 VLANs y una tabla de direcciones MAC de al menos 10.000 entradas. • Integración mediante SNMPv3, Syslog y API REST con las plataformas de monitorización y gestión de red de AEMET (Zabbix, NetBox u otras equivalentes). • Los switches deberán soportar gestión segura mediante SSHv2. | MQR |
<!-- image -->
<!-- image -->
| HPCINT_122 | Rendimiento operativo: El diseño de la red de gestión deberá permitir: • Reconfiguración completa del sistema operativo (sin reinstalación) de todos los nodos en < 2 min. • Reinstalación del SO en todos los nodos de cómputo en < 3 h. • Reinicio en frío de todos los nodos de cómputo en < 60 min (desde apagado del primero hasta arranque del último no defectuoso). • Recopilación de métricas IPMI/Redfish/SNMP de todos los nodos y dispositivos en < 20 s mediante sesiones paralelas, sin impacto operativo. | MQR | | |
|---------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|---------------------------|---------------------------|---------------------------------------|
| HPCINT_123 | Redundancia eléctrica: Cada conmutador de la red de gestión deberá disponer de fuentes de alimentación redundantes (PSU dual A/B), intercambiables en caliente y conectadas a ramas | MQR | | |
| HPCINT_124 | Topología de red: La red de gestión se basará preferentemente en una topología Spine-Leaf de capa 2 con soporte MLAG, que garantice baja latencia, alta disponibilidad y escalabilidad para futuras ampliaciones. | MQR | | |
| Requisitos apartado 2.2.9 | Requisitos apartado 2.2.9 | Requisitos apartado 2.2.9 | Requisitos apartado 2.2.9 | Requisitos apartado 2.2.9 |
| Requisito | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| HPCINT_125 | Número mínimo de nodos: La partición de cómputo del CPD de AEMET deberá disponer de un mínimo de 160 nodos homogéneos en arquitectura, memoria, CPU y conectividad, equivalentes o superiores en rendimiento a los actualmente en operación en AEMET. Esta cifra garantiza la continuidad de la capacidad operativa de los modelos de | MQR | | |
<!-- image -->
<!-- image -->
| | predicción meteorológica y climatológica. | |
|------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCINT_126 | Requisitos comunes de los nodos: Deberá cumplir el requisito HPCINT_009 comunes a todos los nodos. | MQR |
| HPCINT_127 | Tecnología de CPULa CPU de los nodos deberá estar basada en arquitectura x86-64 o equivalente, con un mínimo de 72 núcleos físicos por CPU y al menos 2 CPU por nodo. Cada núcleo deberá ofrecer un rendimiento pico ≥ 25Gflops FP64.Frecuencia base ≥ 2.6 GHz o frecuencia sostenible en carga. Turbo sostenido en cargas vectoriales. El rendimiento agregado del conjunto de la partición deberá ser coherente con el dimensionamiento energético del CPD (≤ 360 kW IT + frío). | MQR |
| HPCINT_128 | Configuración de los nodosCada nodo deberá estar equipado, como mínimo, con 2 CPU de 64 núcleos y la memoria y almacenamiento local especificados en los requisitos siguientes. | MQR |
| HPCINT_129 | Memoria DRAM: • Cada nodo deberá disponer de un mínimo de 512 GB de memoria DDR5 (o LPDDR5) o superior. • Los nodos deberán configurarse para saturar todos los canales de memoria disponibles, garantizando el máximo ancho de banda de acceso. | MQR |
| HPCINT_130 | Requisitos de red: Los nodos deberán estar equipados con: • 1 NIC con 2 puertos conectados a la red Fabric de baja latencia (≥ 200 Gb/s por puerto, 400 Gb/s agregados) full-duplex.La NIC fabric sea PCIe Gen5×16 o | MQR |
<!-- image -->
<!-- image -->
| | equivalente. • 1 NIC dual (2 puertos × 10/25 GbE) conectada a la red de gestión en banda (MNG-IB), con soporte PXE y arranque remoto. • 1 NIC 1 GbE dedicada al BMC, conectada a la red OOB.La conexión a los conmutadores deberá garantizar redundancia y tolerancia a fallos. | |
|------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCINT_131 | Arquitectura de interconexión: Las interfaces Fabric de cada nodo deben estar conectadas a switches distintos, reduciendo la dependencia de un único punto de fallo y mejorando la resiliencia. | MQR |
| HPCINT_132 | Almacenamiento local del nodo: Cada nodo deberá incorporar 2 unidades SSD NVMe configuradas en RAID-1 (hardware o software) con una capacidad neta mínima de 0,8 TB dedicada al sistema operativo y a los entornos locales temporales. | MQR |
| HPCINT_133 | Características avanzadas del nodo: Se valorará la provisión de nodos con mayor capacidad de memoria, mayor número de núcleos o mejor rendimiento energético (GFLOPS/W), siempre que se mantenga la homogeneidad operativa de la partición. | TQR |
| HPCINT_134 | Rendimiento agregado: El rendimiento conjunto de la partición de cómputo deberá alcanzar, en los benchmarks HPL y HPL-MxP, un valor igual o superior al estimado para los nodos actuales de AEMET, garantizando un factor de ganancia ≥ 2 respecto al sistema vigente. | MQR |
| HPCINT_135 | Número adicional de nodos: Se valorarán las ofertas que incluyan más nodos de cómputo que el mínimo especificado, siempre que se mantengan los límites de potencia y refrigeración establecidos para el CPD. | TQR |
<!-- image -->
<!-- image -->
| HPCINT_136 | Nodo de exposición: Deberá suministrarse un nodo de exposición no operativo, idéntico en configuración y diseño a los nodos del sistema, destinado a demostraciones, formación y visitas institucionales en el CPD de AEMET. | MQR |
|--------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_137 | Eficiencia energética del nodo: Cada nodo de cómputo deberá alcanzar un rendimiento energético mínimo de ≥ 15 GFLOPS/W en precisión FP64, medido mediante pruebas LINPACK, HPL o equivalente. El licitador deberá aportar certificados, documentación oficial del fabricante o resultados propios reproducibles que acrediten el rendimiento energético declarado. Este requisito tiene por objeto garantizar que los nodos ofertados proporcionan un equilibrio adecuado entre capacidad de cómputo, consumo eléctrico y disipación térmica, ajustándose a los límites energéticos establecidos | MQR |
| HPCINT_138 | Ancho de banda de memoria: Cada nodo deberá alcanzar un ancho de banda mínimo de memoria de ≥ 400 GB/s en la prueba STREAM TRIAD, con todos los canales de memoria activados y configurados para máxima eficiencia. La oferta técnica deberá incluir los valores medidos y los valores nominales proporcionados por el fabricante. Este requisito es imprescindible para garantizar el rendimiento de modelos meteorológicos fuertemente dependientes del ancho de banda de memoria. | MQR |
<!-- image -->
<!-- image -->
| HPCINT_139 | Afinidad CPU-NIC y diseño NUMA: La arquitectura del nodo deberá garantizar la afinidad óptima entre CPU, controladores de memoria y la NIC de interconexión, evitando saltosNUMA innecesarios. La oferta técnica deberá incluir un esquema de topología NUMA que muestre la colocación relativa de CPUs, canales de memoria, NICs, y dispositivos NVMe, asegurando que la latencia de acceso a los componentes críticos es mínima. El sistema operativo y el gestor de colas deberán estar configurados para respetar dicha afinidad durante la ejecución de los jobs. | MQR |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_140 | Homogeneidad estricta de la partición: Todos los nodos de la partición de cómputo deberán ser completamente homogéneos en: modelo exacto de CPU, stepping y microcódigo, frecuencia base y turbo sostenible, capacidad y velocidad de memoria, tipo y versión de NIC, configuración PCIe, firmware del BMC, BIOS/UEFI y versiones de controlador, almacenamiento local. No se admitirán configuraciones mixtas dentro de la partición principal de cálculo. La oferta deberá certificar la homogeneidad de todos los componentes y del rendimiento nominal dentro de una variación ≤ 5 %entre nodos. | MQR |
<!-- image -->
<!-- image -->
| HPCINT_141 | energética y power capping: Cada nodo deberá disponer de mecanismos de telemetría hardware (RAPL, PMBus, Redfish o equivalentes) que permitan medir en tiempo real el consumo energético total del nodo, consumo del procesador, temperatura de los componentes principales y eventos térmicos. El nodo deberá permitir el establecimiento de límites de potencia (power capping) gestionables desde el sistema de monitorización y el gestor de colas, permitiendo ajustar dinámicamente el consumo en función de las cargas del sistema y de las políticas operativas de AEMET. | MQR | | |
|----------------------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|----------------------------|----------------------------|---------------------------------------|
| HPCINT_142 | Fiabilidad y resiliencia del nodo: Cada nodo deberá disponer de: Memoria ECC obligatoria con soporte para detección y corrección de errores. Firmware BIOS/UEFI firmado digitalmente y mecanismos de Secure Boot. BMC con doble firmware o sistema de fallback seguro, actualizable sin interrupción del nodo. Sensores de salud hardware integrados con Redfish/IPMI. MTBF acorde a sistemas HPC (> 200.000 h), que deberá ser | MQR | | |
| Requisitos apartado 2.2.10 | Requisitos apartado 2.2.10 | Requisitos apartado 2.2.10 | Requisitos apartado 2.2.10 | Requisitos apartado 2.2.10 |
| Requisito | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
<!-- image -->
<!-- image -->
| HPCINT_143 | Requisitos generales: La partición de administración alojará todos los servicios de control, gestión y orquestación del sistema, incluyendo el gestor de colas, monitorización, autenticación, despliegue y mantenimiento automatizado. El tamaño de la partición será suficiente para soportar el funcionamiento ininterrumpido del clúster y garantizar la continuidad operativa. Deberá contar con al menos 3 nodos físicos dedicados, configurados de forma redundante. | MQR |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_144 | Requisitos comunes de los nodos Deberá cumplir el requisito HPCINT_098 comunes a todos los nodos. | MQR |
| HPCINT_145 | Configuración de los nodos: Cada nodo de administración deberá incluir 2 CPU x86-64 de última generación con al menos 64 núcleos por CPU, orientadas a la ejecución permanente de servicios de gestión. | MQR |
| HPCINT_146 | Configuración de memoria: Los nodos deberán disponer de al menos 256 GB de memoria DDR5, garantizando la capacidad necesaria para ejecutar los servicios simultáneos de monitorización, gestión y bases de datos. | MQR |
| HPCINT_147 | Almacenamiento de la partición de administración: Los nodos compartirán un almacenamiento dedicado de al menos 200 TB netos, destinado a: • Software y herramientas de gestión. • Bases de datos de configuración y control con copias de seguridad diferenciales diarias (mínimo 1 año). • Registros de sistema agregados (mínimo 1 año). • Registros de auditoría y métricas de rendimiento (mínimo 2 años). | MQR |
93
<!-- image -->
<!-- image -->
| | • Telemetría energética y de estado del sistema.El almacenamiento deberá estar conectado a la red de gestión (MNG-IB), accesible por todos los nodos, y ser físicamente independiente del almacenamiento de cómputo. La configuración deberá ser resistente al fallo simultáneo de al menos dos bloques básicos independientes (nodos de almacenamiento, controladores o chasis). | |
|------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCINT_148 | Configuración de redCada nodo de administración deberá disponer de: • 1 NIC con 2 puertos conectados a la red Fabric de baja latencia (≥ 200 Gb/s por puerto, 400 Gb/s agregados). • 1 NIC con 2 puertos conectados a la red de gestión (MNG-IB) de AEMET, con 25-100 Gb/s por puerto y soporte PXE y arranque remoto. • 1 NIC con 1 puerto Ethernet 1 GbE dedicado al BMC, conectado a la red OOB del CPD de AEMET.Las conexiones deberán realizarse a switches redundantes, | MQR |
| HPCINT_149 | Conexión con la red corporativa de AEMET: Los nodos de administración deberán estar conectados a la red troncal corporativa de AEMET, permitiendo la integración con los sistemas de Telemática (gestión, monitorización y copia de seguridad). Esta conectividad será redundante y de alta capacidad. | MQR |
| HPCINT_150 | Rendimiento: El número y configuración de nodos de administración deberá garantizar los niveles de rendimiento requeridos para las operaciones de instalación y reinicio , así como la eficiencia en la recolección, almacenamiento y | MQR |
<!-- image -->
<!-- image -->
| | procesamiento de métricas, registros y auditorías. Las operaciones de gestión y consulta deberán realizarse sin degradación perceptible del servicio. | |
|------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCINT_151 | Alta disponibilidad: La partición de administración deberá incorporar hardware y software que permitan la configuración en clúster HA, asegurando la continuidad del servicio incluso ante la pérdida de uno o dos nodos. Las cargas de trabajo de cómputo, visualización o acceso deberán mantenerse sin interrupciones significativas durante los fallos. Cualquier posible impacto en rendimiento | MQR |
| HPCINT_152 | deberá documentarse en la oferta. Comprobaciones de estado y coherencia: El adjudicatario deberá proporcionar herramientas que permitan verificar el estado y coherencia de todos los componentes hardware y software, integrables con el gestor de cargas de trabajo (WLM), para garantizar que solo los componentes operativos sean utilizados. Cuando corresponda, deberán ejecutarse y registrarse acciones de recuperación automática. | MQR |
| HPCINT_153 | Actualizaciones continuas: El sistema deberá soportar mecanismos de actualización continua (rolling-update) que permitan aplicar parches de software y realizar operaciones de mantenimiento con tiempo de inactividad mínimo. En mantenimientos globales, el sistema deberá liberar progresivamente los nodos a medida que finalicen las tareas activas, evitando interrupciones no | MQR |
<!-- image -->
<!-- image -->
| | planificadas en la producción operativa. | |
|------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCINT_154 | Software de gestión del clúster: El adjudicatario deberá suministrar una solución de software integrada para la gestión del clúster, incluyendo: • Aprovisionamiento automatizado de nodos (bare-metal). • Instalación y reconfiguración del sistema operativo. • Recogida de información diagnóstica y telemetría. • Actualización de firmware de los nodos.El software deberá proporcionar gestión fuera de banda (OOB), API abiertas e integrarse con el sistema de supervisión central de AEMET | MQR |
| HPCINT_155 | Monitorización de hardware: El software de gestión deberá ofrecer supervisión dentro y fuera de banda de los eventos de hardware (registros de sistema, errores de memoria, discos o CPU). Todos los eventos deberán almacenarse en una ubicación central accesible por los sistemas corporativos de observabilidad y auditoría. | MQR |
| HPCINT_156 | Software de código abierto: Se valorará positivamente que el software de gestión del clúster esté basado en componentes de código abierto, preferentemente compatibles con la iniciativa OpenHPC, o que se integren en su ecosistema. | TQR |
<!-- image -->
<!-- image -->
| HPCINT_157 | Los nodos de administración deberán disponer de conectividad controlada hacia la red externa de AEMET para permitir descargas seguras de software, sincronización de repositorios y acceso a servicios corporativos, aplicando autenticación fuerte, firewalls de aplicación y segmentación conforme a las políticas de Telemática. | MQR |
|--------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_158 | Los nodos de administración deberán disponer de acceso directo a los sistemas de almacenamiento asociados al sistema. | MQR |
| HPCINT_159 | Los nodos de administración deberán disponer de acceso directo, autenticado y de alto rendimiento al almacenamiento HPC para la gestión de datos de entrada, salida, staging, validación, verificación y operaciones de mantenimiento. | MQR |
| HPCINT_160 | La detección de fallos críticos de hardware o red deberá producirse en < 30 s y su notificación en < 60 s. | MQR |
| HPCINT_161 | Todas las acciones de administración deberán ser auditadas, incluyendo uso de sudo, cambios de configuración, reinicios de nodos y operaciones del gestor de colas. | MQR |
| HPCINT_162 | El gestor de cargas de trabajo (WLM), basado en Slurm o equivalente, deberá estar desplegado en alta disponibilidad, garantizando la continuidad del servicio ante fallos de uno o varios nodos de administración. La solución deberá cumplir, como mínimo: Dos controladores Slurm en configuración activa/pasiva o activa/activa. Failover automático, con recuperación del servicio en < 60 s. Base de datos delWLMen configuración redundante, con | MQR |
97
<!-- image -->
<!-- image -->
| | replicación que asegure ausencia de pérdida de datos. Reanudación automática de operaciones del planificador tras el failover, sin pérdida de trabajos en cola ni información de estado. Validación del modo HA mediante pruebas aportadas por el licitador. | | | |
|------------------------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|------------------------------|------------------------------|------------------------------|
| HPCINT_163 | La partición de administración y sus servicios asociados deberán implementar mecanismos reforzados de seguridad para garantizar la integridad, confidencialidad y autenticación robusta del sistema. Como mínimo, deberán cumplirse los siguientes requisitos: Autenticación multifactor (MFA) para el acceso administrativo a nodos, consolas y servicios de gestión del clúster. Hardening de BMC/IPMI/Redfish, aplicando políticas de seguridad verificables: desactivación de protocolos inseguros, contraseñas robustas, firmware actualizado y restricciones de acceso por red. Cifrado de logs y registros | MQR | | |
| Requisitos apartado 2.2.11.1 | Requisitos apartado 2.2.11.1 | Requisitos apartado 2.2.11.1 | Requisitos apartado 2.2.11.1 | Requisitos apartado 2.2.11.1 |
<!-- image -->
<!-- image -->
| Requisito | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
|-------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------------|------------------|-----------------------------------------|
| HPCINT_164 | Número de nodos de loginDeberán proporcionarse al menos 4 nodos de login dedicados al acceso de los usuarios al sistema de supercomputación del CPD de AEMET. Estos nodos constituirán la puerta de entrada al entorno de ejecución, compilación y gestión de trabajos, garantizando alta disponibilidad y tolerancia a fallos. | MQR | | |
| HPCINT_165 | Requisitos comunes de los nodos Deberá cumplir el requisito HPCINT_098 comunes a todos los nodos. | MQR | | |
| HPCINT_166 | Configuración de nodosCada nodo de login deberá incluir 2 CPU basadas en arquitectura x86-64 de última generación o equivalente, preferiblemente de la misma familia tecnológica que los nodos de cómputo del sistema, con al menos 64 núcleos por CPU, optimizados para tareas de compilación y ejecución interactiva. | MQR | | |
| HPCINT_167 | Configuración de la memoriaLos nodos de login deberán disponer de un mínimo de 512 GB de memoria DDR5 o superior, garantizando el uso simultáneo por múltiples usuarios y la ejecución eficiente de procesos intensivos de pre y postprocesamiento. | MQR | | |
<!-- image -->
<!-- image -->
| HPCINT_168 | Requisitos de redTodos los nodos de login deberán estar equipados con: • 1 NIC con 2 puertos conectados a la red Fabric de baja latencia con al menos 200 Gb/s por puerto (400 Gb/s agregados). Los puertos deberán conectarse a switches distintos. • 1 NIC con 2 puertos Ethernet conectada a la red troncal del CPD de AEMET, con al menos 100 Gb/s por puerto (200 Gb/s agregados), asegurando redundancia física. • 1 NIC con 2 puertos Ethernet conectada a la red de gestión (MNG-IB) a 25 Gb/s, con soporte PXE y arranque remoto. Los puertos deberán estar conectados a diferentes switches. • 1 NIC con 1 puerto Ethernet 1 GbE dedicada al BMC, conectada a la red OOB del CPD de AEMET. | MQR |
|--------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_169 | Almacenamiento local: Cada nodo de login deberá disponer de 2 unidades SSD o tecnología equivalente en configuración RAID 1, con al menos 4 TB de capacidad neta para sistema operativo, bibliotecas y software de usuario. | MQR |
| HPCINT_170 | Instalación de software: Los nodos de login deberán permitir la instalación de todas las aplicaciones, librerías y entornos de usuario utilizados en el sistema de producción, incluyendo compiladores, frameworks de análisis y herramientas de gestión de datos. Se deberá asegurar la compatibilidad y homogeneidad del entorno software con los nodos de cómputo, para garantizar portabilidad y reproducibilidad de las cargas de trabajo. | MQR |
<!-- image -->
<!-- image -->
| HPCINT_171 | Acceso al almacenamiento HPC: Los nodos de login deberán disponer de acceso directo y de alto rendimiento al sistema de almacenamiento global del clúster, permitiendo a los usuarios realizar operaciones de lectura/escritura, análisis y postprocesamiento. La conectividad deberá estar segmentada para evitar interferencias con las operaciones internas del clúster. | MQR | | |
|------------------------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|------------------------------|------------------------------|---------------------------------------|
| HPCINT_172 | Limitación y control de uso: Los nodos de login deberán incorporar mecanismos de control de recursos (cgroups u otros) que impidan que un usuario individual degrade el rendimiento del nodo mediante procesos intensivos. No se permitirá la ejecución de trabajos prolongados o de carga elevada, que deberán ser | MQR | | |
| HPCINT_173 | Segmentación y seguridad: Los nodos de login deberán estar aislados del plano de interconexión de cómputo (Fabric), salvo para funcionalidades estrictamente necesarias. Todo acceso deberá realizarse a través de redes segmentadas y protegidas, con políticas de filtrado aplicadas por Telemática. | MQR | | |
| HPCINT_174 | Alta disponibilidad de la partición de login: La partición de login deberá operar en alta disponibilidad, permitiendo que la pérdida de uno o varios nodos no afecte a la capacidad de acceso. Se valorará la disponibilidad de balanceo automático de conexiones (round- robin DNS, load-balancer TCP o equivalente). | TQR | | |
| Requisitos apartado 2.2.11.2 | Requisitos apartado 2.2.11.2 | Requisitos apartado 2.2.11.2 | Requisitos apartado 2.2.11.2 | Requisitos apartado 2.2.11.2 |
| Requisito | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
<!-- image -->
<!-- image -->
| HPCINT_175 | Número de nodos de visualización: Deberán proporcionarse al menos 8 nodos de visualización dedicados a la representación y análisis gráfico de resultados generados por los modelos de predicción meteorológica y climatológica de AEMET. Estos nodos deberán garantizar un acceso fluido y seguro para los usuarios autorizados desde la red corporativa. | MQR |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_176 | Requisitos comunes de los nodos Deberá cumplir el requisito HPCINT_098 comunes a todos los nodos. | MQR |
| HPCINT_177 | Configuración de nodosCada nodo de visualización deberá estar equipado con:• 2 CPU basadas en arquitectura x86-64 de última generación, preferiblemente la misma familia tecnológica que los nodos de cómputo, con al menos 64 núcleos por CPU.• 2 GPUs de gama alta con capacidad de aceleración 3D mediante OpenGL y CUDA/ROCm, orientadas a la renderización de productos meteorológicos y la visualización de datos científicos.• Cada GPU deberá disponer de al menos 24 GB de memoriaHBMo GDDR6, con soporte para gráficos remotos de alta resolución y codificación hardware para sesiones interactivas. | MQR |
| HPCINT_178 | Configuración de la memoriaLos nodos deberán disponer de al menos 512 GB de memoria DDR5 o superior, garantizando el rendimiento necesario para la visualización en paralelo de grandes volúmenes de datos meteorológicos, modelos numéricos y series temporales. | MQR |
<!-- image -->
<!-- image -->
| HPCINT_179 | Requisitos de redTodos los nodos de visualización deberán estar equipados con:• 1 NIC con 2 puertos conectados a la red Fabric de baja latencia con al menos 200 Gb/s por puerto (400 Gb/s agregados), conectados a distintos switches.• 1 NIC con 2 puertos Ethernet conectados a la red troncal del CPD de AEMET con al menos 100 Gb/s por puerto (200 Gb/s agregados).• 1 NIC con 2 puertos Ethernet conectada a la red de gestión (MNG-IB) a 25 Gb/s, con soporte PXE y arranque remoto.• 1 NIC con 1 puerto Ethernet 1 GbE dedicada al BMC, conectada a la red OOB del CPD de AEMET.Las conexiones deberán garantizar redundancia y disponibilidad continua. | MQR |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_180 | Almacenamiento localCada nodo deberá disponer de 2 unidades SSD en configuración RAID 1, con al menos 7 TB netos de capacidad para el sistema operativo, software de visualización y almacenamiento temporal de datos científicos. Este almacenamiento local permitirá gestionar los flujos de datos intermedios sin sobrecargar el sistema central. | MQR |
| HPCINT_181 | Software de visualización y acceso: Los nodos deberán permitir la ejecución de herramientas de análisis y visualización como ParaView, VisIt, IDV, Python- Matplotlib, JupyterLab o equivalentes, accesibles mediante sesiones remotas seguras (SSH, X2Go o RDP). | MQR |
| HPCINT_182 | Segmentación y seguridad de acceso: Los nodos de visualización deberán estar segmentados de acuerdo con la arquitectura de seguridad del CPD de AEMET, aislando el acceso de usuarios del plano de cómputo y del plano de administración. Las sesiones interactivas deberán | MQR |
<!-- image -->
<!-- image -->
| | requerir autenticación fuerte y cifrado extremo a extremo (TLS). El licitador deberá garantizar que no existe acceso directo desde estos nodos al Fabric salvo para funciones estrictamente necesarias. | | | |
|------------------------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|------------------------------|------------------------------|---------------------------------------|
| HPCINT_183 | Protocolos gráficos remotos con aceleración: Los nodos deberán soportar protocolos gráficos remotos optimizados para GPU, como NICE DCV, VirtualGL, TurboVNC o equivalentes, garantizando baja latencia y alta calidad para sesiones interactivas. El adjudicatario deberá instalar, configurar y validar estos servicios con codificación hardware en las GPUs suministradas. | MQR | | |
| HPCINT_184 | Gestión de sesiones y control de recursos: Los nodos de visualización deberán integrar mecanismos de control de recursos (cgroups, MIG, Slurm GRES u otros) para limitar el uso de CPU, GPU y memoria por usuario o sesión, evitando interferencias entre procesos interactivos y garantizando el uso equitativo de los recurso | MQR | | |
| HPCINT_185 | Compatibilidad CUDA/ROCm + librerías científicas: El software deberá incluir stack de librerías optimizadas en GPU (cuDNN, cuBLAS, OpenGL, Mesa, Vulkan u otras), compatibles con las herramientas meteorológicas empleadas por AEMET. | MQR | | |
| Requisitos apartado 2.2.12.6 | Requisitos apartado 2.2.12.6 | Requisitos apartado 2.2.12.6 | Requisitos apartado 2.2.12.6 | Requisitos apartado 2.2.12.6 |
| Requisito | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
<!-- image -->
<!-- image -->
| HPCINT_186 | Disponibilidad La infraestructura de almacenamiento deberá estar configurada para garantizar la continuidad operativa ante el fallo de cualquiera de sus componentes (discos, controladoras, nodos o switches de red). El sistema deberá incorporar mecanismos de redundancia, replicación y recuperación automática, asegurando la integridad de los datos operativos y climatológicos almacenados. | MQR |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_187 | Interoperabilidad y jerarquía de datos El almacenamiento deberá comportarse como una unidad lógica única, implementando mecanismos automáticos de gestión y movimiento de datos entre las distintas capas de rendimiento (Hot Tier y Cold Tier). Estos mecanismos deberán ser configurables y transparentes para los usuarios, optimizando la relación coste-rendimiento y el uso de los recursos en función de la frecuencia de acceso. | MQR |
| HPCINT_188 | Protocolos El sistema deberá ofrecer compatibilidad con los protocolos POSIX, NFS y S3, garantizando la interoperabilidad con el entorno corporativo de AEMET y los sistemas cloud externos, así como con herramientas de visualización, análisis y automatización ya implantadas. | MQR |
| HPCINT_189 | Requisitos de red Todos los nodos del sistema de almacenamiento deberán estar equipados con: • 2 puertos de alta velocidad (≥200 Gb/s) conectados a la red Fabric o, en su caso, a una red de almacenamiento dedicada, garantizando redundancia física mediante conexión a switches diferentes. • 1 NIC con 2 puertos Ethernet conectada a la red de gestión (MNG-IB) de AEMET a 25 Gb/s, con soporte PXE y arranque | MQR |
<!-- image -->
<!-- image -->
| | remoto. • 1 NIC con 1 puerto Ethernet 1 GbE dedicada al BMC, conectada a la red OOB del CPD de AEMET. El diseño deberá asegurar redundancia y disponibilidad 24x7. | |
|------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCINT_190 | Acceso y montaje El sistema de ficheros de la partición de almacenamiento deberá poder montarse de forma nativa en todos los nodos del sistema, incluyendo las particiones de cómputo, administración, login y visualización, garantizando consistencia y coherencia de datos. | MQR |
| HPCINT_191 | Funcionalidades avanzadas El sistema de almacenamiento deberá ofrecer las siguientes capacidades: • Distribución equilibrada de datos y metadatos entre todos los nodos y controladoras. • Arquitectura modular y escalable, permitiendo ampliaciones de capacidad o rendimiento sin interrupción del servicio. • Soporte de snapshots en caliente (mínimo 1.000 por sistema de ficheros). • Capacidad de almacenar más de 40.000 millones de ficheros. • Gestión avanzada de cuotas (por inodo, bloque, usuario, grupo o filesystem). • Mecanismos de calidad de servicio (QoS) configurables para priorizar cargas críticas operativas (por ejemplo, predicción o generación de avisos). • Capacidad de actualización en caliente sin pérdida de servicio, mediante rolling updates. • Cifrado de datos en reposo y en tránsito. | MQR |
<!-- image -->
<!-- image -->
| HPCINT_192 | Red de almacenamiento dedicada Se valorará la incorporación de una red físicamente separada para el tráfico de almacenamiento entre los nodos del sistema y la infraestructura de datos, con capacidad suficiente (≥400 Gb/s agregados) y prestaciones que garanticen los niveles de rendimiento requeridos. Esta red podrá integrarse con los Data Movers (DTN) encargados de la transferencia de grandes volúmenes de datos hacia sistemas internacionales (ECMWF, Copernicus, etc.) e infraestructura de nube externa. | TQR |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_193 | Integración con la interconexión entre CPDs El sistema de almacenamiento deberá permitir la transferencia eficiente y segura de datos entre el CPD de AEMET y el CPD externo, aprovechando la infraestructura de interconexión extremo-a-extremo instalada por el adjudicatario. Deberá garantizar compatibilidad con los Data Movers (DTN), soportar transferencia paralela multicanal, autenticación corporativa y cifrado en tránsito. La topología, direccionamiento y niveles de servicio de esta interconexión serán definidos durante la fase de implantación en coordinación con la Unidad de Coordinación de Telemática. | MQR |
| HPCINT_194 | Capacidad: El sistema deberá disponer de una capacidad neta y usable mínima de 2 PB, dedicada al almacenamiento de los datos activos asociados a la ejecución operativa de modelos numéricos, análisis meteorológicos, climatología operativa y procesos de asimilación. Esta capacidad deberá ser expandible sin interrupción del servicio y con posibilidad de integración con el nivel Cold Tier. | MQR |
<!-- image -->
<!-- image -->
| HPCINT_195 | Rendimiento El sistema de almacenamiento deberá proporcionar un rendimiento agregado equivalente, al menos, a: • 2 GB/s por nodo de cómputo en lectura. • 1,6 GB/s por nodo de cómputo en escritura. El rendimiento deberá demostrarse mediante la ejecución del benchmark IOR en condiciones equivalentes a las de operación real. En ningún el rendimiento agregado deberá ser inferior a 300 GB/s en lectura y 250 GB/s en escritura para la totalidad de los nodos de cómputo. Asimismo, deberá soportar al menos 20.000 operaciones de E/S por nodo de cómputo para ficheros de tamaño 4K, demostrables mediante benchmark IOZONE. La infraestructura deberá mantener un rendimiento sostenido durante la ejecución simultánea de trabajos de predicción y climatología, garantizando latencias reducidas incluso en entornos de concurrencia elevada. | MQR |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_196 | Mejora de capacidad y rendimiento: Se valorará la provisión de una infraestructura que exceda las especificaciones mínimas en términos de capacidad, rendimiento sostenido o eficiencia energética, especialmente si contribuye a mejorar los tiempos de ciclo de predicción, el acceso a datos climatológicos o la interoperabilidad con las plataformas multicloud. | TRQ |
| HPCINT_197 | Capacidad: El sistema de almacenamiento del Cold Tier deberá disponer de una capacidad neta y usable mínima de 10 PB, dedicada al almacenamiento de datos a largo plazo, incluyendo resultados de simulaciones meteorológicas y climatológicas y productos derivados. Deberá ser | MQR |
<!-- image -->
<!-- image -->
| | ampliable y modular, garantizando la continuidad del servicio durante las expansiones de capacidad y el mantenimiento evolutivo. | |
|------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCINT_198 | Rendimiento El sistema de almacenamiento del Cold Tier deberá proporcionar un rendimiento agregado equivalente, al menos, al 25 %del rendimiento ofrecido por el Hot Tier, demostrable mediante los benchmarks IOR e IOZONE. Deberá garantizar un acceso eficiente para procesos de recuperación de datos, verificación de productos, generación de indicadores climáticos y transferencia hacia sistemas externos (RAICES, | MQR |
| HPCINT_199 | ECMWF, Copernicus, etc.). Mejora de capacidad y rendimiento Se valorará positivamente la provisión de una infraestructura que exceda las especificaciones mínimas en capacidad o rendimiento, especialmente si mejora la eficiencia energética, la redundancia geográfica o la integración nativa con servicios cloud o con la infraestructura de respaldo del CPD externo. | TQR |
| HPCINT_200 | Número de nodos: La partición de Data Movers deberá estar compuesta por al menos dos nodos dedicados, garantizando alta disponibilidad y redundancia en las operaciones de transferencia de datos entre el almacenamiento principal, el CPD externo y los sistemas internacionales de intercambio (p. ej. ECMWF, Copernicus o WMO). | MQR |
| HPCINT_201 | Requisitos comunes de los nodos Los nodos deberán cumplir las funcionalidades establecidas en el requisito HPCINT_098. | MQR |
<!-- image -->
<!-- image -->
| HPCINT_202 | Configuración de los nodos Cada nodo deberá estar configurado con al menos dos procesadores basados en arquitectura x86-64 de última generación, optimizados para operaciones intensivas de transferencia y cifrado de datos. | MQR |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCINT_203 | Configuración de memoria Los nodos de Data Movers deberán disponer de al menos 512 GB de memoria DDR5 (o LPDDR5), permitiendo gestionar múltiples flujos de transferencia concurrentes, procesos de checksum, validación y compresión | MQR |
| HPCINT_204 | sin afectar al rendimiento global. Requisitos de red Los nodos de Data Movers deberán estar equipados con: • 1 NIC con 2 puertos conectados a la red Fabric o, en su caso, a la red de almacenamiento dedicada, con al menos 200 Gb/s por puerto (400 Gb/s agregados), conectados a switches diferentes. • 1 NIC con 2 puertos Ethernet conectada a la red troncal del CPD de AEMET, con al menos 100 Gb/s por puerto (200 Gb/s agregados), garantizando redundancia y acceso a los canales de intercambio externos . • 1 NIC con 2 puertos Ethernet conectada a la red de gestión (MNG-IB) a 25 Gb/s, con soporte PXE y arranque remoto por Ethernet, conectada a switches diferentes. • 1 NIC con 1 puerto Ethernet 1 GbE dedicada al BMC, conectada a la red OOB del CPD de AEMET. Las configuraciones de red deberán garantizar resiliencia y continuidad operativa ante la caída de un enlace o dispositivo. | MQR |
| HPCINT_205 | Almacenamiento local Cada nodo de Data Movers deberá disponer de 2 unidades SSD en configuración RAID 1, con al menos 2 TB netos de capacidad, dedicados al sistema operativo y a almacenamiento temporal de ficheros intermedios | MQR |
<!-- image -->
<!-- image -->
| | durante los procesos de transferencia y validación de datos. | |
|------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCINT_206 | Protocolos y funcionalidades Los Data Movers deberán soportar protocolos estándar de transferencia de datos de alta velocidad y seguridad, como GridFTP, HTTPS, S3, SCP, Rsync o Aspera FASP, así como mecanismos de integridad (checksum SHA-256), cifrado TLS 1.3 y registro de auditoría centralizado. Deberán poder integrarse con el entorno DataLake y multicloud, y con el entorno de monitorización y trazabilidad de AEMET (DynaTrace). | MQR |
| HPCINT_207 | Gestión jerárquica y archivo: El sistema de almacenamiento deberá incorporar funcionalidades de gestión jerárquica de almacenamiento (HSM), permitiendo el archivado automático de datos desde el nivel Hot Tier al nivel Cold Tier y/o a niveles adicionales (cinta u objeto), así como la recuperación selectiva de datos archivados (recall) de forma transparente para las aplicaciones o mediante APIs y CLI documentadas. La gestión jerárquica deberá integrarse con los mecanismos de replicación entre CPDs, de forma que los datos archivados y críticos queden disponibles en ambos emplazamientos. | MQR |
| HPCINT_208 | Soporte a continuidad operativa: El diseño del subsistema de almacenamiento multicapa y de los mecanismos de replicación entre CPDs deberá permitir que, en caso de indisponibilidad del sistema HPC principal, los datos estáticos, climatológicos y de referencia necesarios para la ejecución de las cadenas operativas puedan ser | MQR |
restaurados y utilizados en el sistema HPC del CPD externo, de acuerdo con los objetivos de RPO/RTO que se definan en el Plan de Continuidad de Servicio.
## Requisitos apartado 2.3.1.1
| Requisito | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
|-------------|----------------------------------------------------------------------------------------------------------------------------------------------------------|-------------|------------------|-----------------------------------------|
| HPCEXT_001 | El CPD externo deberá disponer de certificación Tier III o equivalente, garantizando mantenimiento concurrente sin interrupción del servicio. | MRQ | | |
| HPCEXT_002 | Disponibilidad de racks de alta densidad de 42U o superiores, con capacidad mínima de carga de 1.200 kg por rack. | MRQ | | |
| HPCEXT_003 | Capacidad para suministrar entre 40 y 60 kWpor rack, ampliable según necesidades del clúster HPC/IA con capacidad demostrable mediante pruebas de carga. | MRQ | | |
| HPCEXT_004 | Disponibilidad de PDUs redundantes A/B monitorizables y gestionables remotamente. | MRQ | | |
| HPCEXT_005 | Doble acometida eléctrica independiente, con SAI en configuración 2(N+1) y generadores con autonomía mínima de 48 horas. | MRQ | | |
| HPCEXT_006 | Sistema de monitorización eléctrica por fase, línea y rack, exportable a los sistemas de supervisión de AEMET. | MRQ | | |
| HPCEXT_007 | Sistema de refrigeración N+1 o superior, compatible con tecnologías de refrigeración líquida (DLC) y pasillos frío/caliente. | MRQ | | |
| HPCEXT_008 | Cumplimiento de normas ASHRAE A1/A2, sensores ambientales y alarmas en tiempo real. | MRQ | | |
| HPCEXT_009 | Seguridad física avanzada: control de acceso biométrico, CCTV 24/7, registro de accesos y vigilancia permanente. | MRQ | | |
112
<!-- image -->
<!-- image -->
<!-- image -->
| HPCEXT_010 | Sistema de detección temprana VESDA y extinción mediante gases inertes (IG-541, NOVEC u otros equivalentes). | MRQ |
|--------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_011 | Disponibilidad de certificaciones ISO 27001, ISO 22301. | MQR |
| HPCEXT_012 | CPD Carrier Neutral con múltiples carriers disponibles y salasMMR redundantes. | MRQ |
| HPCEXT_013 | Entrada de fibra diversificada mediante caminos físicos A/B. El licitado debera presentar pruebas documentadas de rutas físicas independientes | MRQ |
| HPCEXT_014 | El CPD externo deberá permitir la instalación, operación y mantenimiento de la infraestructura de interconexión extremo-a-extremo contratada por AEMET, incluyendo equipos propios de red (routers, switches, DWDMsi aplica), fibras dedicadas y circuitos L2/L3 proporcionados por el adjudicatario. Deberá garantizar acceso a salas MMRredundantes, rutas físicas diversas A/B y capacidad para escalar el ancho de banda según requerimientos del clúster HPC/IA y de los Data Movers. | MRQ |
| HPCEXT_015 | Disponibilidad de múltiples fibras internas hacia los racks del clúster, ampliables para futuras expansiones. | MRQ |
| HPCEXT_016 | Soporte para red Fabric de alta velocidad (InfiniBand NDR o Ethernet equivalente ≥400 Gbps). | MRQ |
| HPCEXT_017 | Disponibilidad de red de gestión segmentada en gestión en banda y fuera de banda (OOB/BMC). | MRQ |
| HPCEXT_018 | Posibilidad de red dedicada de almacenamiento (InfiniBand NDR o Ethernet equivalente ≥400 Gbps) separada de Fabric. | TQR |
| HPCEXT_019 | Cableado estructurado con fibra OM4/OS2 y cobre CAT6A, debidamente etiquetado y documentado. | MRQ |
| HPCEXT_020 | Separación física de canalizaciones para potencia, fibra y cobre. | MRQ |
113
<!-- image -->
<!-- image -->
| HPCEXT_021 | Disponibilidad de espacio, potencia y fibra para ampliaciones sin afectar al servicio. | MRQ |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_022 | Monitorización 24/7 ambiental, eléctrica, de seguridad y de infraestructura. | MRQ |
| HPCEXT_023 | Soporte 24/7 con SLA adecuados a la criticidad del clúster HPC/IA de AEMET. | MRQ |
| HPCEXT_024 | El CPD deberá disponer de un Plan de Continuidad y Recuperación ante Desastres aplicable a los | MRQ |
| HPCEXT_025 | servicios alojados. Ubicación geográfica y mitigación del riesgo: El CPD externo deberá estar ubicado a una distancia geográfica suficiente del CPD principal de AEMET para garantizar la continuidad de las operaciones ante eventos que afecten a un área local o regional (fallo eléctrico generalizado, inundaciones, incendios, seísmos u otros riesgos). La ubicación deberá situarse preferiblemente en una zona con riesgo sísmico bajo o moderado, fuera de áreas inundables y con acceso garantizado mediante infraestructuras críticas (carreteras, energía, comunicaciones). El adjudicatario deberá aportar un informe de riesgos del emplazamiento, incluyendo clasificación oficial del terreno y análisis de continuidad. | MRQ |
| HPCEXT_026 | Cumplimiento normativo: Normativas CCN-STIC: Los servicios prestados al clúster HPC/IA de AEMET en el CPD externo deberán cumplir las Normativas CCN-STIC aplicables a los sistemas de información que soportan servicios operativos meteorológicos y climatológicos. Asimismo, el CPD deberá disponer de procedimientos y controles compatibles con las guías CCN-STIC aplicables a infraestructuras críticas, incluyendo gestión de | MRQ |
114
<!-- image -->
<!-- image -->
| | incidentes, trazabilidad, registro y control de accesos, endurecimiento de sistemas y comunicaciones seguras. El adjudicatario deberá facilitar evidencias documentales del nivel de cumplimiento. |
|------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| HPCEXT_027 | Entrega de documentación técnica completa: El adjudicatario deberá proporcionar, antes de la puesta en servicio, toda la documentación técnica necesaria para la operación y auditoría del entorno, incluyendo como mínimo: Planos eléctricos unifilares (one- line) del CPD. Esquema de distribución de potencia a nivel de sala, fila y rack. Topología de red física y lógica, incluyendo rutas de fibra y canalizaciones A/B. Esquema térmico y de refrigeración (CFD o equivalente). Planos del MMRyprocedimientos de acceso. Inventario completo de puertos, fibras, PDUs y barras de potencia asignadas a AEMET. La documentación deberá mantenerse actualizada ante |
<!-- image -->
<!-- image -->
| HPCEXT_028 | Pruebas de aceptación (ATP) previas a la operación: Antes de la aceptación del CPD externo y del inicio de la operación del clúster HPC/IA, el adjudicatario deberá ejecutar un conjunto de pruebas de aceptación (ATP) que acrediten la capacidad de la instalación para soportar las cargas previstas. Las ATP incluirán, como mínimo: Pruebas de carga eléctrica sostenida hasta el 80% del consumo contratado. Pruebas de refrigeración con cargas térmicas equivalentes a 40- 60kW por rack. Pruebas de conmutación eléctrica entre acometidas A/B y actuación del SAI y generadores. Pruebas de diversificación efectiva de rutas de fibra (A/B). Pruebas de monitorización y alarmas en tiempo real. El CPD no será considerado apto hasta superar satisfactoriamente todas las pruebas, | MRQ | | |
|-----------------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----------------------------|-----------------------------|---------------------------------------|
| Requisitos apartado 2.3.1.2 | Requisitos apartado 2.3.1.2 | Requisitos apartado 2.3.1.2 | Requisitos apartado 2.3.1.2 | Requisitos apartado 2.3.1.2 |
| Requisito | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| HPCEXT_029 | El CPD deberá disponer de doble acometida eléctrica independiente, preferiblemente desde centros de transformación distintos. | MRQ | | |
| HPCEXT_030 | La infraestructura eléctrica deberá estar configurada en esquema N+1 o superior, garantizando continuidad ante fallos. | MRQ | | |
<!-- image -->
<!-- image -->
| HPCEXT_031 | El CPD deberá contar con un sistema SAI/UPS online de doble conversión con autonomía suficiente para soportar el clúster durante la conmutación a grupo electrógeno. | MRQ |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_032 | Disponibilidad de grupos electrógenos redundados capaces de mantener operación continuada en caso de interrupciones prolongadas. Asegurarán un mínimo de autonomía de 48 horas. | MRQ |
| HPCEXT_033 | Cada rack del clúster deberá disponer de dos líneas de alimentación independientes A/B plenamente monitorizables. | MRQ |
| HPCEXT_034 | Los racks deberán estar equipados con PDUs inteligentes que permitan monitorizar consumo, umbrales, alarmas y control remoto. Compatibilidad con SNMPv3 / API REST | MRQ |
| HPCEXT_035 | La capacidad eléctrica por rack deberá estar dimensionada para cargas de alta densidad del clúster HPC/IA, permitiendo crecimiento futuro. | MRQ |
| HPCEXT_036 | Las canalizaciones eléctricas deberán estar separadas físicamente de las de comunicaciones, evitando interferencias y riesgos. | MRQ |
| HPCEXT_037 | Sistema de monitorización eléctrica centralizada, con capacidades de exportación de métricas hacia los sistemas de AEMET. Deberá ser accesible vía SNMPv3 o API segura | MRQ |
| HPCEXT_038 | El sistema deberá registrar consumos, eventos eléctricos, alarmas y datos históricos para auditoría y diagnóstico. | TRQ |
| HPCEXT_039 | Todo el cableado, cuadros, PDUs y líneas A/B deberán estar etiquetados, documentados y actualizados conforme a estándares de CPD crítico. | MRQ |
| HPCEXT_040 | La instalación eléctrica deberá cumplir con REBT, ITC-BT y normativa UNE aplicable a instalaciones críticas. | MRQ |
<!-- image -->
<!-- image -->
| HPCEXT_041 | El diseño eléctrico deberá permitir ampliación de potencia sin interrupción del servicio del clúster. | TRQ | | |
|-----------------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----------------------------|-----------------------------|---------------------------------------|
| HPCEXT_042 | El sistema eléctrico deberá permitir monitorizar calidad de suministro: armónicos, fluctuaciones, factor de potencia, etc. | TRQ | | |
| HPCEXT_043 | Toda la instalación deberá contar con protecciones contra sobretensiones, cortocircuitos y fallos de tierra conforme normativa. | MRQ | | |
| Requisitos apartado 2.3.1.3 | Requisitos apartado 2.3.1.3 | Requisitos apartado 2.3.1.3 | Requisitos apartado 2.3.1.3 | Requisitos apartado 2.3.1.3 |
| Requisito | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| HPCEXT_044 | El CPD externo deberá disponer de un sistema de refrigeración diseñado para alta densidad compatible con cargas HPC/IA. El CPD deberá soportar densidades térmicas mínimas de al menos 40 kW por rack, ampliables a 60-80 kW según crecimiento del clúster | MRQ | | |
| HPCEXT_045 | Los licitadores deben proporcionar todas las alternativas de refrigeración disponibles para el sistema HPC: Refrigeración por aire, por agua, total o parcial Incluyendo una evaluación de ventajas y desventajas de cada solución. | INFO | | |
| HPCEXT_046 | Si el sistema es predominantemente refrigerado por aire, los licitadores deben:Asegurar que el CPD puede proporcionar la refrigeración adecuada. Explicar cómo se logra sin perjudicar a otros equipos de la sala. Indicar si se requiere ventilación forzada externa, que no debe reducir la capacidad de instalación del CPD. | INFO | | |
<!-- image -->
<!-- image -->
| HPCEXT_047 | La oferta debe detallar los requerimientos de refrigeración del equipamiento a instalar, incluyendo: Consumo eléctrico asociado. Necesidad de ventilación forzada. Impacto en instalaciones existentes. | INFO |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|--------|
| HPCEXT_048 | La climatización deberá operar en esquema redundado N+1 o superior para garantizar continuidad del servicio. | MRQ |
| HPCEXT_049 | El CPD deberá garantizar capacidad de disipación suficiente para soportar la carga térmica máxima del clúster en funcionamiento nominal y degradado. El diseño del CPD deberá soportar una carga térmica inicial estimada de 40 kW, ampliable sin rediseño estructural. | MRQ |
| HPCEXT_050 | La solución deberá disponer de sistemas de contención de pasillos fríos y/o calientes para mejorar eficiencia energética y estabilidad térmica. | MRQ |
| HPCEXT_051 | El CPD deberá mantener temperatura y humedad dentro de los rangos requeridos por los fabricantes del hardware HPC/IA. La climatización cumplirá ASHRAE TC9.9 2023 para equipos Clase A1. | MRQ |
| HPCEXT_052 | Se deberá disponer de monitorización ambiental avanzada (temperatura, humedad, flujo de aire, alertas), integrada o integrable con los sistemas de AEMET. | MRQ |
| HPCEXT_053 | Los racks asignados al clúster deberán contar con sondas térmicas distribuidas en varias alturas y posiciones. | MRQ |
| HPCEXT_054 | La infraestructura deberá permitir, en caso necesario, la instalación de refrigeración líquida directa (DLC). El CPD deberá ser compatible con soluciones DLC direct-to-chip, rear- door heat exchangers (RDHx) o equivalentes. | TRQ |
<!-- image -->
<!-- image -->
| HPCEXT_055 | El CPD deberá contar con sistemas de registro histórico de parámetros ambientales y eventos críticos. | TRQ |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_056 | Los equipos de refrigeración deberán ser mantenibles sin interrupción del servicio, facilitando intercambios en caliente o bypasses operativos. | MRQ |
| HPCEXT_057 | El diseño de refrigeración deberá permitir ampliación futura de capacidad sin reubicar componentes del clúster. | TRQ |
| HPCEXT_058 | Los sistemas deberán contar con alarmas configurables para eventos de temperatura, humedad o caudal, con notificación automática. Las alarmas deberán generar notificaciones automáticas en tiempo real y permitir su integración con los sistemas de supervisión corporativos de AEMET. El sistema deberá registrar cada evento con sello de tiempo y conservar un histórico accesible para auditoría y diagnóstico. | MRQ |
<!-- image -->
<!-- image -->
| HPCEXT_059 | MRQ |
|--------------|-------|
<!-- image -->
<!-- image -->
| | deberá acreditar que dispone de medios para evitar rampas rápidas que puedan producir daños o degradación prematura del hardware. Procedimiento de evacuación térmica, incluyendo coordinación con sistemas de contención de pasillos, apertura controlada de flujos de aire y activación de modos de emergencia de climatización. Restauración de servicio post- incidente, describiendo los pasos para el retorno a operación estable, verificación de equipos y análisis de causas. Toda esta información deberá estar disponible para AEMET y validada durante la puesta en servicio. | | | |
|-----------------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----------------------------|-----------------------------|---------------------------------------|
| Requisitos apartado 2.3.1.4 | Requisitos apartado 2.3.1.4 | Requisitos apartado 2.3.1.4 | Requisitos apartado 2.3.1.4 | Requisitos apartado 2.3.1.4 |
| Requisito | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| HPCEXT_060 | El CPD externo deberá disponer de una arquitectura modular y ampliable, apta para soportar crecimiento futuro del clúster HPC/IA. | MRQ | | |
| HPCEXT_061 | El CPD deberá contar con salas técnicas independientes para TI, comunicaciones, electricidad y climatización, evitando interferencias operativas. | MRQ | | |
| HPCEXT_062 | Deberá existir separación física entre áreas críticas para garantizar seguridad y continuidad del servicio. | MRQ | | |
<!-- image -->
<!-- image -->
| HPCEXT_063 | La arquitectura del CPD deberá garantizar redundancia completa en todas las rutas de energía, refrigeración y comunicaciones, disponiendo de trayectorias físicamente diversas (diversity A/B) que permitan mantener el servicio ante fallos simultáneos en cualquiera de los caminos. Las rutas deberán ser independientes desde su origen hasta el acceso a la sala del clúster, evitando puntos únicos de fallo compartido. | MRQ |
|--------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_064 | El diseño del CPD deberá minimizar los puntos únicos de fallo en todos los subsistemas críticos (energía, climatización, comunicaciones, seguridad y distribución interna), garantizando que cualquier incidencia en un componente, ruta o dispositivo no implique interrupción del servicio del clúster HPC/IA. La infraestructura deberá estar diseñada para soportar mantenimiento en carga y operaciones de sustitución en caliente sin afectar a la disponibilidad del sistema. | MRQ |
| HPCEXT_065 | El CPD deberá cumplir estándares equivalentes o superiores a un Tier III (mantenimiento concurrente). | MRQ |
| HPCEXT_066 | La protección contra incendios deberá basarse en sistemas de agente limpio y detección temprana tipo VESDA o equivalente. | MRQ |
| HPCEXT_067 | El espacio destinado al clúster deberá garantizar accesibilidad segura para operación y mantenimiento incluyendo acceso frontal y posterior completo a racks y pasillos. | MRQ |
| HPCEXT_068 | El CPD deberá disponer de canalizaciones adecuadas, incluyendo bandejas aéreas y sistemas de distribución bajo suelo técnico, así como bandejas laterales y verticales en racks, que permitan el despliegue ordenado del cableado de potencia y | MRQ |
<!-- image -->
<!-- image -->
| | comunicaciones del clúster HPC/IA. Las infraestructuras deberán estar dimensionadas para el crecimiento futuro del sistema, soportar densidades elevadas de fibra y cobre, y permitir intervenciones sin afectar al servicio. | | | |
|-----------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----------------------------|-----------------------------|---------------------------------------|
| HPCEXT_069 | La instalación deberá permitir trazabilidad, organización y etiquetado de cableado conforme a las prácticas del sector. | TRQ | | |
| HPCEXT_070 | El CPD externo deberá disponer de rutas de fibra óptica redundantes y físicamente independientes (A/B) desde el exterior del edificio hasta las salas técnicas donde se ubiquen los equipos del clúster HPC/IA. Las rutas deberán seguir canalizaciones separadas, sin puntos de convergencia comunes, y estar certificadas para soportar servicios de transporte L2 y L3 de alta capacidad. La solución deberá garantizar | MRQ | | |
| HPCEXT_071 | Los procedimientos de operación, mantenimiento y contingencia del CPD deberán estar documentados y disponibles para integración con AEMET. | MRQ | | |
| HPCEXT_072 | El CPD deberá proporcionar mecanismos de control ambiental, seguridad y acceso físico compatibles con las políticas de AEMET. | MRQ | | |
| HPCEXT_073 | Se valorará la disponibilidad de certificaciones ISO relevantes (ISO 27001, ISO 20000, ISO 50001, etc.). | TRQ | | |
| Requisitos apartado 2.3.1.5 | Requisitos apartado 2.3.1.5 | Requisitos apartado 2.3.1.5 | Requisitos apartado 2.3.1.5 | Requisitos apartado 2.3.1.5 |
| Requisito | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| HPCEXT_074 | El CPD externo debe replicar las redes funcionales del clúster del | MRQ | | |
124
<!-- image -->
<!-- image -->
| | CPD de AEMET: Fabric, gestión IB, gestión OOB y red de almacenamiento (si aplica). | |
|------------|--------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCEXT_075 | La red Fabric del CPD externo deberá proporcionar baja latencia y alto ancho de banda, cumpliendo los requisitos HPC-IA del sistema. | MRQ |
| HPCEXT_076 | La red de gestión deberá estar segmentada en OOB e IB, físicamente separadas entre sí y de la red Fabric. | MRQ |
| HPCEXT_077 | La conectividad del CPD externo deberá permitir integración mediante IX-CPDs, garantizando continuidad operativa entre clústeres. | MRQ |
| HPCEXT_078 | El CPD externo deberá disponer de al menos dos rutas de fibra óptica independientes para redundancia de comunicaciones. | MRQ |
| HPCEXT_079 | El adjudicatario deberá proporcionar todos los elementos de cableado y canalización internos necesarios para el despliegue del clúster. | MRQ |
| HPCEXT_080 | Todo el cableado deberá estar etiquetado en ambos extremos, seguir estándares industriales y cumplir las prácticas de Telemática de AEMET. | MRQ |
| HPCEXT_081 | El sistema deberá disponer de dos switches redundantes para la interconexión con el backbone del CPD externo, con puertos ≥ 100 Gbps. | MRQ |
| HPCEXT_082 | La conectividad interna del CPD externo no deberá presentar puntos únicos de fallo en enlaces críticos. | MRQ |
| HPCEXT_083 | Se valorará la existencia de una red dedicada de almacenamiento físicamente separada de Fabric y de gestión. | TRQ |
| HPCEXT_084 | El diseño de red deberá permitir escalabilidad futura sin reestructuración completa del cableado. | TRQ |
| HPCEXT_085 | El CPD externo deberá entregar esquemas de red, | MRQ |
<!-- image -->
<!-- image -->
| | direccionamiento y topologías antes del despliegue. | | | |
|-------------------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------------------------------|-------------------------------|---------------------------------------|
| HPCEXT_086 | El sistema deberá garantizar soporte para mecanismos de seguridad: autenticación fuerte, auditoría y cifrado en las redes del clúster. | MRQ | | |
| HPCEXT_087 | Se valorará que el CPD externo disponga de certificaciones ISO 27001 o equivalentes en su infraestructura de comunicaciones. | TRQ | | |
| Requisitos apartado 2.3.1.6.3 | Requisitos apartado 2.3.1.6.3 | Requisitos apartado 2.3.1.6.3 | Requisitos apartado 2.3.1.6.3 | Requisitos apartado 2.3.1.6.3 |
| Requisito | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| HPCEXT_088 | Plataforma integrada: La infraestructura del CPD externo deberá constituir una plataforma integrada y completamente operativa, incluyendo todo el hardware, software, redes, energía y refrigeración necesarios para operar de manera interoperable con el clúster del CPD de AEMET, mediante planificación coordinada, replicación asíncrona de datos y entornos software homogéneos, sin requerir ejecución simultánea de trabajos distribuidos entre centros. | MRQ | | |
| HPCEXT_089 | Tiempo de reinicio: Cada partición funcional (CPU, GPU, acceso, administración, E/S) del clúster externo deberá poder reiniciarse completamente en menos de 60 minutos, asegurando rápida recuperación ante contingencias. | MRQ | | |
| HPCEXT_090 | Características comunes de los nodos: Se exigirá el cumplimiento de los requisitos HPCINT_098 | MRQ | | |
| HPCEXT_091 | Supervisión y gestión: El sistema deberá permitir monitorización integral mediante APIs abiertas (REST, Redfish, SNMP), con capacidad para notificar fallos críticos en menos de 60 segundos. | MRQ | | |
<!-- image -->
<!-- image -->
| HPCEXT_092 | Medición de energía: El sistema deberá medir potencia y energía por nodo, GPU, rack o grupo de racks con una precisión mínima del ±5 %, integrándose con la monitorización del CPD externo y con la gestión federada del clúster. | MRQ |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_093 | API de supervisión y gobierno: Las APIs del sistema deberán permitir la integración con el sistema de gestión y monitorización de AEMET, ofreciendo acceso a métricas, eventos y estado de la infraestructura. | MRQ |
| HPCEXT_094 | Consumo energético máximo: El sistema deberá operar bajo las limitaciones energéticas del CPD externo, aplicando políticas de power capping dinámico compatibles con los mecanismos del fabricante, y sin comprometer las cargas críticas de AEMET. | MRQ |
| HPCEXT_095 | Sistemas de refrigeración avanzados: El sistema deberá estar diseñado para soportar nodos de alta densidad, incluyendo nodos GPU, mediante soluciones de refrigeración líquida directa (DLC) o tecnologías equivalentes de alta eficiencia. La mayor parte de la carga térmica deberá disiparse mediante soluciones líquidas, pudiendo completarse con refrigeración por aire asistido en la proporción que determine el adjudicatario, siempre que se garantice la estabilidad térmica del clúster y el cumplimiento de los límites ambientales del fabricante. El diseño podrá contemplar desde configuraciones híbridas (líquido + aire) hasta soluciones basadas en refrigeración líquida al 100 %, debiendo justificarse en la oferta la eficiencia térmica, impacto operativo y compatibilidad con la infraestructura del CPD externo. | MRQ |
<!-- image -->
<!-- image -->
| HPCEXT_096 | Cumplimiento DNSH y normativa ecológica: Todo el hardware deberá cumplir los principios DNSH (Reglamento UE 2021/241), el ecodiseño (Directiva 2009/125/CE) y el marcado CE conforme al RD 219/2013. | MRQ |
|--------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_097 | Aislamiento multi-tenant: El sistema deberá incorporar mecanismos de aislamiento de usuarios, grupos y proyectos mediante contenedores, virtualización ligera y separación lógica de almacenamiento y red. | MRQ |
| HPCEXT_098 | El clúster deberá integrarse con el CPD interno mediante planificación coordinada, permitiendo la coexistencia de colas independientes y el encaminamiento controlado de trabajos entre centros, sin requerir ejecución simultánea distribuida de un mismo trabajo entre ambos CPDs. | MRQ |
| HPCEXT_099 | Capacidades MLOps: El entorno software deberá incluir herramientas de MLOps para soportar entrenamiento, validación, despliegue y monitorización de modelos de IA aplicados en AEMET. | MRQ |
| HPCEXT_100 | Optimización HPC+IA: Se valorarán optimizaciones para aceleración colectiva (NCCL, SHARP o equivalente), optimizaciones para redes de baja latencia y soporte para entrenamiento distribuido masivo. | TRQ |
<!-- image -->
<!-- image -->
| HPCEXT_101 | Integración con almacenamiento y replicación entre CPDs: El sistema deberá integrarse plenamente con los Data Transfer Nodes (DTN) y con la infraestructura de almacenamiento del CPD externo, permitiendo acceso a los datos mediante interfaces POSIX, NFS y S3 en las mismas condiciones funcionales establecidas para el almacenamiento local del clúster. La transferencia de datos entre el CPD externo y el CPD de AEMET se realizará mediante mecanismos de replicación asíncrona, cuyo rendimiento quedará condicionado por la capacidad efectiva de la interconexión entre centros. El adjudicatario deberá garantizar que la integración entre almacenamiento y DTN permite ejecutar procesos de replicación, sincronización y transferencia masiva de datos con una eficiencia adecuada para los flujos operativos y climatológicos definidos por AEMET. Asimismo, el sistema deberá proporcionar mecanismos de verificación de integridad, autenticación segura y registro de operaciones, integrables con las plataformas de monitorización y auditoría de AEMET. | MRQ |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_102 | Operación en modo degradado: El sistema deberá operar de forma segura bajo restricciones temporales de potencia o refrigeración, priorizando cargas críticas mediante mecanismos avanzados de gestión. | MRQ |
| HPCEXT_103 | Seguridad avanzada de red: Las redes del clúster externo deberán contar con segmentación estricta, políticas Zero Trust, autenticación reforzada e integración con | MRQ |
<!-- image -->
<!-- image -->
| | mecanismos de monitorización de AEMET. | | | |
|-------------------------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------------------------------|-------------------------------|---------------------------------------|
| HPCEXT_104 | Alta disponibilidad: Todos los servicios críticos deberán desplegarse en configuración altamente disponible, incluyendo software de gestión, monitorización, planificador y servicios de red. | MRQ | | |
| HPCEXT_105 | Contenedorización segura: El sistema deberá soportar OCI v1.1+, Singularity/Apptainer y mecanismos de ejecución segura de contenedores. | MRQ | | |
| Requisitos apartado 2.3.1.7.1 | Requisitos apartado 2.3.1.7.1 | Requisitos apartado 2.3.1.7.1 | Requisitos apartado 2.3.1.7.1 | Requisitos apartado 2.3.1.7.1 |
| Requisitos | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| HPCEXT_106 | Requisitos generales: La red Fabric del CPD externo deberá proporcionar una estructura de interconexión de baja latencia y alto ancho de banda, equivalente en prestaciones a la del CPD de AEMET, conectando todos los nodos del clúster (CPU, GPU, E/S, administración, login y visualización). La red deberá estar basada en tecnología ≥400 Gb/s por puerto, full-duplex, con soporte paraRDMA y optimización de comunicaciones MPI. El diseño deberá respetar los mismos límites de profundidad y latencia establecidos para el clúster interno, garantizando que la topología del fabric permita la trazabilidad completa de rutas y el cumplimiento del número máximo de saltos (hops) definido en este pliego. Asimismo, la infraestructura de red deberá ser compatible con los mecanismos de federación entre clústeres previstos en este | MRQ | | |
<!-- image -->
<!-- image -->
| | contrato, permitiendo la integración lógica de servicios, segmentación de tráfico y coordinación entre planificadores, sin requerir continuidad física entre las redes Fabric de ambos CPDs. | |
|------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCEXT_107 | Ancho de banda efectivo: La red Fabric del CPD externo deberá proporcionar full bisection bandwidth para el conjunto completo del clúster externo, incluyendo nodos de cómputo CPU, GPU, DTN, administración, login y visualización. El diseño deberá evitar cualquier contención estructural entre nodos durante operaciones colectivas de HPC, IA distribuida y cargas meteorológicas intensivas. No se admitirá oversubscription estructural en las particiones destinadas a producción operativa y cargas críticas, debiendo garantizarse una relación 1:1 en escenarios HPC e IA conforme a las | MRQ |
| HPCEXT_108 | Topología: La red deberá adoptar una topología sin bloqueo fat-tree o dragonfly(+), con rutas alternativas, resiliencia a fallos y capacidad de enrutamiento dinámico. La topología deberá garantizar un máximo de 3 saltos node-to-node y no incrementar la | MRQ |
131
<!-- image -->
<!-- image -->
| | profundidad del fabric en ampliaciones futuras. | |
|------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCEXT_109 | Conectividad de los nodos: Todos los nodos del sistema (cómputo, E/S, administración, login y visualización) deberán estar conectados a la red de interconexión de altas prestaciones conforme al diseño arquitectónico aprobado por AEMET. Las conexiones deberán garantizar un rendimiento consistente, baja latencia y compatibilidad con los estándares abiertos definidos en el Anexo V. La red de interconexión deberá cumplir, como mínimo, las siguientes condiciones: Latencia hop-to-hop inferior a 2 µs, entendida como la latencia port-to- port a través de un switch, incluyendo encaminamiento interno y colas mínimas. Conectividad de los nodos: La latencia extremo a extremo entre dos nodos de cómputo deberá corresponderse con los valores típicos de las interconexiones HPC de última generación, debiendo el licitador declarar explícitamente las métricas obtenidas para: • mensajes cortos (≤ 64 bytes), • mensajes medianos (4-64 KB), • operaciones colectivas (all- reduce, barrier, all-to-all). Las conexiones entre nodos y switches deberán ser directas, sin elementos adicionales que incrementen artificialmente la | MRQ |
<!-- image -->
<!-- image -->
| | Limitación de profundidad del fabric: El número máximo de saltos entre dos nodos de cómputo (node-to- node path) no podrá exceder de 3 hops. La topología propuesta (fat-tree, dragonfly(+), o equivalente) deberá garantizar rutas alternativas sin aumentar la profundidad del árbol de conmutación. El licitador deberá declarar el número de niveles del fabric y justificar expresamente el cumplimiento del límite de hops. El diseño deberá soportar encaminamiento adaptativo, RDMAy comunicación MPI optimizada, garantizando baja latencia, mínimo jitter y rendimiento sostenido para cargas HPC y meteorológicas. El licitador deberá aportar en la oferta la topología completa del fabric, su profundidad, el número máximo de saltos, las latencias nominales del fabricante y las latencias esperadas en producción para la escala total del sistema. | |
|------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCEXT_110 | Supervisión y gestión: La red deberá permitir gestión centralizada y monitorización casi en tiempo real de rendimiento, congestión, latencias y fallos. Cada switch deberá disponer de puerto OOB y API SNMP/REST/Redfish. | MRQ |
| HPCEXT_111 | Características avanzadas: La red deberá soportar: in-network computing, enrutamiento adaptativo, autorreparación, detección automática de fallos, balanceo dinámico, y QoS jerárquico para separar tráfico operativo y de IA. | MRQ |
<!-- image -->
<!-- image -->
| HPCEXT_112 | Redundancia eléctrica: Todos los switches deberán disponer de fuentes de alimentación redundantes, intercambiables en caliente y conectadas a ramas A/B independientes del CPD externo. | MRQ | | |
|-------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------------------------------|-------------------------------|---------------------------------------|
| HPCEXT_113 | Federación de clústeres: La red Fabric del clúster externo deberá permitir su integración lógica y funcional con el clúster ubicado en el CPD de AEMET, exclusivamente a efectos de federación de servicios (planificación distribuida, colas federadas, gestión coordinada y acceso a espacios de datos compartidos). Esta integración se realizará mediante mecanismos de segmentación y control del tráfico (VLAN, QoS u otros equivalentes) sobre la red de interconexión entre CPDs, sin requerir continuidad física entre ambos fabrics ni compartir rutas HPC internodales. Ambos fabrics -interno y externo- serán independientes, manteniendo cada uno su propia topología, latencia y dominio de conmutación, y comunicándose únicamente a través del backbone de conectividad definido en este pliego. El diseño deberá garantizar que la federación no introduce degradaciones de rendimiento en las operaciones HPC/IA internas a cada CPD. | MRQ | | |
| Requisitos apartado 2.3.1.7.2 | Requisitos apartado 2.3.1.7.2 | Requisitos apartado 2.3.1.7.2 | Requisitos apartado 2.3.1.7.2 | Requisitos apartado 2.3.1.7.2 |
| Requisitos | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
<!-- image -->
<!-- image -->
| HPCEXT_114 | La red de gestión del CPD externo deberá estructurarse en dos dominios diferenciados: gestión fuera de banda (OOB) y gestión en banda (IB), completamente independientes de la red Fabric y de la red de almacenamiento. Ambos dominios deberán implementar segmentación lógica mediante VLANs equivalentes a las empleadas en el CPD de AEMET, de forma que exista correspondencia funcional con las redes MNG-OOB y MNG-IB internas, garantizando coherencia arquitectónica, interoperabilidad y una gestión federada uniforme entre ambos centros de proceso de datos. | MRQ |
|--------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_115 | Todos los nodos del clúster externo deberán disponer de un puerto Ethernet dedicado para gestión fuera de banda, conectado exclusivamente a la red OOB del CPD externo. Esta red deberá proporcionar acceso seguro a los BMC/IPMI/Redfish y garantizar: Aislamiento físico y lógico completo respecto del tráfico operativo, HPC, de almacenamiento y de servicios internos. Autenticación reforzada para el acceso a los controladores de gestión. Cifrado obligatorio del tráfico OOB mediante TLS o equivalente, evitando cualquier exposición en claro. Segregación total del tráfico administrativo, sin posibilidad de reencaminamiento hacia redes de datos o de usuario. La red OOB deberá permitir la gestión remota integral del clúster con las mismas garantías operativas y de seguridad que las exigidas en el CPD de AEMET. | MRQ |
<!-- image -->
<!-- image -->
| HPCEXT_116 | Gestión en banda (IB): La red de gestión en banda del CPD externo deberá soportar todo el tráfico necesario para la administración del sistema operativo, PXE, repositorios, orquestación de nodos, monitorización y servicios internos del clúster. Su diseño deberá garantizar: Equivalencia funcional con la red MNG-IB del CPD de AEMET, permitiendo operación federada y coherencia en los procedimientos de gestión. Puertos de acceso de al menos 10 GbE, admitiéndose 25 GbE cuando sea necesario para despliegues masivos, tráfico de imágenes o servicios de orquestación. Puertos ascendentes (uplinks) de al menos 100 GbE hacia el nivel de agregación, garantizando ausencia de cuellos de botella y tiempos de despliegue dentro de los límites del pliego. Separación lógica mediante VLANs dedicadas, aisladas del tráfico HPC, de almacenamiento y de usuario. Capacidad para multicast eficiente, imprescindible para PXE, despliegues simultáneos y herramientas de provisión. Compatibilidad con los sistemas de gestión de AEMET, incluidos mecanismos de monitorización, inventario y orquestación. La red en banda deberá dimensionarse para admitir operaciones de instalación simultánea de decenas de nodos sin afectar al rendimiento del clúster. | MRQ |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
<!-- image -->
<!-- image -->
| HPCEXT_117 | Aislamiento y seguridad: La red de gestión del CPD externo deberá aplicar controles equivalentes a los del CPD de AEMET, garantizando: Aislamiento físico y lógico entre OOB, IB, HPC y otras redes. Autenticación fuerte y cifrado obligatorio (TLS, SSHv2). Segmentación mediante VLANs y ACLs, compatibles con la arquitectura de Telemática de AEMET. Protección frente a accesos no autorizados y cumplimiento de las políticas de seguridad y segmentación corporativas. | MRQ |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_118 | Integración con AEMET: La red de gestión del clúster externo deberá integrarse con la red de gestión de AEMET exclusivamente a través de los dominios y segmentos habilitados del servicio de interconexión entre CPDs (interconexión de CPDs), garantizando una comunicación segura y controlada entre ambos centros. Esta integración no implicará continuidad física de redes ni compartición de dominios internos, y deberá respetar las políticas de segmentación y seguridad definidas por la Unidad de Coordinación de Telemática de AEMET. | MRQ |
| HPCEXT_119 | Capacidad de despliegue masivo: La red de gestión deberá permitir la instalación simultánea de imágenes del sistema en múltiples nodos sin degradar el rendimiento operativo. | MRQ |
| HPCEXT_120 | Supervisión completa del sistema: La red deberá permitir la monitorización integral del hardware y software del clúster externo y su integración con las herramientas de supervisión de AEMET mediante APIs abiertas (REST, SNMP, Redfish). Incluyendo | MRQ |
<!-- image -->
<!-- image -->
| | soportes SNMPv3, Syslog y API REST para integración con Zabbix, NetBox y sistemas equivalentes | | | |
|-----------------------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----------------------------|-----------------------------|---------------------------------------|
| HPCEXT_121 | Alta disponibilidad: La red de gestión del clúster externo deberá garantizar continuidad operativa mediante redundancia de enlaces, switches y rutas de control, evitando puntos únicos de fallo. El diseño preferente será Spine-Leaf con redundancia MLAG o MC-LAG | MRQ | | |
| HPCEXT_122 | Conexión OOB separada por IX- CPDs: La red OOB deberá alcanzarse desde AEMET a través de dominios separados y protegidos del servicio IX-CPDs, sin exposición directa a Internet ni redes no corporativas. | MRQ | | |
| HPCEXT_123 | Compatibilidad con el software del clúster: La red deberá soportar todas las funciones del software de gestión (reinstalación, health- checks, reconfiguración, bare- metal provisioning). La red deberá soportar PXE, bare-metal provisioning y herramientas estándar de gestión de clústeres (p. ej. xCAT, Warewulf, Bright u OpenHPC). | MRQ | | |
| Requisitos apartado 2.3.1.8 | Requisitos apartado 2.3.1.8 | Requisitos apartado 2.3.1.8 | Requisitos apartado 2.3.1.8 | Requisitos apartado 2.3.1.8 |
| Requisitos | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| HPCEXT_124 | Estructura general: La partición de cómputo del clúster externo deberá incluir nodos CPU para cargas HPC tradicionales y nodos GPU de alto rendimiento para cargas de IA. La parte de CPU deberá alinearse operativamente con las políticas y procedimientos del CPD de AEMET, manteniendo funcionamiento independiente en cada centro. | MRQ | | |
<!-- image -->
<!-- image -->
| HPCEXT_125 | Homogeneidad funcional: Los nodos CPU de la partición externa deberán ser completamente homogéneos y basados en arquitectura x86_64, garantizando plena compatibilidad con los entornos HPC utilizados por AEMET. Todos los nodos deberán presentar la misma configuración de CPU, memoria, red y firmware, con un rendimiento nominal equivalente (variación ≤ 5 %) y sin mezclas de modelos dentro de la partición. | MRQ |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_126 | GPU de última generación: Los nodos GPU deberán integrar al menos 8 GPUs de última generación por nodo , adecuadas para entrenamiento e inferencia de modelos de IA, con memoria HBM ≥ 80 GB por GPU y capacidades de computación masiva en precisión mixta. Las GPUs deberán ser compatibles con CUDA, HIP o ROCm, según la arquitectura ofertada, garantizando soporte para los entornos de IA y HPC utilizados en AEMET. | MRQ |
| HPCEXT_127 | Memoria de los nodos CPU: Cada nodo CPU deberá contar con al menos 512 GB de memoria DDR5 o superior, saturando todos los canales de memoria disponibles. | MRQ |
| HPCEXT_128 | Memoria de los nodos GPU: Cada nodo GPU deberá contar con al menos 512 GB de memoria DDR5 para CPU y la memoriaHBM especificada por GPU (≥ 80 GB). | MRQ |
| HPCEXT_129 | Rendimiento mínimo CPU: Las CPUs deberán ofrecer al menos 25 GFLOPS FP64 por core y un mínimo de 72 cores por CPU y cada nodo deberá incorporar al menos 2 CPU por nodo | MRQ |
| HPCEXT_130 | Rendimiento mínimo GPU: Cada GPU deberá ofrecer al menos 2 PFLOPS FP16, demostrables mediante benchmarks estándar (HPL-MxP o equivalentes). | MRQ |
<!-- image -->
<!-- image -->
| HPCEXT_131 | Topología de red: Todos los nodos de la partición de cómputo del CPD externo deberán conectarse a la red Fabric mediante enlaces de al menos 200 Gb/s full-duplex, garantizando baja latencia y soporte completo para operaciones MPI y RDMA. El diseño deberá respetar los mismos límites arquitectónicos establecidos para el CPD interno, incluyendo un máximo de 3 hops node-to-node en la topología propuesta. El licitador deberá declarar explícitamente: latencias port-to-port, latencias node-to-node, rendimiento esperado para mensajes cortos, medianos y | MRQ |
|--------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_132 | Conectividad de gestión: Cada nodo deberá disponer de NIC dual para la red de gestión en banda (10/25 GbE) y un puerto dedicado BMC conectado a la red OOB. La conectividad de gestión deberá garantizar aislamiento físico y lógico, autenticación reforzada y cifrado obligatorio, cumpliendo los mismos requisitos de seguridad definidos para el CPD interno. | MRQ |
| HPCEXT_133 | Conectividad de almacenamiento: Cada nodo deberá disponer de las interfaces necesarias para acceder al almacenamiento del CPD externo y para realizar transferencias de datos hacia los Data Transfer Nodes (DTN) del CPD de AEMET a través del servicio de interconexión entre CPDs. Este modelo no implica coherencia | MRQ |
<!-- image -->
<!-- image -->
| | ni acceso simultáneo POSIX entre centros, realizándose la comunicación mediante replicación y transferencia asíncrona gestionada por los DTN. | | | |
|-----------------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----------------------------|-----------------------------|---------------------------------------|
| HPCEXT_134 | Almacenamiento local: Todos los nodos deberán disponer de almacenamiento local SSD en RAID1 con al menos 0,8 TB netos para SO y cachés. | MRQ | | |
| HPCEXT_135 | Integración operativa: La partición de cómputo del CPD externo deberá operar de manera independiente, pero manteniendo compatibilidad con las políticas, módulos, repositorios y configuraciones del entorno HPC de AEMET, garantizando coherencia operativa sin compartición de colas ni planificación cruzada. | MRQ | | |
| HPCEXT_136 | Escalabilidad: El diseño deberá permitir ampliaciones en número de nodos CPU y GPU sin rediseño completo de la red fabric ni del almacenamiento sin requerir modificaciones en el CPD externo de AEMET. | MRQ | | |
| HPCEXT_137 | Optimización para IA: Se valorará incluir nodos GPU adicionales, GPUs de mayor capacidad o configuraciones con más de 8 GPUs por nodo para entrenamientos a gran escala. | TRQ | | |
| Requisitos apartado 2.3.1.9 | Requisitos apartado 2.3.1.9 | Requisitos apartado 2.3.1.9 | Requisitos apartado 2.3.1.9 | Requisitos apartado 2.3.1.9 |
| Requisitos | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| HPCEXT_138 | Requisitos generales: La partición de administración alojará todos los servicios de control, gestión y orquestación del sistema, incluyendo el gestor de colas, monitorización, autenticación, despliegue y mantenimiento automatizado. El | MRQ | | |
141
<!-- image -->
<!-- image -->
| | tamaño de la partición será suficiente para soportar el funcionamiento ininterrumpido del clúster y garantizar la continuidad operativa. Deberá contar con al menos 3 nodos físicos dedicados, configurados de forma redundante. | |
|------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCEXT_139 | Compatibilidad funcional: Los nodos deberán implementar todas las características comunes HPCINT_098 equivalente indicadas en los requisitos generales del sistema, incluyendo BMC avanzado, firmware firmado y monitorización remota implementando las mismas capacidades básicas de gestión definidas para el CPD interno. | MRQ |
| HPCEXT_140 | Potencia de cálculo en nodos de administración: Cada nodo deberá contar con dos CPUs x86_64 de última generación, con al menos 64 cores por CPU, para soportar servicios de gestión y monitorización simultánea del cluster externo. | MRQ |
| HPCEXT_141 | Memoria del nodo de administración: Cada nodo deberá estar equipado con al menos 256 GB de memoria DDR5, ampliable según necesidades de los servicios. | MRQ |
| HPCEXT_142 | Almacenamiento de la partición de administración: Los nodos compartirán un almacenamiento dedicado de al menos 200 TB netos, destinado a: • Software y herramientas de gestión. • Bases de datos de configuración y control con copias de seguridad diferenciales diarias (mínimo 1 año). • Registros de sistema agregados (mínimo 1 año). • Registros de auditoría y métricas de rendimiento (mínimo 2 años). • Telemetría energética y de estado del sistema.El almacenamiento deberá estar | MRQ |
<!-- image -->
<!-- image -->
| | conectado a la red de gestión (MNG-IB), accesible por todos los nodos, y ser físicamente independiente del almacenamiento de cómputo. La configuración deberá ser resistente al fallo simultáneo de al menos dos bloques básicos independientes (nodos de almacenamiento, controladores o chasis). | |
|------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCEXT_143 | Alta durabilidad del almacenamiento: La configuración deberá ser resistente al fallo de al menos dos bloques independientes (nodos de almacenamiento, controladoras o chasis). | MRQ |
| HPCEXT_144 | Conectividad a red fabric: Cada nodo de administración deberá disponer de 1 NIC con al menos dos puertos ≥ 200 Gbps (≥ 400 Gbps agregados), conectados a switches distintos de la red fabric del CPD externo, garantizando tolerancia a fallos y capacidad suficiente para despliegues masivos, PXE y servicios internos. La conectividad deberá ser equivalente a la exigida para los nodos de administración del CPD interno. | MRQ |
| HPCEXT_145 | Conectividad al backbone del CPD externo: Cada nodo incluirá una NIC dual de 100 Gbps conectada a la red troncal externa con redundancia física. | MRQ |
| HPCEXT_146 | Conectividad a red de gestión: Cada nodo dispondrá de NIC dual a 10/25 GbE para gestión en banda y un puerto independiente 1 GbE OOB para BMC conectado a la red de administración remota cumpliendo los requisitos de aislamiento físico/lógico y cifrado definidos para el CPD interno. | MRQ |
<!-- image -->
<!-- image -->
| HPCEXT_147 | Rendimiento de gestión: La partición deberá garantizar la capacidad necesaria para cumplir con los tiempos máximos de reinicio, reinstalación y provisión definidos para el sistema (≤ 60 min para particiones completas). | MRQ |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_148 | Alta disponibilidad de servicios: Los servicios críticos de la partición de administración deberán ejecutarse en alta disponibilidad (HA), en configuraciones activo/pasivo o activo/activo, garantizando continuidad operativa ante la pérdida de al menos dos nodos. La recuperación del servicio deberá producirse en menos de 60 segundos, y el diseño de HA deberá ser equivalente a lo exigido en HPCINT_152, sin impacto significativo en la operación. | MRQ |
| HPCEXT_149 | Monitorización y coherencia: El licitador proporcionará herramientas que verifiquen en todo momento el estado y configuración de hardware y software, integrables con SLURM/WLM. | MRQ |
| HPCEXT_150 | Actualización continua: El sistema deberá soportar mecanismos de actualización continua (rolling updates) permitiendo aplicar actualizaciones sin impacto significativo en la producción. | MRQ |
| HPCEXT_151 | Software de gestión integrado: El licitador deberá suministrar una solución completa de gestión del clúster que permita aprovisionamiento bare-metal, actualización de firmware, monitorización y gestión del ciclo de vida de los nodos. La solución deberá incluir APIs abiertas e integrarse con los sistemas corporativos de AEMET (Zabbix, DynaTrace u otros equivalentes), garantizando una administración coherente con la del CPD interno. | MRQ |
<!-- image -->
<!-- image -->
| HPCEXT_152 | Monitorización avanzada de hardware: El software deberá recopilar eventos de hardware dentro y fuera de banda, almacenarlos centralizadamente y generar alertas automáticas. | MRQ | | |
|--------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|--------------------------------|--------------------------------|---------------------------------------|
| HPCEXT_153 | Cluster management open-source: Se valorará positivamente que la solución pertenezca o sea compatible con OpenHPC o iniciativas equivalentes. | TRQ | | |
| Requisitos apartado 2.3.1.10.1 | Requisitos apartado 2.3.1.10.1 | Requisitos apartado 2.3.1.10.1 | Requisitos apartado 2.3.1.10.1 | Requisitos apartado 2.3.1.10.1 |
| Requisitos | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| HPCEXT_154 | Número mínimo de nodos de login: el clúster externo deberá incluir al menos 4 nodos de inicio de sesión, equivalentes funcionalmente a los del CPD de AEMET incluyendo mecanismos de alta disponibilidad equivalentes a los del CPD interno. | MRQ | | |
| HPCEXT_155 | Requisitos comunes: todos los nodos deberán cumplir las características comunes establecidas para los nodos del sistema (BMC, monitorización avanzada, firmware firmado, seguridad, etc.) deberán cumplir los requisitos comunes definidos para los nodos del sistema (Requisito HCPINT_098) | MRQ | | |
| HPCEXT_156 | Arquitectura de CPU: cada nodo deberá disponer de 2 CPUs x86_64 de última generación de última generación o equivalente, con ≥ 64 cores por CPU, preferiblemente idénticas a las empleadas en la partición de cómputo del clúster externo. | MRQ | | |
| HPCEXT_157 | Memoria: cada nodo de login deberá disponer de al menos 512 GB de memoria DDR5 para garantizar capacidad suficiente para cargas interactivas múltiples. | MRQ | | |
| HPCEXT_158 | Conectividad a la red Fabric: cada nodo deberá integrar 1 NIC con 2 puertos ≥ 200 Gbps full-duplex por puerto (≥ 400 Gbps agregados), | MRQ | | |
<!-- image -->
<!-- image -->
| | conectados a switches diferentes para redundancia. | |
|------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCEXT_159 | Conectividad al backbone del CPD externo: los nodos deberán disponer de otra NIC dual con ≥ 100 Gbps por puerto (≥ 200 Gbps agregados), conectada redundante a la red troncal. | MRQ |
| HPCEXT_160 | Gestión en banda: Cada nodo de login deberá disponer de una NIC con 2 puertos a 10/25 GbE para la gestión en banda, conectados a switches distintos, incluyendo soporte PXE y arranque remoto para la administración del sistema operativo, monitorización y servicios asociados. | MRQ |
| HPCEXT_161 | Gestión fuera de banda: puerto 1 GbE dedicado al BMC conectado a la red OOB del CPD externo con autenticación reforzada y cifrado TLS, conforme a los requisitos de seguridad del sistema. | MRQ |
| HPCEXT_162 | Almacenamiento local: cada nodo deberá disponer de 2 SSD en RAID1 con ≥ 4 TB netos destinado a SO, librerías y software de usuario. | MRQ |
| HPCEXT_163 | Compatibilidad software: los nodos deberán soportar la instalación de todo el software disponible en el CPD de AEMET (módulos, librerías meteorológicas, climatológicas y de IA) garantizando homogeneidad funcional con los nodos internos | MRQ |
| HPCEXT_164 | Los nodos de login del clúster externo deberán integrarse con el entorno de gestión corporativo de AEMET para ofrecer a los usuarios una experiencia unificada, permitiendo el uso de las mismas herramientas de acceso, monitorización y consulta de trabajos que en el CPD interno, sin implicar en ningún caso la compartición ni el envío directo de trabajos entre clústeres. Cada partición ejecutará exclusivamente los trabajos asignados por su | MRQ |
<!-- image -->
<!-- image -->
| | propio planificador, de acuerdo con las políticas de uso definidas. | | | |
|--------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|--------------------------------|--------------------------------|---------------------------------------|
| HPCEXT_165 | Seguridad: los nodos deberán soportar credenciales con la posibilidad de integrarse con el IdP corporativo de AEMET (LDAP,SSSD,IdM o compatible con IdP corporativo ), aplicar políticas de aislamiento multiusuario y registrar la actividad y deberán estar segmentados conforme a las | MRQ | | |
| HPCEXT_166 | políticas de Telemática de AEMET. Rendimiento interactivo: Los nodos de login deberán garantizar tiempos de respuesta adecuados para el uso interactivo en tareas de análisis, compilación y preparación de modelos, incluso bajo condiciones de alta carga. Deberán aplicarse mecanismos de control de recursos (como cgroups u otros equivalentes) que impidan que un usuario o proceso degrade el rendimiento del nodo o afecte al resto de usuarios, asegurando un entorno estable y predecible para | MRQ | | |
| HPCEXT_167 | el trabajo interactivo. Tolerancia a fallos: en caso de fallo de un enlace o switch, los nodos deberán mantener conectividad plena mediante los enlaces redundantes. | MRQ | | |
| Requisitos apartado 2.3.1.10.2 | Requisitos apartado 2.3.1.10.2 | Requisitos apartado 2.3.1.10.2 | Requisitos apartado 2.3.1.10.2 | Requisitos apartado 2.3.1.10.2 |
| Requisitos | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| HPCEXT_168 | Número mínimo de nodos de visualización: el clúster externo deberá incluir al menos 8 nodos de visualización, equivalentes funcionalmente a los del CPD de AEMET garantizando acceso fluido y seguro para usuarios autorizados, | MRQ | | |
<!-- image -->
<!-- image -->
| | equivalente funcionalmente al entorno del CPD de AEMET. | |
|------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCEXT_169 | Requisitos comunes: los nodos deberán cumplir todas las características comunes definidas para los nodos del sistema (BMC, monitorización, seguridad, firmware firmado, etc.). | MRQ |
| HPCEXT_170 | Arquitectura de CPU: cada nodo deberá incluir 2 CPUs x86_64 de última generación con ≥ 64 cores por CPU, preferiblemente idénticas a las de cómputo. | MRQ |
| HPCEXT_171 | GPU para visualización: Cada nodo deberá disponer de al menos 2 GPUs de gama alta, compatibles con OpenGL y con las librerías de visualización científica empleadas en entornos HPC, capaces de acelerar rendering 3D y visualización remota. Cada GPU deberá disponer de al menos 24 GB de memoriaHBMo GDDR6, garantizando la ejecución eficiente de sesiones interactivas y procesos gráficos intensivos. | MRQ |
| HPCEXT_172 | Memoria RAM: cada nodo deberá disponer de ≥ 512 GB DDR5, optimizada para cargas de visualización intensivas en memoria. | MRQ |
| HPCEXT_173 | Conectividad a red Fabric: 1 NIC con 2 puertos ≥ 200 Gbps (400 Gbps agregados), conectados a switches distintos con conectividad de baja latencia equivalente a la exigida en el CPD interno. | MRQ |
| HPCEXT_174 | Conectividad al backbone: 1 NIC dual con ≥ 100 Gbps por puerto, redundante, conectada a la troncal del CPD externo. | MRQ |
| HPCEXT_175 | Gestión en banda: 1 NIC dual 10/25 GbE para tráfico PXE, SSH, monitorización y servicios del sistema operativo incluyendo soporte PXE y arranque remoto para despliegue y administración | MRQ |
<!-- image -->
<!-- image -->
| HPCEXT_176 | Gestión fuera de banda: puerto 1 GbE dedicado al BMC, conectado a la red OOB del CPD externo. | MRQ | | |
|--------------------------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|--------------------------------|--------------------------------|---------------------------------------|
| HPCEXT_177 | Almacenamiento local: cada nodo deberá disponer de 2 SSD en RAID1 con ≥ 7 TB netos para OS, cache gráfica y temporales. | MRQ | | |
| HPCEXT_178 | Servicio de visualización remota: deberán soportarse sistemas de visualización interactiva remota (VirtualGL, NICE DCV, TurboVNC o equivalentes) incluyendo soporte para herramientas de análisis y visualización científica empleadas por AEMET. | MRQ | | |
| HPCEXT_179 | Operación en modo batch: los nodos deberán poder ejecutar cargas de visualización bajo SLURM u otro WLM, incluyendo rendering automático. | MRQ | | |
| HPCEXT_180 | Integración con almacenamiento: acceso nativo a POSIX, NFS y S3 para lectura y escritura de grandes volúmenes de datos científicos garantizando segmentación adecuada para evitar interferencias con el plano de cómputo. | MRQ | | |
| HPCEXT_181 | Aislamiento multiusuario: mecanismos para garantizar separación entre sesiones gráficas y protección de memoria GPU entre procesos. | MRQ | | |
| HPCEXT_182 | Seguridad y trazabilidad: integración con el IdP corporativo, registro completo de actividad, cumplimiento ENS y control de acceso basado en roles requiriendo autenticación fuerte, cifrado extremo a extremo y registro completo de actividad conforme al ENS.. | MRQ | | |
| Requisitos apartado 2.3.1.11.8 | Requisitos apartado 2.3.1.11.8 | Requisitos apartado 2.3.1.11.8 | Requisitos apartado 2.3.1.11.8 | Requisitos apartado 2.3.1.11.8 |
| Requisitos | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
<!-- image -->
<!-- image -->
| HPCEXT_183 | Disponibilidad La infraestructura de almacenamiento deberá estar configurada para garantizar la continuidad operativa ante el fallo de cualquiera de sus componentes (discos, controladoras, nodos o switches de red). El sistema deberá incorporar mecanismos de redundancia, replicación y recuperación automática, asegurando la integridad de los datos operativos y climatológicos almacenados. | MQR |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_184 | Interoperabilidad y jerarquía de datos El almacenamiento deberá comportarse como una unidad lógica única, implementando mecanismos automáticos de gestión y movimiento de datos entre las distintas capas de rendimiento (Hot Tier y Cold Tier). Estos mecanismos deberán ser configurables y transparentes para los usuarios, optimizando la relación coste-rendimiento y el uso de los recursos en función de la frecuencia de acceso. | MQR |
| HPCEXT_185 | Protocolos El sistema deberá ofrecer compatibilidad con los protocolos POSIX, NFS y S3, garantizando la interoperabilidad con el entorno corporativo de AEMET y los sistemas cloud externos, así como con herramientas de visualización, análisis y automatización ya implantadas. | MQR |
| HPCEXT_186 | Requisitos de red Todos los nodos del sistema de almacenamiento deberán estar equipados con: • 2 puertos de alta velocidad (≥200 Gb/s) conectados a la red Fabric o, en su caso, a una red de almacenamiento dedicada, garantizando redundancia física mediante conexión a switches diferentes. • 1 NIC con 2 puertos Ethernet conectada a la red de gestión (MNG-IB) de AEMET a 25 Gb/s, con soporte PXE y arranque | MQR |
150
<!-- image -->
<!-- image -->
| | remoto. • 1 NIC con 1 puerto Ethernet 1 GbE dedicada al BMC, conectada a la red OOB del CPD de AEMET. El diseño deberá asegurar redundancia y disponibilidad 24x7. | |
|------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCEXT_187 | Acceso y montaje El sistema de ficheros de la partición de almacenamiento deberá poder montarse de forma nativa en todos los nodos del sistema, incluyendo las particiones de cómputo, administración, login y visualización, garantizando consistencia y coherencia de datos. | MQR |
| HPCEXT_188 | Funcionalidades avanzadas El sistema de almacenamiento deberá ofrecer las siguientes capacidades: • Distribución equilibrada de datos y metadatos entre todos los nodos y controladoras. • Arquitectura modular y escalable, permitiendo ampliaciones de capacidad o rendimiento sin interrupción del servicio. • Soporte de snapshots en caliente (mínimo 1.000 por sistema de ficheros). • Capacidad de almacenar más de 40.000 millones de ficheros. • Gestión avanzada de cuotas (por inodo, bloque, usuario, grupo o filesystem). • Mecanismos de calidad de servicio (QoS) configurables para priorizar cargas críticas operativas (por ejemplo, predicción o generación de avisos). • Capacidad de actualización en caliente sin pérdida de servicio, mediante rolling updates. • Cifrado de datos en reposo y en tránsito.atos en reposo y en tránsito. | MQR |
<!-- image -->
<!-- image -->
| HPCEXT_189 | Red de almacenamiento dedicada Se valorará la incorporación de una red físicamente separada para el tráfico de almacenamiento entre los nodos del sistema y la infraestructura de datos, con capacidad suficiente (≥400 Gb/s agregados) y prestaciones que garanticen los niveles de rendimiento requeridos. Esta red podrá integrarse con los Data Movers (DTN) encargados de la transferencia de grandes volúmenes de datos hacia sistemas internacionales (ECMWF, Copernicus, etc.) e infraestructura de nube externa. | MQR |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_190 | Integración con la interconexión entre CPDs El sistema de almacenamiento deberá permitir la transferencia eficiente y segura de datos entre el CPD de AEMET y el CPD externo, aprovechando la infraestructura de interconexión extremo-a-extremo instalada por el adjudicatario. Deberá garantizar compatibilidad con los Data Movers (DTN), soportar transferencia paralela multicanal, autenticación corporativa y cifrado en tránsito. La topología, direccionamiento y niveles de servicio de esta interconexión serán definidos durante la fase de implantación en coordinación con la Unidad de Coordinación de Telemática. | MQR |
| HPCEXT_191 | Capacidad El sistema deberá disponer de una capacidad neta y usable mínima de 2 PB, dedicada al almacenamiento de los datos activos asociados a la ejecución operativa de modelos numéricos, análisis meteorológicos, climatología operativa y procesos de asimilación. Esta capacidad deberá ser expandible sin interrupción del servicio y con posibilidad de integración con el nivel Cold Tier. | MQR |
<!-- image -->
<!-- image -->
| HPCEXT_192 | Rendimiento El sistema de almacenamiento deberá proporcionar un rendimiento agregado equivalente, al menos, a: • 2 GB/s por nodo de cómputo en lectura. • 1,6 GB/s por nodo de cómputo en escritura. El rendimiento deberá demostrarse mediante la ejecución del benchmark IOR en condiciones equivalentes a las de operación real. En ningún el rendimiento agregado deberá ser inferior a 300 GB/s en lectura y 250 GB/s en escritura para la totalidad de los nodos de cómputo. Asimismo, deberá soportar al menos 20.000 operaciones de E/S por nodo de cómputo para ficheros de tamaño 4K, demostrables mediante benchmark IOZONE. La infraestructura deberá mantener un rendimiento sostenido durante la ejecución simultánea de trabajos de predicción y climatología, garantizando latencias reducidas incluso en entornos de concurrencia elevada. | MQR |
|--------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_193 | Mejora de capacidad y rendimiento Se valorará la provisión de una infraestructura que exceda las especificaciones mínimas en términos de capacidad, rendimiento sostenido o eficiencia energética, especialmente si contribuye a mejorar los tiempos de ciclo de predicción, el acceso a datos climatológicos o la interoperabilidad con el entorno de las plataformas multicloud. | TRQ |
| HPCEXT_194 | Capacidad El sistema deberá disponer de una capacidad neta y usable mínima de 10 PB, dedicada al almacenamiento de datos a largo plazo, incluyendo resultados de simulaciones meteorológicas y climatológicas, productos derivados, archivos de | MQR |
<!-- image -->
<!-- image -->
| | observaciones y datasets de referencia. Deberá ser ampliable y modular, garantizando la continuidad del servicio durante las expansiones de capacidad y el mantenimiento evolutivo. | |
|------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCEXT_195 | Rendimiento El sistema de almacenamiento del Cold Tier deberá proporcionar un rendimiento agregado equivalente, al menos, al 25% del rendimiento ofrecido por el Hot Tier, demostrable mediante los benchmarks IOR e IOZONE. Deberá garantizar un acceso eficiente para procesos de recuperación de datos, verificación de productos, generación de indicadores climáticos y transferencia hacia sistemas externos (RAICES, | MQR |
| HPCEXT_196 | ECMWF, Copernicus, etc.). Mejora de capacidad y rendimiento Se valorará positivamente la provisión de una infraestructura que exceda las especificaciones mínimas en capacidad o rendimiento, especialmente si mejora la eficiencia energética, la redundancia geográfica o la integración nativa con servicios cloud o con la infraestructura de respaldo del CPD externo. | TQR |
| HPCEXT_197 | Número de nodos La partición de Data Movers deberá estar compuesta por al menos dos nodos dedicados, garantizando alta disponibilidad y redundancia en las operaciones de transferencia de datos entre el almacenamiento principal, el CPD externo y los sistemas internacionales de intercambio (p. ej. ECMWF, Copernicus o WMO). | MQR |
| HPCEXT_198 | Requisitos comunes de los nodos Los nodos deberán cumplir las funcionalidades establecidas en el requisito HPCINT_098. | MQR |
<!-- image -->
<!-- image -->
| HPCEXT_199 | Configuración de los nodos Cada nodo deberá estar configurado con al menos dos procesadores basados en arquitectura x86-64 de última generación o equivalente, optimizados para operaciones intensivas de transferencia y cifrado de datos. | MQR |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| HPCEXT_200 | Configuración de memoria Los nodos de Data Movers deberán disponer de al menos 512 GB de memoria DDR5 (o LPDDR5), permitiendo gestionar múltiples flujos de transferencia concurrentes, procesos de checksum, validación y compresión | MQR |
| HPCEXT_201 | sin afectar al rendimiento global. Requisitos de red Los nodos de Data Movers deberán estar equipados con: • 1 NIC con 2 puertos conectados a la red Fabric o, en su caso, a la red de almacenamiento dedicada, con al menos 200 Gb/s por puerto (400 Gb/s agregados), conectados a switches diferentes. • 1 NIC con 2 puertos Ethernet conectada a la red troncal del CPD de AEMET, con al menos 100 Gb/s por puerto (200 Gb/s agregados), garantizando redundancia y acceso a los canales de intercambio externos. • 1 NIC con 2 puertos Ethernet conectada a la red de gestión (MNG-IB) a 25 Gb/s, con soporte PXE y arranque remoto por Ethernet, conectada a switches diferentes. • 1 NIC con 1 puerto Ethernet 1 GbE dedicada al BMC, conectada a la red OOB del CPD de AEMET. Las configuraciones de red deberán garantizar resiliencia y continuidad operativa ante la caída de un enlace o dispositivo. | MQR |
| HPCEXT_202 | Almacenamiento local Cada nodo de Data Movers deberá disponer de 2 unidades SSD en configuración RAID 1, con al menos 2 TB netos de capacidad, dedicados al sistema operativo y a almacenamiento | MQR |
<!-- image -->
<!-- image -->
| | temporal de ficheros intermedios durante los procesos de transferencia y validación de datos. | |
|------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| HPCEXT_203 | Protocolos y funcionalidades Los Data Movers deberán soportar protocolos estándar de transferencia de datos de alta velocidad y seguridad, como GridFTP, HTTPS, S3, SCP, Rsync o Aspera FASP, así como mecanismos de integridad (checksum SHA-256), cifrado TLS 1.3 y registro de auditoría centralizado. Deberán poder integrarse con el entorno DataLake y multicloud, y con el entorno de monitorización y trazabilidad de AEMET | MQR |
| HPCEXT_204 | Replicación entre CPDs mediante ILM/HSM: El sistema de almacenamiento del CPD externo deberá soportar replicación asíncrona desde el Cold Tier del CPD interno hacia el Cold Tier del CPD externo, empleando políticas de gestión del ciclo de vida de datos (ILM/HSM). La replicación será incremental, segura, verificable mediante checksums y orientada a datasets climatológicos, de archivo y datos operativos recientes. No se requiere replicación a tiempo real del Hot Tier ni de áreas efímeras (Scratch). | MQR |
| HPCEXT_205 | Rehidratación de datos para continuidad operativa: El sistema deberá permitir la restauración selectiva y eficiente de datos replicados desde el Cold Tier del CPD externo hacia su propio Hot Tier, posibilitando la ejecución de cadenas operativas y climatológicas en caso de contingencia en el CPD interno. La recuperación deberá realizarse sin interrupción del servicio y con | MQR |
<!-- image -->
<!-- image -->
| | prioridad configurable para datasets críticos. | | | |
|------------------------------------------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|------------------------------------------------|------------------------------------------------|------------------------------------------------|
| HPCEXT_206 | Procedimientos de DR orientados a cadenas operativas: Se valorará que el adjudicatario proporcione procedimientos técnicos (runbooks) que describan cómo activar la ejecución de cadenas operativas en el CPD externo utilizando los datos replicados, incluyendo: • identificación de datasets críticos, • pasos de restauración desde el Cold Tier, • criterios de conmutación, • y dependencias con DTN, IX-CPDs y mecanismos de autenticación. Estos procedimientos deberán permitir alcanzar los objetivos de | TQR | | |
| definidos por AEMET. Requisitos apartado 2.4.1 | definidos por AEMET. Requisitos apartado 2.4.1 | definidos por AEMET. Requisitos apartado 2.4.1 | definidos por AEMET. Requisitos apartado 2.4.1 | definidos por AEMET. Requisitos apartado 2.4.1 |
| Requisitos | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| LICSOFT_001 | El adjudicatario deberá suministrar todas las licencias necesarias para el sistema operativo Linux (versión ≥ 6.8) en todos los nodos de cómputo, GPU, administración, login, E/S y DTN del clúster externo. | MRQ | | |
| LICSOFT_002 | Se deberán suministrar licencias completas de soporte y mantenimiento LTS del sistema operativo durante toda la vigencia del contrato. | MRQ | | |
| LICSOFT_003 | El adjudicatario deberá suministrar las herramientas de gestión y monitorización del sistema compatibles con AEMET (REST, Redfish, SNMP), incluyendo las licencias necesarias. | MRQ | | |
<!-- image -->
<!-- image -->
| LICSOFT_004 | Las licencias de SLURM (o planificador equivalente) deberán cubrir todas las particiones del clúster externo y su integración federada con el clúster de AEMET. | MRQ |
|---------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| LICSOFT_005 | Se deberán proporcionar licencias o módulos necesarios para el funcionamiento federado del planificador, incluyendo: multi- cluster, cuenta compartida, migración de trabajos, job federation y monitorización cruzada. | MRQ |
| LICSOFT_006 | El adjudicatario deberá proporcionar todas las licencias necesarias para contenedores HPC (Singularity/Apptainer u OCI) con soporte para RBAC, aislamiento y repositorio seguro de imágenes. | MRQ |
| LICSOFT_007 | Se deberán incluir las herramientas de profiling de bajo impacto para CPU y GPU (Perf, LIKWID, Nsight, PMPI Wrappers o equivalentes), con las licencias necesarias para ≥ 16 nodos concurrentes. | MRQ |
| LICSOFT_008 | Se deberán proporcionar licencias para herramientas de depuración paralela (debuggers HPC), con licencia mínima para 8 nodos de cómputo. | MRQ |
| LICSOFT_009 | El adjudicatario deberá proporcionar bibliotecas optimizadas para CPU y GPU: BLAS, LAPACK, ScaLAPACK, FFT, MKL/cuBLAS/cuFFT/cuDNN u otras equivalentes adecuadas a la arquitectura. | MRQ |
| LICSOFT_010 | El entorno de programación deberá incluir compiladores para C, C++, Fortran, MPI v4.0+, OpenMP 4.5+, CUDA/HIP (si procede) y toolchains optimizados. | MRQ |
| LICSOFT_011 | Se deberán proporcionar licencias para frameworks de IA: TensorFlow, PyTorch, Scikit-learn, XGBoost, y herramientas de MLOps integrables con el flujo de predicción. | TRQ |
<!-- image -->
<!-- image -->
| LICSOFT_012 | El adjudicatario deberá incluir licencias necesarias para la operación del almacenamiento paralelo: drivers, herramientas de gestión, sistemas de ficheros y módulos S3/POSIX/NFS. | MRQ | | |
|---------------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|---------------------------|---------------------------|---------------------------------------|
| LICSOFT_013 | El sistema deberá incluir licencias para las herramientas de transferencia paralela soportadas en los DTN (Globus, GridFTP, FDT, BBcp, Rsync paralelizado). | MQR | | |
| LICSOFT_014 | Se deberán incluir licencias para APIs y herramientas de federación con sistemas externos (ECMWF, EUMETNET, Copernicus) si fueran necesarias para flujos automáticos. | MRQ | | |
| LICSOFT_015 | Todas las licencias deberán ser válidas durante la vigencia completa del contrato y permitir actualizaciones de seguridad sin coste adicional. | MRQ | | |
| LICSOFT_016 | El adjudicatario deberá entregar documentación completa de licenciamiento, claves, derechos de uso y procedimientos de reinstalación. | MRQ | | |
| LICSOFT_017 | No se admitirán dependencias de software que no estén cubiertas por licencias suministradas en la oferta económica. | MRQ | | |
| Requisitos apartado 2.4.2 | Requisitos apartado 2.4.2 | Requisitos apartado 2.4.2 | Requisitos apartado 2.4.2 | Requisitos apartado 2.4.2 |
| Requisitos | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| LICSOFT_018 | Sistema operativo de los nodos de cómputo: El sistema operativo de los nodos de cómputo será Linux de 64 bits, versión 6.8 o superior, soportando administración remota, arranque por red (PXE) e instalación por red de imágenes del sistema. La misma versión de Linux deberá estar presente en todos los nodos de las particiones de cómputo y acceso (login y visualización), asegurando la homogeneidad operativa y la compatibilidad con el software | MQR | | |
<!-- image -->
<!-- image -->
| | meteorológico y climatológico de AEMET. | |
|-------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| LICSOFT_019 | Sistema operativo de los nodos de administración: El sistema operativo de los nodos de administración será Linux de 64 bits, versión 6.8 o superior, con soporte completo y mantenimiento de seguridad a largo plazo (LTS). Los componentes críticos deberán contar con soporte oficial y compatibilidad garantizada con las herramientas de gestión | MQR |
| LICSOFT_020 | corporativas de AEMET. Sistema operativo de los nodos front-end (login y visualización): El sistema operativo será Linux 64 bits, versión 6.8 o superior, con soporte para administración remota, arranque por red e instalación por imagen. Deberá permitir la instalación inmediata de parches de seguridad, incluso durante los ciclos operativos, sin afectar a la producción meteorológica. | MQR |
| LICSOFT_021 | Gestión de usuarios e integración LDAP corporativo: Se podrán utilizar cuentas NIS con la posibilidad de que la infraestructura pueda integrarse con el servicio de directorio corporativo LDAP,SSSD,IdM o compatible con IdP corporativo, garantizando autenticación centralizada y alta disponibilidad, evitando puntos únicos de fallo. El sistema deberá respetar las políticas de seguridad establecidas por AEMET, y permitir la segmentación por roles y unidades funcionales. | MQR |
<!-- image -->
<!-- image -->
| LICSOFT_022 | Compatibilidad con cargas de trabajo en contenedores: El sistema deberá permitir la creación y ejecución remota de aplicaciones en contenedores, tanto para cargas de trabajo HPC como para procesos de IA o análisis de datos, garantizando aislamiento y seguridad. Se admitirá al menos un formato conforme a la Open Container Initiative (OCI v1.1.0 o superior) o Singularity/Apptainer. Deberá incluir herramientas para la gestión, construcción y control de acceso basado en roles (RBAC), conforme a las políticas de seguridad de AEMET. | MQR |
|---------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| LICSOFT_023 | Compatibilidad con estándares de programación: El entorno deberá incluir compiladores y librerías actualizadas que soporten los siguientes estándares: • MPI v4.0 o posterior • C ISO/IEC 9899:2011 o posterior • C++ ISO/IEC 14882:2014 o posterior • Fortran ISO/IEC 1539-1:2010 (Fortran 2008) o posterior • OpenMP 4.5 o posterior. El entorno de programación incluirá pilas de software completas para CPU, incluyendo C, C++ y Fortran, compatibles con los modelos meteorológicos y climatológicos operativos de AEMET. | MQR |
| LICSOFT_024 | Profiling de carga ligera: La infraestructura deberá proporcionar mecanismos de perfilado de rendimiento (profiling) activables por los usuarios durante la ejecución de trabajos. Deberá proporcionar métricas por proceso, trabajo y nodo, con impacto inferior al 5 %enel rendimiento. Se recopilarán datos sobre utilización de CPU, memoria, E/S, red y bibliotecas de comunicación (MPI), sin requerir instrumentación | MQR |
161
<!-- image -->
<!-- image -->
| | explícita por parte del usuario. La recopilación deberá realizarse mediante herramientas compatibles con entornos Linux estándar (p. ej., Perf, LIKWID, PMPI wrappers, o equivalentes). | |
|-------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| LICSOFT_025 | Generación de informes de rendimiento: El sistema deberá incluir herramientas y/o APIs para generar informes de rendimiento del gestor de cargas de trabajo (WLM) y de los trabajos ejecutados, configurables en nivel de detalle y alcance (por usuario, grupo o nodo). Se valorará la integración con los sistemas corporativos de AEMET (DynaTrace, Zabbix) y la posibilidad de enviar notificaciones o resúmenes automáticos por correo electrónico. | MQR |
| LICSOFT_026 | Librerías numéricas optimizadas: Se deberán incluir librerías altamente optimizadas para rutinas BLAS, LAPACK y ScaLAPACK, junto con una biblioteca de transformadas rápidas de Fourier (FFT), optimizadas para la arquitectura seleccionada. Las bibliotecas deberán estar disponibles mediante compiladores estándar y modulares en el entorno de ejecución. | MQR |
| LICSOFT_027 | Depuración y análisis paralelo: El entorno de software deberá incluir un depurador paralelo y generador de perfiles adecuado para la depuración de aplicaciones HPC, con licencia mínima para 8 nodos de cómputo. Deberá soportar entornos multihilo y MPI, y generar información trazable sobre rendimiento y uso de recursos. | MQR |
<!-- image -->
<!-- image -->
| LICSOFT_028 | Contadores de hardware: El sistema deberá incluir contadores de hardware accesibles (CPU y, en su caso, GPU) mediante herramientas como LIKWID, Perf o equivalentes, permitiendo recopilar automáticamente métricas de rendimiento por trabajo o proceso. Los resultados deberán integrarse con los sistemas de monitorización de AEMET y con las herramientas de profiling del entorno. | MQR |
|---------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| LICSOFT_029 | Software para provisión de servicios de IA y analítica avanzada: Se valorará la inclusión de soluciones software y librerías que faciliten la integración de cargas de IA y aprendizaje automático con flujos de trabajo HPC y operativos. Estas soluciones deberán permitir la orquestación de cargas híbridas (entrenamiento, inferencia y simulación) en un entorno común, soportando librerías de IA como TensorFlow, PyTorch, Scikit-learn o XGBoost, e integrarse con los pipelines del sistema de predicción operativa. | TQR |
| LICSOFT_030 | Reproducibilidad numérica: El entorno de ejecución y las librerías matemáticas deberán permitir reproducibilidad numérica determinista para las aplicaciones operativas, garantizando resultados idénticos (bit-a-bit) bajo las mismas condiciones de entrada, incluso cuando se modifique el número de procesos MPI u OpenMP en los límites tolerados por los modelos numéricos. El adjudicatario deberá documentar cualquier caso en el que esta propiedad no pueda garantizarse, así como las librerías o configuraciones involucradas. | MQR |
<!-- image -->
<!-- image -->
| LICSOFT_031 | Librerías científicas obligatorias: El entorno de software deberá incluir, compiladas y optimizadas para la arquitectura ofertada, las librerías científicas utilizadas por los modelos meteorológicos y climatológicos operativos de AEMET, incluyendo al menos: NetCDF, Parallel-NetCDF, HDF4/HDF5, CDO/CDI, Jasper, GDAL, ecCodes, ODB/ODB_API, ecFlow, Boost C++, ncview, así como los intérpretes Perl, Python y R con sus librerías científicas asociadas. Todas deberán integrarse como módulos cargables (Lmod) y mantenerse actualizadas durante el periodo de garantía y soporte. | MQR | | |
|---------------------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|---------------------------|---------------------------|---------------------------|
| LICSOFT_032 | Compatibilidad en mezcla de lenguajes: El adjudicatario deberá garantizar la interoperabilidad entre aplicaciones que combinen módulos en Fortran, C y C++, indicando las posibles restricciones, flags de compilación y penalizaciones de rendimiento. La documentación incluirá recomendaciones oficiales de compilación para garantizar estabilidad, rendimiento y reproducibilidad en los modelos numéricos de AEMET. | MQR | | |
| LICSOFT_033 | Coherencia entre compiladores del benchmark y los operativos: Los compiladores, bibliotecas MPI y librerías matemáticas usadas en las pruebas de rendimiento (benchmark) deberán ser idénticas a las utilizadas posteriormente en producción, salvo actualización justificada y acordada con AEMET. Cualquier divergencia deberá ser evaluada y aprobada por la Unidad de Coordinación de Telemática. | MQR | | |
| Requisitos apartado 2.4.3 | Requisitos apartado 2.4.3 | Requisitos apartado 2.4.3 | Requisitos apartado 2.4.3 | Requisitos apartado 2.4.3 |
<!-- image -->
<!-- image -->
| Requisitos | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------------|------------------|-----------------------------------------|
| LICSOFT_035 | Sistema operativo en nodos de cómputo: Los nodos de cómputo del clúster externo deberán ejecutar Linux 64 bits, versión 6.8 o superior, con soporte para administración remota, arranque PXE e instalación por red. Deberá garantizarse la homogeneidad con la versión instalada en el CPD de AEMET, permitiendo la portabilidad completa de cargas HPC e IA. | MRQ | | |
| LICSOFT_036 | Sistema operativo en nodos de administración: Los nodos de servicio deberán ejecutar Linux 64 bits, versión 6.8+ LTS, con soporte oficial y compatibilidad garantizada con las herramientas de gestión corporativas, incluidas las integraciones multiclúster (federación Slurm u otros). | MRQ | | |
| LICSOFT_037 | Sistema operativo en nodos front- end: Los nodos de login y visualización deberán ejecutar Linux 64 bits, versión 6.8 o superior, permitiendo la instalación inmediata de parches de seguridad sin afectar a servicios operativos ni a la planificación federada. | MRQ | | |
| LICSOFT_038 | Integración con LDAP/IdP corporativo: El clúster externo utilizará cuentas NIS con la posibilidad de integrarse con el sistema de identidad de AEMET LDAP,SSSD,IdM o compatible con IdP corporativo garantizando autenticación centralizada, alta disponibilidad y ausencia de puntos únicos de fallo. Deberá respetar políticas de seguridad de AEMET y segmentación multiusuario. | MRQ | | |
| LICSOFT_039 | Compatibilidad con contenedores: La solución deberá permitir la creación, gestión y ejecución de contenedores (OCI, Singularity/Apptainer), con | MRQ | | |
165
<!-- image -->
<!-- image -->
| | aislamiento seguro, RBAC y soporte para cargas HPC y GPU. Deberá incluir repositorio de imágenes y herramientas de construcción en front-end. | |
|-------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| LICSOFT_040 | Compatibilidad con estándares de programación: El entorno deberá incluir compiladores y librerías que soporten: MPI v4.0+, C11+, C++14+, Fortran 2008+, OpenMP 4.5+, así como stacks completos de programación para CPU y GPU. | MRQ |
| LICSOFT_041 | Profiling ligero: El sistema deberá permitir profiling ligero con impacto < 5 %del rendimiento, recopilando métricas de CPU, GPU, red, memoria, E/S y MPI, sin instrumentación explícita. Herramientas compatibles: Perf, LIKWID, Nsight, PMPI wrappers, | MRQ |
| LICSOFT_042 | etc. Informes de rendimiento: Se deberán proporcionar herramientas/API para generación de informes del gestor de cargas (WLM), incluyendo métricas por usuario, grupo o trabajo. Se valorará integración con herramientas corporativas como DynaTrace o Prometheus. | MRQ |
| LICSOFT_043 | Bibliotecas numéricas optimizadas: El sistema deberá incluir librerías BLAS, LAPACK, ScaLAPACK y FFT optimizadas para CPU y GPU, con versiones específicas para la arquitectura del clúster externo. | MRQ |
| LICSOFT_044 | Depuración paralela: El entorno deberá incluir depurador paralelo con licencia para al menos 8 nodos, con soporte MPI, multihilo y GPU, permitiendo análisis y diagnóstico reproducible entre clústeres federados. | MRQ |
| LICSOFT_045 | Contadores de hardware: El sistema deberá incluir herramientas de acceso a contadores hardware (CPU/GPU), integrables con monitorización corporativa, permitiendo medir | MRQ |
<!-- image -->
<!-- image -->
| | automáticamente métricas de trabajos HPC/IA. | | | |
|---------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|---------------------------|---------------------------|---------------------------------------|
| LICSOFT_046 | Software para servicios de IA y analítica avanzada: Se valorará la inclusión de librerías y frameworks que faciliten IA+HPC: TensorFlow, PyTorch, XGBoost, Scikit-learn, JAX, RAPIDS, así como herramientas MLOps compatibles con los pipelines operativos de AEMET. | MQR | | |
| Requisitos apartado 2.4.3 | Requisitos apartado 2.4.3 | Requisitos apartado 2.4.3 | Requisitos apartado 2.4.3 | Requisitos apartado 2.4.3 |
| Requisitos | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| TOOLSET_001 | El adjudicatario deberá proporcionar herramientas de monitorización avanzada para ambos clústeres, integrables con Zabbix, Prometheus, Grafana y Dynatrace, y compatibles con APIs estándar (REST, Redfish, SNMP). | MRQ | | |
| TOOLSET_002 | Las herramientas deberán permitir visualizar estado del hardware, red, almacenamiento, colas delWLMy métricas energéticas. | MRQ | | |
| TOOLSET_003 | El adjudicatario deberá proporcionar un conjunto completo de herramientas de depuración paralela (DDT, gdb/mpi o equivalentes) para CPU y GPU. | MRQ | | |
| TOOLSET_004 | Se deberán incluir herramientas de profiling ligero y avanzado, compatibles con LIKWID, Perf, VTune, NSight o equivalentes. | MRQ | | |
| TOOLSET_005 | Las herramientas deberán permitir la optimización de modelos meteorológicos y climatológicos mediante análisis de rendimiento. | TRQ | | |
| TOOLSET_006 | El adjudicatario deberá proporcionar herramientas para migración de cargas entre clúster interno y externo, incluyendo sincronización de entornos, contenedorización y testing automático. | MRQ | | |
| TOOLSET_007 | Se deberán disponer mecanismos para validar la coherencia entre | MRQ | | |
<!-- image -->
<!-- image -->
| | entornos CPU/GPU y entre ambos CPDs. | | | |
|----------------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|----------------------------|----------------------------|---------------------------------------|
| TOOLSET_008 | El adjudicatario deberá proporcionar materiales formativos, guías, repositorios y talleres para usuarios HPC e IA. | TRQ | | |
| TOOLSET_009 | Deberán incluirse herramientas de benchmarking estándar (HPL, HPL- MxP, IOR, IOZone) para validación periódica. | MRQ | | |
| TOOLSET_010 | El adjudicatario deberá entregar scripts automatizados o playbooks para validación de rendimiento tras actualizaciones o incidencias. | TRQ | | |
| TOOLSET_011 | Las herramientas deberán ser compatibles con el ecosistema de seguridad de AEMET, cumpliendo requisitos de seguridad, trazabilidad y control de acceso. | MRQ | | |
| TOOLSET_012 | Las herramientas deberán ser actualizables sin afectar al servicio, pudiendo desplegarse en modo rolling upgrade. | TRQ | | |
| TOOLSET_013 | Todas las herramientas deberán estar disponibles tanto en el clúster interno como en el externo, en versiones equivalentes. | MRQ | | |
| TOOLSET_014 | El adjudicatario deberá proporcionar soporte para la instalación, actualización y optimización de estas herramientas durante toda la vigencia del contrato. | MRQ | | |
| Requisitos apartado 2.6.10 | Requisitos apartado 2.6.10 | Requisitos apartado 2.6.10 | Requisitos apartado 2.6.10 | Requisitos apartado 2.6.10 |
| Requisitos | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| CPDEXT_001 | El adjudicatario deberá proporcionar un servicio de housing profesional en un CPD con disponibilidad equivalente a Tier III o superior, garantizando operación continua 24×7×365 y asegurando condiciones ambientales, eléctricas y de seguridad adecuadas para hardware HPC y GPU de alta densidad. | MRQ | | |
<!-- image -->
<!-- image -->
| CPDEXT_002 | El CPD deberá disponer de racks dedicados a AEMET, de al menos 42U, aptos para equipamiento HPC/GPU y DTN, con puertas perforadas, control de accesos y disponibilidad total de la unidad de rack. | MRQ |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| CPDEXT_003 | Cada rack deberá soportar una potencia mínima continua ≥ 40 W, ampliable a 60-80 kW en configuraciones de alta densidad o presencia de nodos GPU. | MRQ |
| CPDEXT_004 | En caso de existencia de suelo técnico, deberá contar con capacidad de carga ≥ 12 kN/m² y una altura mínima de 60 cm, permitiendo circulación de aire frío o cableado inferior sin restricciones. | MRQ |
| CPDEXT_005 | El CPD deberá garantizar un confinamiento térmico adecuado mediante pasillos frío/caliente u otras soluciones equivalentes que eviten mezcla de flujos y aseguren eficiencia energética estable. | MRQ |
| CPDEXT_006 | El CPD deberá disponer de dos ramas de alimentación eléctrica completamente independientes (A/B), disponibles en todos los racks de AEMET, incluyendo PDUs inteligentes. | MRQ |
| CPDEXT_007 | La alimentación eléctrica deberá estar respaldada por sistemas UPS redundantes con autonomía suficiente para absorciones de cortes de red y permitir la entrada en carga de generadores. | MRQ |
| CPDEXT_008 | El CPD deberá contar con generadores diésel con arranque automático y autonomía prolongada que permita mantener la operación del clúster durante interrupciones prolongadas del suministro. | MRQ |
| CPDEXT_009 | La disponibilidad eléctrica mínima será ≥ 99,982% (Tier III) incluyendo líneas, UPS y generación auxiliar. | MRQ |
| CPDEXT_010 | La refrigeración deberá garantizar una capacidad mínima ≥ 40kW por | MRQ |
<!-- image -->
<!-- image -->
| | rack y estabilidad térmica frente a cargas sostenidas HPC/GPU. | |
|------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| CPDEXT_011 | El sistema de climatización deberá ser N+1 o superior y cumplir con ASHRAE TC9.9 Clase A1/A2 en temperatura y humedad. | MRQ |
| CPDEXT_012 | El CPD deberá permitir, sin restricciones, la instalación futura de refrigeración líquida (DLC) o rear-door cooling si el hardware de AEMET así lo requiriera. | TRQ |
| CPDEXT_013 | El adjudicatario deberá proporcionar doble acometida de fibra hasta el MMR/PMR del CPD externo, destinada a la interconexión IXCPD suministrada igualmente por la adjudicataria. | MRQ |
| CPDEXT_014 | La conectividad aportada hacia la interconexión IXCPD deberá soportar capacidades iniciales ≥ 100-200 Gb/s, ampliables a ≥ 400 Gb/s sin rediseños estructurales. | MRQ |
| CPDEXT_015 | El CPD deberá soportar transporte de redes L2 extendidas únicamente cuando la arquitectura lo requiera para DTN, gestión o replicación. No será necesario soportar Fabric HPC ni redes de muy baja latencia. | MRQ |
| CPDEXT_016 | La separación lógica del tráfico deberá garantizarse mediante VLAN, QinQ, VRF u otros mecanismos equivalentes, asegurando aislamiento entre redes de gestión, almacenamiento, DTN y servicios. | MRQ |
| CPDEXT_017 | El adjudicatario deberá suministrar los switches de borde necesarios para integrar las redes internas del clúster externo con los puntos de interconexión IXCPD y con el backbone del CPD externo. | MRQ |
| CPDEXT_018 | El acceso físico a la sala y racks asignados deberá estar controlado mediante sistemas biométricos o equivalentes con trazabilidad completa y registros auditables. | MRQ |
| CPDEXT_019 | Todas las áreas donde se aloje equipamiento de AEMET deberán | MRQ |
<!-- image -->
<!-- image -->
| | disponer de CCTV 24×7 con retención mínima de 90 días. | |
|------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| CPDEXT_020 | El CPD deberá contar con detección temprana VESDA y extinción mediante agentes limpios sin daño para equipamiento electrónico. | MRQ |
| CPDEXT_021 | La adjudicataria deberá proporcionar servicio de smart- hands 24×7 con tiempos de intervención ≤ 30 minutos en incidencias críticas. | MRQ |
| CPDEXT_022 | El personal del CPD deberá poder realizar tareas básicas de operación bajo instrucción de AEMET, incluyendo recableado simple, comprobaciones visuales y reinicios controlados. | MRQ |
| CPDEXT_023 | El adjudicatario deberá proporcionar monitorización continua de energía, clima, red y seguridad física, con panel de control accesible por AEMET. | MRQ |
| CPDEXT_024 | Los eventos críticos deberán generar alertas automáticas a AEMET en un plazo máximo de 15 minutos. | MRQ |
| CPDEXT_025 | Se deberán emitir informes mensuales de operación, mantenimiento, incidencias, energía, climatización y accesos físicos. | MRQ |
| CPDEXT_026 | El CPD deberá cumplir los requisitos del ENS en categoría MEDIA en su componente de instalaciones físicas y control de accesos. | MRQ |
| CPDEXT_027 | El adjudicatario deberá aportar toda la documentación necesaria para auditorías PRTR y cumplimiento DNSH, incluyendo certificaciones ambientales. | MRQ |
| CPDEXT_028 | El entorno deberá permitir compatibilidad de software, portabilidad de contenedores y coherencia operativa con el clúster interno, sin exigir latencias de Fabric. | MRQ |
<!-- image -->
<!-- image -->
| CPDEXT_029 | La interconexión IXCPD deberá permitir la replicación asíncrona de datos, la transferencia masiva desde DTN y el acceso seguro a servicios corporativos, sin requerir ejecución HPC distribuida ni compatibilidad RDMA extremo-a- extremo. | MRQ | | |
|----------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|----------------------------|----------------------------|---------------------------------------|
| CPDEXT_030 | El servicio no deberá imponer restricciones que afecten a la operación autónoma del clúster externo, la portabilidad del software, el acceso a contenedores o la replicación de datos entre CPDs. | MRQ | | |
| CPDEXT_031 | El adjudicatario deberá permitir auditorías y visitas técnicas por parte de AEMET y organismos reguladores con preaviso razonable. | MRQ | | |
| CPDEXT_032 | Todo el cableado, paneles y puertos deberán estar correctamente etiquetados conforme a UNE-EN 50174. | MRQ | | |
| CPDEXT_033 | El CPD deberá garantizar rutas diversas para energía, fibra, refrigeración y cableado, evitando puntos únicos de fallo estructurales. | MRQ | | |
| CPDEXT_034 | Las instalaciones deberán contar con protección frente a inundaciones, sistemas de drenaje y detección de fugas. | MRQ | | |
| CPDEXT_035 | Toda la documentación se entregará en español, actualizada durante la vigencia del contrato, e incluirá manuales, protocolos, incidencias y certificaciones. | TRQ | | |
| Requisitos apartado 2.6.10 | Requisitos apartado 2.6.10 | Requisitos apartado 2.6.10 | Requisitos apartado 2.6.10 | Requisitos apartado 2.6.10 |
| Requisitos | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| OPSYS_001 | El adjudicatario deberá proporcionar un servicio de administración integral y explotación 24×7×365 para ambos clústeres (interno y externo), garantizando operación continua, disponibilidad del servicio y | MRQ | | |
172
<!-- image -->
<!-- image -->
| | supervisión permanente de todos los componentes HPC, de red y de almacenamiento. | |
|-----------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| OPSYS_002 | El servicio incluirá tareas diarias de operación: control y verificación del estado de nodos, colas y servicios; gestión de incidencias; revisión sistemática de logs; aplicación planificada de parches y actualizaciones; control de estabilidad del entorno HPC; y validación de que el clúster permanece operativo para cargas meteorológicas, climatológicas y de IA. | MRQ |
| OPSYS_003 | El adjudicatario deberá administrar el planificador SLURM (o equivalente), gestionando políticas de colas, prioridades, QoS, límites de usuario, políticas energéticas, ejecución federada entre clústeres, mecanismos de backfill y configuración de particiones CPU/GPU, asegurando la coherencia con el entorno operativo de AEMET. | MRQ |
| OPSYS_004 | Se deberá proporcionar monitorización continua del sistema HPC y de la interconexión entre CPDs, incluyendo métricas de nodos, Fabric, DTN, almacenamiento, contenedores y redes MNG/OOB. La monitorización se integrará con Zabbix, Prometheus, Grafana, Dynatrace y las plataformas corporativas que indique AEMET. | MRQ |
| OPSYS_005 | El servicio ofrecerá soporte técnico L1, L2 y L3, incluyendo escalado directo a fabricantes (CPU, GPU, almacenamiento, red, software científico). El adjudicatario deberá garantizar tiempos de respuesta y resolución acordes con las necesidades operativas de AEMET. | MRQ |
<!-- image -->
<!-- image -->
| OPSYS_006 | El adjudicatario deberá realizar mantenimiento preventivo y correctivo, siguiendo procedimientos documentados, garantizando continuidad operativa, trazabilidad de actuaciones y cumplimiento de seguridad de AEMET. El mantenimiento cubrirá hardware, firmware, BIOS, drivers y software base del sistema. | MRQ |
|-------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| OPSYS_007 | El servicio incluirá administración avanzada de redes HPC: Fabric, redes Ethernet de almacenamiento, redes de gestión MNG-IB, red OOB y transporte por IX-CPDs. Se deberán optimizar parámetros RDMA/Ethernet, latencias, colas y mecanismos de QoS para garantizar máximo | MRQ |
| OPSYS_008 | rendimiento. El adjudicatario deberá gestionar y mantener el almacenamiento paralelo multitier del sistema, incluyendo Hot Tier, Cold Tier y Data Movers, asegurando disponibilidad, rendimiento, consistencia POSIX, snapshots, cuotas, QoS y replicación entre los dos clústeres mediante IX-CPDs. | MRQ |
| OPSYS_009 | Los expertos del adjudicatario deberán gestionar el ciclo de vida completo del software HPC: toolchains, compiladores, MPI, librerías optimizadas, módulos Lmod, contenedores OCI/Singularity y repositorios de imágenes. Deberán garantizar reproducibilidad, compatibilidad y estabilidad entre ambos clústeres. | MRQ |
| OPSYS_010 | Se deberá realizar actualización coordinada de firmware, BIOS, firmwares de GPU, drivers, microcódigos, switches y software base, aplicando ventanas de mantenimiento programadas, manteniendo el servicio estable y evitando interrupciones no planificadas. | MRQ |
<!-- image -->
<!-- image -->
| OPSYS_011 | Se valorará habilitar un canal de soporte experto para usuarios avanzados de HPC y IA, integrado con los sistemas de ticketing corporativos de AEMET (ServiceNow o los que se indiquen). El soporte incluirá dudas técnicas, optimización de jobs, compilación y uso eficiente del clúster. | TRQ |
|-------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| OPSYS_012 | Se valorará la formación continua a administradores y usuarios avanzados de AEMET en HPC, IA, MLOps, contenedores, redes de alto rendimiento, compilación optimizada y buenas prácticas de uso del sistema. | TRQ |
| OPSYS_013 | Se valorará la generación de informes mensuales de operación, que deberán incluir: disponibilidad, rendimiento, incidencias, eventos de red, monitorización de DTN, consumo energético, métricas del WLM, optimización del uso del clúster y recomendaciones de mejora. | TRQ |
| OPSYS_014 | Se valorará proporcionar asistencia técnica completa en auditorías, de seguridad, PRTR, DNSH y revisiones de seguridad o conformidad normativa, aportando documentación, evidencias y registros requeridos por AEMET o por organismos reguladores. | TRQ |
| OPSYS_015 | El servicio deberá permitir operación en modo contingente, ajustando dinámicamente los recursos ante restricciones eléctricas, térmicas o de red. El adjudicatario configurará políticas de degradación controlada que mantengan la operación esencial y prioricen cargas críticas de AEMET. | MRQ |
| OPSYS_016 | El adjudicatario deberá proporcionar dos especialistas HPC, al menos uno in situ en el CPD interno, en horario laboral de lunes a viernes, dedicados a la supervisión, operación diaria, soporte a usuarios, pruebas, | MRQ |
175
<!-- image -->
<!-- image -->
| | compilación, optimización y mejoras de rendimiento del entorno. | |
|-----------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|------|
| OPSYS_017 | El adjudicatario deberá dar soporte técnico completo a la cadena operativa de AEMET, asistiendo en la instalación, configuración, optimización y validación funcional de todas las aplicaciones meteorológicas, climatológicas y de IA que se desplieguen en ambos clústeres. | MRQ |
| OPSYS_018 | El adjudicatario deberá proporcionar soporte especializado para la migración de aplicaciones desde el HPC actual al nuevo sistema, incluyendo adaptación de código, ajustes de compilación, validación científica, comparación numérica y optimización del | MRQ |
| OPSYS_019 | Durante toda la vigencia del contrato, el adjudicatario será responsable de mantener en perfecto estado de funcionamiento los equipos y sistemas en explotación, asegurando que todos los elementos de hardware y software operan conforme a las condiciones exigidas para cada fase del contrato. | MRQ |
| OPSYS_020 | El adjudicatario deberá proporcionar servicios smart-hands 24×7 en el CPD externo, incluyendo operaciones físicas, recableado, reposición de componentes y asistencia a intervenciones técnicas bajo instrucción de AEMET. | MRQ |
| OPSYS_021 | El licitador deberá aportar un Plan de Administración Integral del Sistema, detallando roles, turnos, herramientas, procedimientos y puntos de contacto para la operación 24×7 de ambos clústeres. | INFO |
| OPSYS_022 | El licitador deberá proporcionar una Descripción de su Sistema de Ticketing, integración con | INFO |
<!-- image -->
ServiceNow/AEMET, niveles de servicio ofrecidos y tiempos máximos de respuesta y resolución para L1/L2/L3.
| Requisitos apartado 2.8.1 | Requisitos apartado 2.8.1 | Requisitos apartado 2.8.1 | Requisitos apartado 2.8.1 | Requisitos apartado 2.8.1 |
|-----------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----------------------------|-----------------------------|---------------------------------------|
| Requisitos | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| TRAINING_001 | El adjudicatario deberá proporcionar un plan de formación completo y estructurado para administradores HPC, personal científico y técnicos de AEMET dividido en los módulos indicados en el apartado 2.8 | MRQ | | |
| TRAINING_002 | Se deberá impartir formación específica en administración avanzada del clúster, incluyendo SLURM (o equivalente), políticas de QoS, colas, particiones y federación de recursos. | MRQ | | |
| TRAINING_003 | La formación deberá incluir operación y mantenimiento de redes Fabric, redes de gestión (IB/OOB), almacenamiento de altas prestaciones y contenedorización HPC. | MRQ | | |
| TRAINING_004 | El adjudicatario deberá impartir formación específica sobre optimización de modelos meteorológicos y climatológicos y uso eficiente del sistema HPC. | TRQ | | |
| TRAINING_005 | Deberán impartirse sesiones específicas sobre herramientas de desarrollo, profiling, depuración y análisis de rendimiento. | MRQ | | |
| TRAINING_006 | Se deberá incluir formación práctica sobre el uso seguro y eficiente de entornos de IA, flujos de MLOps y gestión de cargas híbridas HPC+IA. | TRQ | | |
| TRAINING_007 | El adjudicatario deberá incluir módulos de formación sobre operación híbrida entre CPD AEMET, CPD externo y multicloud, incluyendo federación de colas y migración de cargas. | MRQ | | |
<!-- image -->
<!-- image -->
<!-- image -->
| TRAINING_008 | Se deberán entregar materiales formativos completos: presentaciones, manuales, ejercicios, ejemplos y documentación adaptada al entorno de AEMET. | MRQ | | |
|---------------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|---------------------------|---------------------------|---------------------------------------|
| TRAINING_009 | Los materiales formativos deberán entregarse en castellano. Se admitirán documentos técnicos en inglés con guía complementaria traducida. | MRQ | | |
| TRAINING_010 | El adjudicatario deberá entregar certificados de aprovechamiento para los participantes en cada módulo de formación. | TRQ | | |
| TRAINING_011 | La formación deberá combinar sesiones presenciales, teleformación y prácticas en entornos reales o en entornos aislados dedicados. | TRQ | | |
| Requisitos apartado 2.9.1 | Requisitos apartado 2.9.1 | Requisitos apartado 2.9.1 | Requisitos apartado 2.9.1 | Requisitos apartado 2.9.1 |
| Requisitos | Descripción | Categoría | Cumple (Sí/No) | Referencia a página de oferta técnica |
| UNDEPLOY_001 | Suministro completo del equipamiento: El adjudicatario deberá suministrar todo el hardware, software, componentes auxiliares, cableado, racks, accesorios y materiales necesarios para la puesta en marcha funcional del clúster interno y externo, conforme a las especificaciones técnicas definidas. | MRQ | | |
| UNDEPLOY_002 | Instalación en ambos CPDs: El adjudicatario deberá realizar la instalación física y lógica del equipamiento en el CPD de AEMET y en el CPD externo, garantizando la correcta ubicación en racks, conexionado eléctrico, cableado estructurado y etiquetado uniforme conforme a estándares TIA/EIA. | MRQ | | |
| UNDEPLOY_003 | Integración con las redes existentes: La instalación incluirá la integración del sistema con todas las redes funcionales (Fabric, Gestión IB/OOB, Almacenamiento, | MRQ | | |
178
<!-- image -->
<!-- image -->
| | Interconexión con Backbone IX- CPDs), asegurando compatibilidad, direccionamiento coherente y verificación de redundancia. | |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| UNDEPLOY_004 | Pruebas de instalación (IQ/OQ): Tras la instalación, se deberán ejecutar pruebas formales de Instalación (Installation Qualification - IQ) y pruebas de Operatividad (Operational Qualification - OQ) que validen conectividad, estabilidad, potencia, refrigeración y funcionamiento básico. | MRQ |
| UNDEPLOY_005 | Integración software inicial: El adjudicatario deberá instalar, configurar y dejar operativo el sistema operativo, planificador de colas, herramientas de gestión, monitorización y librerías base necesarias para la operación inicial del clúster. | MRQ |
| UNDEPLOY_006 | Documentación de instalación: Se deberá entregar documentación completa que incluya planos de cableado, inventario detallado, parametrización de red, configuración del BMC, firmware de referencia, imágenes del sistema y versiones del software instalado. | MRQ |
| UNDEPLOY_007 | Etiquetado físico y lógico: Todo el equipamiento (nodos, switches, cables, racks, PDUs) deberá incluir etiquetado claro y duradero conforme al estándar de inventario de AEMET, permitiendo su trazabilidad durante auditorías y mantenimiento. | MRQ |
| UNDEPLOY_008 | Plan de desinstalación futura: El adjudicatario deberá proporcionar un plan detallado para la eventual retirada del sistema (end of life), incluyendo procedimientos de apagado seguro, borrado certificado de datos, desmontaje físico y gestión de residuos RAEE. | TRQ |
<!-- image -->
<!-- image -->
| UNDEPLOY_009 | Desinstalación y retirada de equipamiento previo: En caso de que AEMET lo solicite, el adjudicatario deberá desinstalar y retirar equipamiento existente, garantizando integridad del CPD, sin afectar sistemas en producción. | TRQ |
|----------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|
| UNDEPLOY_010 | Eliminación certificada de datos: En operaciones de retirada, el adjudicatario deberá garantizar el borrado seguro con algoritmos equivalentes a DoD 5220.22-M o sobrescritura criptográfica. | MRQ |
| UNDEPLOY_011 | Gestión RAEE y sostenibilidad: Todo el material retirado deberá gestionarse conforme al RD 110/2015 (RAEE), aportando certificados oficiales de tratamiento y trazabilidad para auditorías PRTR y DNSH. | MRQ |
| UNDEPLOY_012 | Compatibilidad con trabajos en producción: Las tareas de instalación y retirada deberán programarse sin afectar a la operación meteorológica operativa, pudiendo requerir ventanas nocturnas o fines de semana coordinadas con AEMET. | MRQ |
| UNDEPLOY_013 | Coordinación con el servicio IX- CPDs: Para la instalación en el CPD externo, el adjudicatario deberá coordinarse con el proveedor del Lote 3 del Contrato Unificado de Comunicaciones para garantizar conectividad, VLAN, puertos L2/L3 y pruebas end-to-end. | MRQ |
| UNDEPLOY_014 | Integración energética: La instalación deberá considerar las capacidades eléctricas y limitaciones de cada CPD, ajustando los límites de carga por rama, configurando power capping y asegurando balanceo adecuado entre las líneas A/B. | MRQ |
| UNDEPLOY_015 | Integración con la refrigeración existente: Los sistemas deberán instalarse respetando las zonas frías/calientes, flujo de aire, pasillos confinados y restricciones térmicas, así como los requisitos de | MRQ |
180
<!-- image -->
<!-- image -->
| | futuras ampliaciones con refrigeración líquida. | |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| UNDEPLOY_016 | Verificación de redundancia: La instalación deberá demostrar redundancia plena en redes, alimentación, refrigeración y particiones críticas, verificando el funcionamiento en modo 'loss of one feed' y fallo de switch. | MRQ |
| UNDEPLOY_017 | Puesta en marcha conjunta: La entrada en producción del sistema deberá hacerse de forma coordinada entre el adjudicatario, la Unidad de Coordinación de Telemática de AEMET y los equipos del CPD externo, incluyendo pruebas HPC end-to-end. | MRQ |
| UNDEPLOY_018 | Marcaje CE y certificaciones: Todo el hardware deberá entregarse con certificación CE, cumplimiento RoHS, documentación de seguridad eléctrica y certificación DNSH aplicable en PRTR. | MRQ |
Madrid, a la fecha de la firma electrónica
LA PRESIDENTA DE LA AGENCIA ESTATAL DE METEOROLOGÍA María José Rallo del Olmo