Cuando un departamento de ingeniería biomédica empieza a interesarse por observabilidad seria, la primera tentación suele ser la misma: "ya tenemos Datadog (o Prometheus, o Splunk) en el resto del hospital, ¿por qué no enchufamos también los equipos de imagen?". Tiene lógica desde el lado de IT. No funciona desde el lado clínico. Y conviene entender por qué antes de invertir seis meses en una integración que va a llegar tarde.
La observabilidad de IT mide otra cosa
Datadog, Prometheus, Grafana y compañía están construidos sobre tres asunciones que son ciertas en infraestructura genérica:
- Las métricas relevantes son cuantitativas y continuas (CPU, RAM, latencia, errors/sec)
- Los umbrales son universales o configurables por equipo de ops
- La criticidad de un fallo se mide en SLOs y experiencia de usuario
En un servicio de imagen ninguna de las tres se mantiene. Las métricas críticas son discretas y específicas del subsistema — un patrón de degradación del coldhead no es un número que sube, es una secuencia de eventos con contexto. Los umbrales son clínicos: el helio en un MRI con cinco años de operación tolera valores que en un MRI nuevo serían alarma. Y la criticidad se mide en pacientes desplazados, no en SLOs.
El caso del MRI: cuándo Prometheus se queda fuera
Toma un escenario real. Un MRI de 1.5T en un grupo clínico:
- Datadog ve: el servicio DICOM responde, el agente de host está vivo, la red al PACS funciona. Verde.
- El técnico biomédico necesita: nivel de helio, presión del imán, ciclos del compresor en las últimas 72 horas, deriva térmica del cryostat, temperatura ambiental de la sala, estado del coldhead, alertas internas del fabricante de las últimas 24h.
La primera capa es trivial — métricas estándar de host. La segunda no existe en Datadog. Vive en la consola de servicio del fabricante, en formatos propietarios, accesible sólo desde la consola física o desde un endpoint del fabricante con SLAs específicos. Conectar eso a Datadog no es "configurar un agent": es construir un parser por fabricante, mantener un mapping de umbrales clínicos por modelo, y traducir eventos discretos a métricas que tengan sentido en un dashboard genérico. Para cuando lo tienes funcionando, ya has reescrito media plataforma específica de imagen — encima de una herramienta que no fue diseñada para esto.
Datadog para infraestructura, Argus para la flota clínica. Son herramientas distintas y deben coexistir, no competir.
Los tres puntos en los que la observabilidad genérica pincha
Hay tres dimensiones donde una plataforma generalista no cierra el problema clínico:
- Modos de operación: un MRI tiene modos (idle, escaneo, ramping, mantenimiento programado) en los que los mismos valores significan cosas distintas. Helio bajo durante un servicio programado no es alarma. En operación normal, sí. La generalista no distingue.
- Histórico estructurado: una auditoría de equipo a 12 meses requiere correlacionar eventos del fabricante, del software clínico y de la operación humana. Eso es un modelo de dominio, no una consulta a TSDB.
- Alertas accionables: el técnico biomédico no necesita más alertas — necesita alertas con contexto suficiente para decidir si saltar fuera de turno o programarlo para mañana. Eso requiere reglas escritas con criterio clínico, no thresholds genéricos.
Cuándo sí tiene sentido la generalista
No es un rechazo a Datadog ni a Prometheus. Tienen su sitio dentro del mismo hospital:
- Infraestructura de red del PACS, sí
- Servidores de RIS/HIS, sí
- Latencia entre sedes para teleradiología, sí
- Disponibilidad del portal del paciente, sí
Para esa capa, la observabilidad genérica funciona perfectamente. La capa que falla es la específica del equipo clínico — y esa requiere una plataforma diseñada con conocimiento del dominio.
Conclusión
Si tu hospital ya invierte en observabilidad de IT, no la tires. Mantenla para lo que hace bien. Pero no esperes que cubra la flota de imagen — para eso necesitas una capa específica, con parsers por fabricante, umbrales clínicos y un modelo de eventos que entienda los subsistemas. Las dos capas coexisten bien. Intentar forzar una a hacer el trabajo de la otra es como pedirle a un osciloscopio que tome una resonancia.