Cómo identificar riesgos en tiempo real con visión artificial

Son las seis de la mañana de 1201. Te levantas para comenzar tu turno como vigilante en el Arsenal de Venecia, tan importante, que dejó algunos de los primeros registros de controles y protocolos para la seguridad en el trabajo.

Esa seguridad recae sobre tus hombros, en un entorno cargado de riesgos: almacenes repletos de pólvora, grúas primitivas, carpinteros con una abundante ración trabajando bajo presión.

Al acercarte a las despensas de pólvora, escuchas un sonido metálico. Algo no encaja. Un operario, ajeno al peligro, golpea con un martillo los clavos de una tabla. Una chispa. Un fogonazo. Silencio.

Despiertas. Es verano de 2025. Agradecido de que muchas cosas hayan cambiado: controles de acceso, formación preventiva, señalética, protección personal… pero el sueño nos anima a preguntarnos, ¿cómo podemos seguir mejorando? ¿Qué nos depara el futuro de la prevención, y como podemos formar parte de él?

Hoy hablamos de una de las tecnologías más potentes y prometedoras en la prevención de riesgos laborales: la inteligencia artificial aplicada a la visión artificial. Porque ahora, conectando una cámara y un ordenador, puedes crear un sistema que observa tu entorno de trabajo las 24 horas, detecta incumplimientos de seguridad en tiempo real, y te proporciona datos objetivos que respaldan tu labor preventiva.

Ya no solo vigilas: demuestras, comunicas y conciencias.

¿Suena bien, verdad? Pues vamos allá.

Primeras pruebas

Una de las cosas que más me gusta de todo esto es que no necesitas un laboratorio sofisticado ni grandes presupuestos para empezar. Hoy tenemos acceso a modelos de inteligencia artificial gratuitos (sí, ¡GRATIS!) disponibles en Internet.

Un buen ejemplo es Moondream, una IA bastante conocida que permite hacer preguntas en lenguaje natural sobre lo que aparece en una imagen. Puedes probarlo tú mismo: súbele una imagen de una persona con casco y pregúntale si lleva su EPI correctamente. Verás cómo te responde de forma razonada y conversacional.

Subimos la imagen, pulsamos en el botón detectar, y le pedimos que busque un casco. Disculpad el abuso del inglés pero funcionan mejor así, pequeño truquiconsejo.

Esto se llama detección de objetos, y es la base para las reglas más simples en visión artificial.

Pero si queremos ir más allá, no basta solo con saber qué objetos hay, sino quién hace qué con ellos. Es decir, identificar la relación entre objetos y personas. Podemos intentarlo desde el propio Moondream:

No esta del todo mal, aunque queríamos que nos cogiera a la persona completa, y en casi todos solo ha seleccionado el casco

La forma más común (y mejor), es utilizar las coordenadas de las detecciones que nos devuelve el propio modelo de IA, que se pueden procesar en un programa personalizado: si un casco está muy cerca de la cabeza de una persona, probablemente lo está usando correctamente, si una persona está dentro de unas coordenadas marcadas como peligrosas, se puede generar una alerta.

¿Tiene buena pinta, verdad? Pues esto es solo el principio. Utilizando técnicas de detección, podemos triunfar en un montón de aplicaciones interesantes. Aquí van algunas de ellas:

Casos de uso

⚠️ Áreas peligrosas y zonas restringidas

Quizá uno de los casos más eficaces y efectivos para empezar. La detección de personas para estos modelos es buenísima: ¿no debería haber nadie en un área por peligro? ¿Debería al menos haber 2 personas por si una se desmaya? Basta marcar coordenadas de zonas seguras/peligrosas y comprobamos que detección cae dentro.

👷‍♂️ Detección de equipos de Protección Individual (EPIs)

Ya lo vimos en el ejemplo del principio, pero podemos seguir añadiendo un sinfín de equipamiento: gafas, chaleco, bata, botas altas… Como explicamos, detectamos las personas y los objetos, agrupando por distancia y superposición. Si al agrupar, alguna persona se queda sin objeto de seguridad, porque está muy lejos, ya tenemos al infractor.

🛠️ Condiciones inseguras (entorno)

Por ejemplo, presencia de obstáculos, distancias a maquinaria demasiado reducidas, falta de protecciones colectivas o LOTOs. Para el primer caso, la verdad es que Moondream hace un muy buen papel, ya que reconoce gran cantidad de objetos sin que tengamos que enseñarle nada, algo que probablemente sirva también con las protecciones colectivas.

🔥 Riesgos dinámicos

Vemos aquí casos como la presencia de fuego, humo, y uno que me gusta mucho, la velocidad de las carretillas elevadoras. La verdad que esos toritos pueden ser una bala, y en manos no adecuadas un tenedor gigante. Para el primer caso, te dejamos que intentes con las herramientas que hemos visto hacer pruebas, mientras que la medición de velocidad tiene más miga: nos obliga en cada instante a calcular la posición del objeto, medir su avance, y dividirlo entre el tiempo, para obtener su velocidad. Estas técnicas suelen estar relacionadas con unas técnicas conocidas como seguimiento o tracking. En la imagen, puedes ver como los objetos dejan una estal roja, es su estela de seguimiento, en cada una de las posiciones que ha ido estando su centro. Con esto calculamos su velocidad, y si supera cierto umbral ¡Alarma!

🧍‍♂️ Posturas y acciones humanas

Para detectar caídas o posiciones inadecuadas, el YOLO presenta una capacidad mágica: permite detectar el “esqueleto” de la persona, para entender mejor si tiene una posición anormal. A esto se le suele llamar estimación de pose, y genera gran interés por todo lo relativo a lesiones y bajas. Adjuntamos una foto, pero como antes, puedes probarlo tú mismo en este enlace.

Eso respecto a posturas. Las acciones pueden tener más enjundia, merecen un artículo casi especial. Hay situaciones simples, como detectar que alguien fuma, que lo podemos saber por el cigarro o el humo. Sin embargo, hay otras situaciones que nos obligan a seguir y clasificar cada momento de las personas que comprobamos. Esto necesita de otra tecnología, y puede complicarse un poco. Mi pequeño truquiconsejo es: si la acción tiene un momento reconocible, ya sea porque se deja un objeto o una postura, detéctala y con eso ya estará identificada. Si necesitas ir analizando toda la secuencia de video, mi mejor consejo es que pruebes con Gemini 2.5

Mejora continua

Durante las pruebas es posible que te hayas encontrado con errores en la detección. Esto es normal. Los modelos generalistas no están entrenados para este tipo de situaciones, y ahora viene su verdadero potencial: pueden entrenarse para especializarlos, volviéndolos expertos con una precisión humana.

Uno de los más empleados para esto, ya que entrenarle es simple y rápido, es el YOLO (también gratuito, yeah). Tan popular que puedes encontrarlo ya preparado con el conocimiento de este tipo de aplicaciones, como en Safe, que ha visto decenas de miles de imágenes para reconocer gran cantidad de situaciones y equipamiento, permitiéndote disfrutar de la máxima precisión y fiabilidad sin perder tiempo. Pero también puedes enseñarles tú de cero. En un futuro artículo, te explicaremos como hacerlo, porque es sencillo, y diría que hasta divertido (al menos las primeras horas)

Y ojo importante: quizá te fijaste que Moondream tardaba varios segundos en darte los resultados de tu consulta. Pero, como se titula el artículo: Cómo identificar riesgos en tiempo real con visión artificial. Prepárate: YOLO detecta los objetos de la imagen en alrededor de 50 milisegundos. Eso permite procesar unos 30 fotogramas por segundo, lo común en la mayoría de cámaras de videovigilancia. ¡Menudo Fórmula 1!

Siguientes pasos

¿Tecnología para vigilar por una cámara? Visto. ¿Aplicar este sistema para revisar reglas que mejoren la seguridad de nuestro entorno? Visto también. ¿Activar una alarma cuando ocurre alguna incidencia que detectamos? ¿Generar un reporte con los resultados para presentarlos en una formación? ¿Gráficas con las tendencias de mejora del personal? Hemos visto como resolver una parte clave: qué está pasando en la imagen, y toca obtener nuestro beneficio, decidiendo qué hacer con ese dato en función de su gravedad, o filtrar la información de mayor interés. Si es que hasta podríamos hasta poner una IA para tapar las caras de la imagen, cumpliendo con la normativa del GDPR. Así que te animamos a que sigas aprendiendo sobre esta tecnología, porque las posibilidades son emocionantes 😀

Reserva una demo de Safe y descubre cómo mejoramos tu prevención de riesgos laborales

Reserva tu demo

Artículos relacionados

Resumen de privacidad
safe

Esta web utiliza cookies para que podamos ofrecerte la mejor experiencia de usuario posible. La información de las cookies se almacena en tu navegador y realiza funciones tales como reconocerte cuando vuelves a nuestra web o ayudar a nuestro equipo a comprender qué secciones de la web encuentras más interesantes y útiles.

Cookies estrictamente necesarias

Las cookies estrictamente necesarias tiene que activarse siempre para que podamos guardar tus preferencias de ajustes de cookies.

Cookies de análisis

Esta web utiliza Google Analytics para recopilar información anónima tal como el número de visitantes del sitio, o las páginas más populares.

Dejar esta cookie activa nos permite mejorar nuestra web.