Descripción de la oferta
Data Scientist page is loaded## Data Scientistlocations: Madrid | C/Raimundo Fernandez Villaverdtime type: Vollzeitposted on: Heute ausgeschriebentime left to apply: Enddatum: 30. April 2026 (Noch 16 Tage Zeit für Bewerbung)job requisition id: JR109279CGM Clinical es la compañía con más instalaciones en España de sistemas de información hospitalarios, de historia clínica electrónica y de ayuda a la decisión.En todo el mundo, CGM implanta sistemas de información a más de 400.000 clientes de 40 países, incluidos 68 hospitales públicos en España.Todos los días, 10.000 empleados de CGM en todo el mundo crean soluciones de Salud Digital innovadoras que ayudan a curar y cuidar a las personas.Actualmente, estamos buscando Científicos/as de Datos con experiencia en entornos Big Data y analítica avanzada para diseñar, desarrollar y desplegar modelos de Machine Learning e IA en el sector sanitario.## **1.1Funciones:**Titulación: Ingeniería en Informática, Biomédica, Telecomunicaciones, Matemáticas, Física, Estadística o similar.• Analizar, preparar y explorar datos clínicos y asistenciales para la construcción de modelos predictivos y prescriptivos.• Diseñar, desarrollar, validar y desplegar modelos de Machine Learning / Deep Learning (clasificación, regresión, series temporales, segmentación, NLP, etc.) utilizando Python y/o Scala.• Desarrollar y mantener notebooks y librerías reutilizables para análisis exploratorio, visualización y prototipado rápido (por ejemplo, con Jupyter, PySpark, Spark MLlib, etc.).• Trabajar con datos de salud estandarizados (HL7/FHIR u otros estándares y codificaciones médicas) para generar datasets de alta calidad orientados a casos de uso clínicos y de negocio.• Documentar experimentos, modelos, datasets y resultados, garantizando trazabilidad y reproducibilidad de los modelos.• Colaborar con equipos de Gobierno del Dato y de IT para asegurar el cumplimiento de normativas de seguridad y privacidad (por ejemplo, anonimización/pseudonimización, RGPD) en el uso de datos de salud.• (Sera un Plus) Conocimientos y experiencia en MLOps: versionado de modelos y datos, automatización de pipelines, monitorización en producción y gestión de drift.**1.2 Requisitos:****Competencias generales:*** Al menos 2 años de experiencia como Científico/a de Datos desarrollando modelos de Machine Learning en entornos productivos, preferiblemente sobre grandes volúmenes de datos (Big Data).* Dominio de Python y/o Scala orientado a ciencia de datos (por ejemplo: pandas, NumPy, scikit-learn, PySpark, Spark MLlib).* Conocimientos sólidos de estadística aplicada, probabilidad y métodos de modelado (regresión, clasificación, árboles de decisión, gradient boosting, clustering, reducción de dimensionalidad, validación cruzada, etc.).* Experiencia en análisis exploratorio de datos, limpieza, tratamiento de valores perdidos, outliers y creación de variables (feature engineering).* Manejo de SQL para extracción y transformación de datos.* Conocimientos de herramientas de desarrollo y control de versiones como Git, GitLab, y uso de notebooks (Jupyter o similares) para el desarrollo de modelos.* Uso habitual de metodologías ágiles (Scrum / Kanban) y herramientas de gestión de tareas como Jira.* Capacidad de comunicación para traducir resultados analíticos complejos en conclusiones comprensibles para perfiles no técnicos (clínicos, negocio).**Competencias específicas:*** Conocimiento de datos de salud (historias clínicas electrónicas, datos de laboratorio, farmacia, episodios asistenciales, etc.).* Familiaridad con estándares de interoperabilidad sanitaria, especialmente HL7/FHIR.* Conocimientos de codificaciones médicas como CIE-9/CIE-10, SNOMED-CT u otras ontologías clínicas.**Valorables / Plus:*** Experiencia en MLOps: CI/CD para modelos, MLflow, herramientas de seguimiento de experimentos, despliegue de modelos como APIs, monitorización de rendimiento y drift.* Experiencia en entornos Big Data (Cloudera Data Platform u otros) y herramientas asociadas (Spark, HDFS, Kafka, NiFi, Hive/Impala).* Experiencia con librerías de Deep Learning (TensorFlow, Keras, PyTorch) y/o NLP aplicadas a texto clínico.* Certificaciones en datos, analítica o plataformas cloud (por ejemplo, Cloudera, AWS, Azure, GCP) serán valoradas positivamente.-Empleo estable en un sector con un gran potencial de desarrollo. -Beneficios sociales (seguro médico y cheque comida). -Formación continua para tu desarrollo profesional. -Flexibilidad laboral. -Modelo híbrido de trabajo (con gran % de jornada en formato teletrabajo).
#J-18808-Ljbffr