En esta área de especialización se incluye:
La ingeniería de datos:
- Arquitecturas Big Data: Ecosistema ent-to-end (ingesta, almacenamiento, servicios), Data Lakes, Cloud
- Repositorios no-relacionales (NOSQL): key values (escalabilidad), document stores (flexibilidad), graph databases (topologías), streaming (tiempo real)
- Operacionalización de la gobernanza de datos: generación, mantenimiento i procesamiento de metadatos, gestión masiva de datos, seguridad de datos, monitorización (estáticas i en tiempo real)
|
El análisis de datos:
- Dashboarding y visualización de datos
- Modelos predictivos y de clasificación
- Procesado del lenguaje natural (NLP)
- Visión para Computador (CV)
- Inteligencia artificial avanzada (Deep Learning) en distintos ámbitos
|
Servicios:
- Arquitecturas Big Data para la explotación de información (lambda, kappa…) y frameworks de procesado masivo de datos: Spark, Flink, Beam…
- Data Lakes a medida a diferentes proveedores de Cloud (Google, Amazon i Azure)
- Procesos de gobernanza de datos semi-automáticos, catálogos de datos, pre-procesamiento y preparación de datos
- Repositorios NOSQL especializados: MongoDB, Neo4j, Cassandra, HDFS+Hbase+Spark (y el resto del ecosistema Hadoop), ...
- Modelos de aprendizaje automático (reglas de asociación, métodos lineales supervisados, redes neuronales, máquinas de vector soporte, árboles de decisión/bosques aleatorizados, clustering…)
- Clasificación y regresión
- Algoritmos de predicción
- Modelos de aprendizaje automático específicos: procesado de lenguaje Natural (NLP), procesado de series temporales, procesado de imágenes / visión por computador (CV).
- Software y entornos para el desarrollo de modelos: Mllib, TensorFlow, Pytorch, Keras, scikit-learn, notebooks (Zeppelin, Jupyter) …
- Cálculo de indicadores (KPIs), cuadros de comando y visualización de datos. Uso de herramientas de Business Intelligence para la representación gráfica de análisis descriptivo
- Construcción de analítica en tiempo real (complex-event processing, streaming analytics)