EventosMachine Learning

Descubre las nuevas tendencias en Big Data & Analytics en el INNODATA BCN 2019

Esta semana he asistido al Innodata BCN 2019, el primer congreso de Big Data & Analytics organizado por datahack, empresa de formación, consultoría y headhunting, todo relacionado con la analítica de datos.

El evento ha sido todo un éxito con más de 400 asistentes con diferentes perfiles: profesionales del mundo del análisis de datos, estudiantes del Máster de Big Data & Analytics de datahack, profesores del Máster y estudiantes de otras áreas de la informática que querían entender en que consistía este mundo del Big Data y Análisis de Datos.

Las ponencias del evento

La primera parte del evento ha consistido en 4 ponencias de profesores del Máster de datahack, que además son profesionales de empresas como Telefónica, Trovit o empleados de la propia compañía. La verdad es que el nivel de los ponentes ha sido alto, lo que nos da una idea de la calidad de la formación realizada por datahack.

Lista de Ponentes
Lista de Ponentes

Modelos semi-supervisados

Francisco Rodriguez, Data Scientist de Telefónica, ha sido el primer ponente de la tarde y nos ha hablado de los modelos semi-supervisados y sus principales ventajas.

Todos conocemos la clásica clasificación de los modelos de Machine Learning en “supervisados” (que pueden entrenarse solos a partir de un histórico) y “no supervisados” (que requieren de datos etiquetados, para ir aprendiendo).

El problema de los modelos no supervisados es que requieren de muchos datos etiquetados, que normalmente no existen y necesitamos horas de dedicación de personas para etiquetarlos y que de este modo el modelo disponga de un dataset etiquetado suficiente para entrenarse.

Con el objetivo de paliar este problema, se está trabajando en implementar modelos semi-supervisados en los que, a través de diferentes sistemas, podemos etiquetar datos en base a otros de manera automática sin intervención manual.

Principio de los Modelos Semi Supervisados
Principio de los Modelos Semi Supervisados

Apache Ignite

Gastón Lucero, Big Data Engineer de Trovit, nos ha presentado las ventajas de Apache Ignite como arquitectura de datos en memoria y a su vez puede ser una base de datos SQL distribuida.

Arquitectura Apache Ignite
Arquitectura Apache Ignite

Era una ponencia más enfocada a Data Engineers y a la arquitectura de datos en implementaciones de Big Data, en la que no profundizamos mucho en este blog, pero básicamente la ventaja de esta tecnología es que mezcla los beneficios del almacenamiento en memoria, con los de la gestión de datos en una base de datos SQL. Por lo tanto, tiene la agilidad de los datos en memoria y la persistencia de SQL. Es escalable horizontal y verticalmente y permite la computación distribuida.

Modelos de detección de emociones

La tercera charla ha sido a cargo de Alejandro Arranz, Data Engineer en datahack, que nos ha explicado el proyecto de I+D, llamado dia4ra, que están llevando a cabo con un robot AIDA para asistir a enfermos de Alzheimer. En particular, ellos están trabajando en modelos de detección de emociones para dotar al robot de la capacidad de predecir el estado emocional del enfermo.

Robot AIDA del proyecto dia4ra
Robot AIDA del proyecto dia4ra

Esta ponencia ha sido muy interesante ya que nos ha explicado la complejidad de predecir emociones en base a la expresión facial, y la importancia de tener en cuenta el entorno para predecir correctamente.

Speech to Text

Como último ponente, Javier Moralo, Data & AI Creative en datahack, nos ha introducido en la parte de conversión de audio en texto del proyecto dia4ra. Su responsabilidad en este proyecto es que el robot entienda las palabras cuando le hablamos y pueda transformarlas en acciones a realizar.

Una de las partes más interesantes de la ponencia ha sido la explicación de cómo han conseguido los datos etiquetados para entrenar al modelo, ya que existen pocos datasets etiquetados de audios en castellano. Para solventar este problema han creado su propio dataset a partir de audiolibros y ebooks.

Modelo Speech-to-Text con Tensorflow de datahack
Modelo Speech-to-Text con Tensorflow de datahack

La mesa redonda final

En mi opinión, la mesa redonda final ha sido una de las mejores partes del evento, ya que han reunido a importantes profesionales del sector para debatir sobre el estado del Big Data & Analitycs en la actualidad.

Participantes de la mesa redonda
Participantes de la mesa redonda

La mesa estaba moderada por Lourdes Hernández, CEO de datahack, que ha iniciado una ronda de preguntas a los participantes y ha dado pie al final a las preguntas de los asistentes al evento.

Es difícil resumir una mesa redonda en este post, pero me gustaría destacar algunos conceptos que se han tratado en la misma:

  • Internet de las emociones: Eduard Contijoch, Head of IOT en T-Systems, ha introducido este término al hablar de los asistentes de voz tipo Siri, Alexa o Google Home. La idea es que, a través de captar nuestra voz, lo importante no es sólo lo qué decimos, sino cómo lo decimos. Estos asistentes pueden detectar nuestras emociones en ese momento y por lo tanto, detectar por ejemplo si es el mejor momento para vendernos un producto.
  • Falta de Talento: Francisco Martínez, Manager BA en Minsait, ha explicado que uno de los retos que se encuentran a la hora de afrontar los proyectos de Data Scientist y Big Data, es la falta de personas formadas y con experiencia en este ámbito.
  • Uso de grafos para la detección de blanqueo de capital: Luis Echavarri, CDO & CIO de Banc Sabadell, ha destacado como proyecto actual de su empresa el uso de grafos para a través de las relaciones entre clientes, detectar testaferros. También ha hablado de la ética en los modelos predictivos, un tema que ya tratamos en este post.
  • Catálogo de Datos: Ferrán García, Solution Architect de Qlik, nos ha introducido en el concepto de catálogo de datos, como una plataforma donde los diferentes perfiles de nuestra empresa pueden acceder a consultar y buscar datos, a diferentes niveles de agregación o preparación del dato.

Conclusiones

Como decía al principio del post, ha sido un gran evento, y espero repetir el año que viene y poder aprender de otros profesionales del sector y de los proyectos que están realizando en sus empresas.

Si queréis profundizar más en las ponencias, estad atentos al blog de datahack, ya que publicarán las ponencias en detalle.

¿Qué os ha parecido a vosotros? ¿Os apuntáis a la edición del próximo año? Si has sido uno de los asistentes y quieres compartir tu visión del evento, no dudes en dejar un comentario.

¡SUSCRÍBETE YA!
Doy mi consentimiento para almacenar mis datos para envío de newsletters.
Si te suscribes a la newsletter tendrás acceso a los ficheros Power BI originales de nuestros tutoriales y post.

Además tendrás derecho a participar en sorteos periódicos que realizaremos en el blog.
We hate spam. Your email address will not be sold or shared with anyone else.
Mostrar más

Iván Arribas

Llevamos siglos generando, relacionando, modificando y almacenando datos....es hora de que les echemos un vistazo. Espero que este blog sirva de ayuda a los que quieran introducirse en este mundo de la Analítica de Datos, igual que me está sirviendo a mi.

Publicaciones relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Información básica sobre protección de datos Ver más

  • Responsable: Iván Arribas Delgado.
  • Finalidad:  Moderar los comentarios.
  • Legitimación:  Por consentimiento del interesado.
  • Destinatarios y encargados de tratamiento:  No se ceden o comunican datos a terceros para prestar este servicio. El Titular ha contratado los servicios de alojamiento web a Bluehost que actúa como encargado de tratamiento.
  • Derechos: Acceder, rectificar y suprimir los datos.
  • Información Adicional: Puede consultar la información detallada en la Política de Privacidad.

Botón volver arriba
Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos. Contiene enlaces a sitios web de terceros con políticas de privacidad ajenas que podrás aceptar o no cuando accedas a ellos. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Ver
Privacidad