English 91 399 58 81
Compartir

Fighting for Big Data Science: el presente de la profesión del futuro

20 abril, 2015

El jueves pasado tuve la suerte de poder asistir al primer Big Data Science Fighters organizado por KSchool y El Arte de Medir. Tenía muchas ganas de escuchar y saber un poco más sobre esta «nueva» disciplina de la mano de gente que lleva muchos años trabajando en esto y ven cómo hoy todos hablamos de Big Data, en muchos casos, sin llegar a comprender la magnitud del asunto.

Me interesaba saber en qué punto estamos en España en cuanto a aplicaciones reales y por qué está considerada como una de las profesiones con mayor proyección a futuro. Además de entender un poco mejor cómo es el proceso, descubrí que las aplicaciones tienen mucho que ver con nuestro día a día en Redbility: la experiencia de usuario y la experiencia de cliente.

Qué hace un Data Scientist

¿Qué es eso que les hace tan importantes para cualquier organización? Daniel Rodríguez nos lo explicó de forma entendible para todos:

  • Integra los datos para que representen la lógica del problema.
  • Analiza y descubre los patrones de comportamientos ocultos que transforma en oportunidades.
  • Sabe priorizar la información en función del negocio, crea segmentos, actúa y optimiza los resultados.
  • Es la persona adecuada dentro de la empresa para elegir, personalizar y obtener el mejor rendimiento de las herramientas que se necesitan.
  • Hace llegar a los destinatarios de forma clara y entendible las conclusiones de sus análisis para que éstos actúen.

Una frase de Daniel que me dejó pensando:


La charla de Carlos J. Gil de Ebay nos situó en la realidad de la empresa, con mucho humor y pasión por su trabajo, Carlos nos contó que un data scientist hoy día puede tener los mismos problemas que muchos otros: la empresa invierte en herramientas pero no en personas que las utilicen, para la decisión de compra de soluciones tecnológicas no se consulta a quien las conoce… Te suena, ¿verdad?

Para qué sirve el Big Data

Sí, lo sé, es como preguntar ¿para qué sirve la inteligencia?. Pero te dejo tres apuntes que me parecieron interesantes:

Para la empresa

Representa ni más ni menos que la inteligencia competitiva de un negocio. De esto nos habló Josep Curto en su charla sobre modelos de negocio basados en datos. ¿Por qué las mayores empresas tecnológicas del mundo, Google, Facebook, LinkedIn, Netflix…. invierten en data science? Porque saben que ser capaces de elaborar predicciones basadas en patrones de comportamiento les ayudará a tomar mejores decisiones.

Para el usuario

¿Y para qué quieren las empresas tomar mejores decisiones? Para diferenciarse e innovar en la experiencia de usuario y en la experiencia de cliente.

Para mí, una de las frases del día fue ésta de Josep:

Para la sociedad

Las posibilidades de mejorar la vida de los ciudadanos deberían pasar por el conocimiento de los patrones y adecuar la planificación de servicios a partir de las predicciones. Durante toda la jornada vimos ejemplos de aplicaciones reales, desde el concepto «Smart Cities» a la medición de la calidad del aire en Asturias que nos contó Rubén Casado, pasando por las posibilidades de monitorización en tiempo real y de pacientes en el campo de la medicina que mencionó Soraya Paniagua .

Las tres V´s del Big Data

La charla de Rubén Casado fue toda una masterclass sobre la evolución de las tecnologías y los procesos en Big Data. El data scientist se enfrenta a tres problemas que ha de resolver:

Volumen

Gestionar la extracción, la integración y la segmentación de una ingente cantidad de datos, además de poder aplicar complejos modelos estadísticos, es la primera de las claves a la que se ha tenido que dar respuesta.

Variedad

Los diversidad de las fuentes de las que provienen los datos hacen que la tarea de integrarlos para el análisis haya sido tarea complicada desde que se empezó a trabajar en Big Data.

Velocidad

Las herramientas tienen que ser capaces de extraer y procesar los datos con rapidez para ser operativas.

En esta visión evolutiva Rubén diferenció tres generaciones en los paradigmas de proceso de datos. La forma de trabajar con datos ha evolucionado con el avance en las tecnologías que han ido solucionando los problemas a los que se enfrentaban:

Batch processing o procesamiento por lotes

Hasta 2010, las soluciones tecnológicas se centraron en solucionar el problema del volumen de datos a recabar.

Real-time processing o procesamiento en tiempo real

Desde 2010 hasta 2014 las necesidades empresariales han hecho que el problema a resolver fuera el de la velocidad de procesamiento. Desarrollar sistemas que convirtieran el batch processing en streaming data processing ha sido clave para ganar en velocidad, sacrificando en principio la flexibilidad del modelo de datos.

Hybrid computation, o computación híbrida

La generación actual en la que vive el Big Data. Rubén nos habló de sistemas basados en arquitectura lambda, diseñada para tratar enormes cantidades de datos que se beneficia de lo mejor del batch y el streaming processing. Con la incorporación de una capa destinada a servir los resultados de ejecución de querys, representan significativos avances para lograr cubrir las tres V´s. Si queréis conocer las herramientas disponibles y algunas aplicaciones utilizadas por empresas, no os perdáis la presentación de Rubén.

El futuro: el internet de las cosas

Avanzamos hacia una época en la que vamos a tener millones de dispositivos conectados emitiendo datos. De nosotros dependerá utilizarlos en nuestro propio beneficio. Ponencias como las de Soraya Paniagua o Marcelo Soria de BBVA nos acercaron los pasos que se están dando en el presente para sentar las bases de un futuro.

Soraya nos habló de proyectos y comunidades que están dedicando esfuerzos a avanzar en este terreno. Software y hardware libre, arduino y la democratización en la creación de robots… La energía y el conocimiento de la actualidad del Big Data de Soraya nos inspiraron a seguir investigando en comunidades tan interesantes como Kaggle que no deberíais dejar de visitar.

Marcelo nos habló de la importancia de trabajar los datos que nos hablan de nuestra actividad diaria y cuyo análisis nos ayudará a mejorar nuestra vida. Además, nos trajo impresionantes casos reales en los que empresas como BBVA están invirtiendo hoy día, como la visualización dinámica de los movimientos de las tarjetas de crédito durante la Semana Santa de 2011 sobre un mapa de España. Una de las perlas que nos dejó:

No quiero dejar de mencionar a Carlos Gámez Kindelán y su divertida ponencia sobre visualización de datos. Trabajando en Redbility soy muy consciente de la importancia de representar los datos de forma consumible, apetecible y entendible para el destinatario. Carlos, como infografista, nos hizo un repaso también por la historia de la representación de datos con algunos impresionantes ejemplos que os dejo más abajo como recursos y os recomiendo ver.

Para el final, he querido dejar la presentación de Watson Analytics de la mano de Jaime Requejo que abrió la jornada. Este sistema recoge todo el proceso que necesitas para tu análisis de datos en un modelo freemium. Lo más destacable para mí, antes de conocerlo bien, es la automatización de la búsqueda de patrones de valor.¿Cansado de calcular correlaciones y aplicar modelos estadísticos? Watson Analytics te sugiere patrones basados en correlaciones para que tú profundices en tu análisis. ¿A que suena maravilloso?

Recursos

Os dejo algunos de los recursos y ejemplos que utilizaron los ponentes en sus charlas que he podido encontrar:

Finantial Footprints, transaction in real time

Un trabajo del equipo de BBVA que nos trajo Marcelo Soria, dónde se muestra la actividad en España a través de un mapa de transacciones realizadas con tarjeta de crédito durante la Semana Santa de 2011. De la charla de Marcelo Soria.

The Joy of Stats, Hans Rosling’s 200 Countries, 200 Years, 4 Minutes. BBC Four

Una increíble representación en vídeo de la correlación entre la esperanza de vida y el nivel de desarrollo económico en el mundo a lo largo de 200 años. De la charla de Carlos Gámez Kindelán.

U.S Guns Death

Un experimento web que visualiza los años de vida robados por muertes con armas de fuego en Estados Unidos: guns.periscopic.com . También nos lo enseñó Carlos.

Las infografías que marcaron la historia

La importancia de la visualización de datos para descubrir, por ejemplo el orígen del brote de cólera que asoló Londres a mediados del siglo XIX. Las he encontrado reunidas en este artículo publicado en eldiario.es.

El estudio de la Cambridge University

Big Data for Big Business: A Taxonomy of Data-driven Business Models used by Start-up Firms, al que Josep Curto se refirió varias veces en su charla. Si estás pensando en lanzarte a un negocio basado en procesamiento o análisis de datos, sin duda te resultará de utilidad.

Como veréis, el día mereció la pena. ¿Os espero en la próxima edición?

Etiquetas
Autor

Compartir

Suscríbete a nuestra newsletter

También te puede interesar

  • Cuando se trabaja en equipo, se produce la magia.

    Eventos

    29 noviembre 2019

    ¿El trabajo de equipo por encima del trabajo individual? Fue la pregunta que despertó nuestra curiosidad y por la cual llevamos a cabo...

  • ¿Qué aporta la investigación a un proyecto UX?

    Investigación

    24 septiembre 2018

    Investigación en proyectos UX Que se nos quite a todos de la cabeza, hacer investigación dentro de un proyecto UX no se trata sólo de hacer test con usuarios, la investigación bien aplicada sumergida en cualquier proyecto es mucho...

Usamos cookies de terceros para mejorar nuestros servicios y obtener datos estadísticos de tus hábitos de navegación. Si continúas navegando consideramos que aceptas su uso. Puedes obtener más información en Política de privacidad y cookies

En esta web utilizamos tecnologías como cookies de terceros, y procesamos datos personales, como las direcciones IP y los identificadores de cookies.    Ver Política de cookies