Mejora tu currículum con la mejor formación

9%

¿Qué quieres estudiar?

Israel Herráiz

Mayte Guillen

24 de septiembre de 2015

Israel trabaja como data scientist en Amadeus. Es doctor en Ingeniería Informática por la Universidad Rey Juan Carlos, y ha sido investigador visitante en universidades de Europa, Canadá y Estados Unidos. Ha trabajado aplicando data science al estudio del desarrollo de software y al fenómeno del software libre, y en el área de ingeniería del transporte, estudiando los patrones en el tráfico por carretera. En Amadeus, aplica los mismos métodos al análisis de los datos de la industria de viajes (agencias, aerolíneas, etc.).

Israel Herráiz
Foto: Israel-Herraiz

Big Data, Data Science y negocio

La mayoría de las empresas mueren al poco de nacer. Muchas otras que tienen éxito, mueren cuando no son capaces de adaptarse a un entorno que cambia cada vez más rápido. Cuál es el factor común a ambas? El conocimiento, externo (el mercado) e interno (sobre cómo funciona la propia empresa).

Las empresas que nacen necesitan adquirir un conocimiento del mercado para poder ser capaces de sobrevivir. Cómo pueden adquirir este conocimiento? El primer paso es recolectar todos los datos posibles. Pero cómo realizar este paso?

Las grandes empresas que llevan décadas establecidas en un mercado menguante necesitan conocerse mejor internamente, para ser capaces de reaccionar y adaptarse a las nuevas condiciones del mercado. En este caso, los datos es probable que ya estén disponibles dentro de la empresa, pero se encuentran aislados en silos, desconectados en un estado inconsistente. Cómo pueden transformar estos datos en conocimiento?

En ambos casos, la figura del data scientist es clave para ser capaz de ir de los datos a la información, y de la información a la decisión.

Pero qué es un data scientist y qué hace?

El data scientist tiene tres facetas principales: técnica, analítica y funcional.

La faceta funcional es la que normalmente se suele olvidar a hablar de data scientists. Esta faceta se refiere al conocimiento del negocio en el que uno trabaja. Por ejemplo, si un data scientist trabaja en el sector financiero, debe conocer todos los detalles de cómo funciona el negocio en ese sector. Este conocimiento es difícil de adquirir solo con formación, y es necesario desarrollarlo en el desempenho de la actividad profesional. La faceta funcional es la que nos ayuda a plantear las preguntas adecuadas. El análisis de datos, el big data, por sí mismos no tienen ningún valor, el valor lo adquiren en el momento en el que se convierten en herramientas para transformar el dato en información, y para responder a las preguntas que son interesantes para el negocio.

La faceta analítica consiste en ser capaces de extraer información de los datos mediante el uso de métodos cuantitativos de análisis. En esta faceta entran la Estadística, Machine Learning y en general cualquier método de análisis de datos. Es importante tener una sólida base analítica, ya que los métodos cuantitativos suelen tener unas condiciones de aplicación muy precisas y restrictivas. Si aplicamos el método incorrecto a una situación, solo obtendremos resultados sin sentido (garbage in,garbage out). Cuando aprendemos un nuevo método, nuestra tentación puede ser intentar aplicarlo a todos los problemas que se nos presenten. Debemos ser capaces de resistir la tentación, y de desarrollar la experiencia para saber qué métodos aplicar en qué situaciones. Esta faceta sí es posible adquirirla mediante la formación adecuada. Por ejemplo, muchos matemáticos, ingenieros y físicos (entre otros) han desarrollado este tipo de habilidades y es por ello que solemos ver que estos perfiles son de los más demandados para cubrir los puestos de data scientist.

Por su parte, la faceta técnica se refiere a ser capaces de implementar nuestro método análitico en un ordenador, para que se pueda ejecutar de manera automática y desasistida. Aquí es donde entra el big data. Muchas veces, una vez que ya hemos identificado la pregunta que necesitamos responder, cómo la vamos a responder, es el turno de ponerlo todo en marcha. En esta faceta, se requiere ser capaces de escribir código fuente. Muchas veces el volumen de datos, su complejidad y variedad, o el ritmo frenético al que entran en nuestros sistemas, harán que el uso de un simple ordenador sea insuficiente para resolver el problema. En estos casos es donde necesitamos acudir al big data. De hecho, muchas veces esta faceta cristaliza en la forma de un tipo específico de data scientist o de big data engineer, dedicado a transformar un pequenho modelo que se ejecuta en un portátil en una solución que es capaz de ejecutarse en un clúster sin limitaciones en cuanto a volumen, variedad o velocidad a la que nos vienen los datos.

Cómo pueden los data scientists ayudar al éxito de las empresas? Por un lado, es necesario reconocer que es difícil encontrar las tres facetas completamente desarrolladas dentro de la misma persona. Por ello, el mejor data scientist es un equipo. Por el otro, la cultura de la empresa debe adaptarse para dar cobijo a los data scientists. Los negocios deben parecerse más a la ciencia. Lo que los datos desmientan, no es cierto. Punto. Debemos dejar de dirigir los negocios basándonos en nuestra impresión, nuestros sentimientos de cómo funciona el mercado, nuestras preferencias. Los negocios deben empezar a funcionar como la ciencia. Es necesario respaldar con datos nuestras decisiones. Lo contrario no es muy diferente de la superstición. Por ello, en gran medida, es por lo que fracasan las empresas.