Seleccionar página

Por segundo año consecutivo, quienes se desempeñan como data scientist o científicos de datos son los profesionales más afortunados según el último ranking de la plataforma de empleos estadounidense Glassdoor. En sintonía, ya hace algunos años la prestigiosa publicación Harvard Business Review señaló que estos especialistas tienen “la profesión más sexy del siglo XXI”.

¿Pero cuál es su trabajo? En la “era de los datos” estos expertos son los que tienen los conocimientos apropiados para recopilar, “limpiar” y analizar inmensos volúmenes de datos para descubrir tendencias y detectar patrones. Así como Robert Langdon resuelve asesinatos y conspiraciones en las novelas de Dan Brown o Gus Gorman consigue grandes sumas de dinero en Superman 3 gracias a su habilidad para trabajar con datos.

En la vida real, gracias a estos profesionales, las empresas pueden, por ejemplo, anticiparse a diferentes escenarios y, por ende, tomar mejores decisiones para el negocio.

Al igual que sucede en EEUU, en el resto del mundo hay escasez de estos talentos, por lo que su salario es superior al promedio. El boom de demanda empezó hace unos cuatro años y el déficit de postulantes se debe a que para dedicarse a esto hay que combinar una serie de habilidades que no suelen estar cubiertas por una única carrera.

“Los que saben de ciencias deben actualizarse en tecnología y problemas de negocios y viceversa”, ejemplificó Matías Zabaljáuregui, coordinador del programa de Data Science del coding school argentino Digital House. En un curso que brinda esta institución, los interesados adquieren en cinco meses todos los conocimientos para trabajar como data scientist.

El boom de demanda empezó hace unos cuatro años y el déficit de postulantes se debe a que para dedicarse a esto hay que combinar una serie de habilidades que no suelen estar cubiertas por una única carrera.

Básicamente, los científicos de datos tienen conocimientos de programación, ya que, como los conjuntos de datos son inmensos, no es posible apelar al Excel. Por este motivo utilizan SQL (del inglés Structured Query Language), que es un lenguaje de programación especialmente diseñado para manipular y extraer datos de sistemas gestores de bases de datos relacionales, como MySQL y SQL Server, entre otras. Además, tienen la habilidad de realizar modelados predictivos utilizando información del pasado y del presente.

Por ejemplo, si un comercio quiere saber cuántos equipos de aire acondicionado venderá el próximo invierno, el data scientist estima la cifra cruzando datos tales como el historial de unidades vendidas en las últimas temporadas, el pronóstico meteorológico y la situación económica de los consumidores, entre otras variables. Para realizar este trabajo también pone en práctica sus conocimientos de matemáticas y estadística, así como habilidades vinculadas a la creatividad para resolver problemas. Por último, presenta sus conclusiones a los ejecutivos para que ellos tomen las decisiones de negocio.

“Aunque a simple vista parece complicado contar con tantas habilidades, ya que es imposible que un profesional de este tipo trabaje de forma manual, los cierto es que las interfaces del software que utilizan para trabajar son cada vez más sencillas de usar”, comentó a Cromo Rick Farnell, vicepresidente de Think Big Analytics y Teradata, una compañía estadounidense especializada en herramientas de data warehousing y soluciones analíticas para empresas.

Zabaljáregui coincidió: “Es cierto que las tecnologías de extracción y limpieza de datos son cada vez más accesibles e incluso muchas tareas se pueden automatizar, pero, en simultáneo, las empresas les piden más habilidades a estos perfiles. Por ejemplo, antes solo pedían que supieran sobre modelado estadístico, y ahora también tienen que saber sobre big data, o tener dominio para trabajar con herramientas (de programación) como Spark o Hadoop”.

MercadoLibre cuenta con varios data scientist. “Es cierto que cuesta conseguir a estos profesionales y, si estos perfiles son buenos, los aportes que pueden realizar son valiosísimos”, indicó Adrian Quillis, business intelligence & analytics manager de la corporación.

Para ejemplificar, mencionó que los científicos de datos de Mercado Libre lograron, por ejemplo, desarrollar un nuevo algoritmo de recomendaciones de productos gracias al cual los usuarios compran más ítems presentados bajo esta modalidad. Actualmente están trabajando para mejorar la estimación que recibe el cliente sobre el tiempo de entrega de los productos comprados a través de su servicio Mercado Envío.

“Se dice que encontrar un data scientist que sea bueno en todas estas tareas sería como encontrar un unicornio”, dijo Daniela Vázquez

Daniela Vázquez Leggiadro, de 33 años, trabaja como data scientist en Montevideo para una firma especializada en el análisis y procesamiento de datos. Según describió, los aspectos más técnicos de su trabajo involucran la definición del problema a resolver, la recolección de los datos, su manipulación (limpieza y transformación), entrenamiento y evaluación de modelos de machine learning o deep learningy su puesta en producción.

“Las habilidades blandas, como la de comunicar los resultados a un público no técnico para la toma de decisiones, también son muy importantes. Se dice que encontrar un data scientist que sea bueno en todas estas tareas sería como encontrar un unicornio”, acotó.

Aunque ejerce como científica de datos, ella estudió economía con un perfil cuantitativo y conoció la disciplina en su primer trabajo en la industria como consultora de analytics, donde desarrollaba modelos predictivos para el mercado financiero. Además, para capacitarse, leyó mucho, tomó cursos en plataformas virtuales y fundamentalmente puso “las manos en la masa” para aprender con la práctica. Como el resto de los entrevistados, no cree que su profesión sea para personas más inteligentes que el promedio: “Yo no creo que sea difícil, sino que lleva mucho esfuerzo. A medida que voy aprendiendo más, las cosas que en un momento me parecían imposibles no son tan complicadas como creía. Si uno quiere ser bueno en todo desde el primer momento, se va a frustrar muchísimo. Es mejor empezar con metas más chicas y alcanzables y construir desde ahí”.

En un balance sobre la profesión, Vázquez dijo: “Lo más lindo es que siempre estoy haciendo cosas diferentes. Trabajo en proyectos donde uso datos de redes sociales o de la web y en otros donde el cliente es el que trae los datos y se analizan para encontrar patrones o predecir eventos relevantes. Esto hace que no me aburra nunca y que haya muchísimo espacio para la creatividad”.

En tanto, Zabaljáuregui indicó que lo mejor es que “con esta disciplina se puede acompañar el proceso de revolución industrial actual, que está transformando al mundo tal cual se conoce”.

Sin embargo, este trabajo, como cualquier otro, tiene su parte menos emocionante: “Lo que menos me gusta es la limpieza de los datos, aunque se trata de una fase necesaria”, comentó el coordinador de Digital House, mientras que Vázquez se enfocó en otra cuestión: “Lo peor es que como no hay mucha gente con este perfil en Uruguay, es bastante solitario. Creo que no falta mucho para que esto se revierta y, mientras, he podido compensarlo integrándome a algunas comunidades internacionales. En ellas encontré mucha gente dispuesta a discutir aspectos técnicos”.

Los entrevistados coincidieron al señalar la importancia de la ciencia de datos para todos los ámbitos, de ahí que Zabaljáuregui concluyera: “Uno puede aplicar esta disciplina a cualquier ámbito, como la música, la salud, el campo o cualquier otro”.