El mundo de la ciencia de datos está en crecimiento en los últimos años. Lo que era un paso más en el big data, la analítica avanzada, ha pasado a ser clave en proyectos basados en datos y está generando la especialización del rol de científico de datos, diferentes especializaciones que erróneamente se dirigen todas al mismo concepto: científico de datos.
A pesar de que tiene bastante tiempo, en Keepler estamos muy alineados con la ya clásica división de los skills de un data scientist. En este diagrama que ves a continuación, además de los hard-skills más técnicos y próximos al machine learning, los skills más puros asociados a matemáticas y estadística, y los más asociados al ámbito del research a través de la motivación de preguntas e hipótesis, encontramos una “zona de peligro” que se encuentra entre aquellos con conocimiento técnico y con deseo de obtener conclusiones, que se aventuran a usar librerías sin comprender lo que realmente ocurre por debajo, cómo y qué aprende un modelo, pudiendo llegar a conclusiones incorrectas.

Diagrama skills de científicos de datos. Fuente: Berkeleys Science Review
Basándonos en este esquema, ¿cómo podemos construir una foto lo más realista posible del estado de los perfiles de científicos de datos?
Cuáles son los perfiles profesionales en la ciencia de datos #datascience #datascientist Clic para tuitearData Analyst como base de todos los demás, que hace analítica exploratoria con SQL, visualización y algo de scripting con R o Python. Suele ser una persona de business intelligence pero más potente a nivel de conocimiento tecnológico. Es un perfil con bastante cuota de mercado y, a la larga, nos atrevemos a decir que sustituirá al perfil de business intelligence tradicional.
Data Engineer es un perfil que suscita poco acuerdo en cómo entenderlo pero, en resumidas cuentas, es es el perfil, dentro del colectivo de científicos de datos, con conocimiento tecnológico más fuerte. Con cierto solape entre los ingenieros cloud e ingenieros de datos, está más enfocado a disponibilidad nuevas herramientas y modelos en una arquitectura normal. No podemos decir que sea puramente un científico de datos, pero está muy cerca.
Business Analyst es el perfil más enfocado a la preventa, con alto conocimiento en casos de uso, y a la gestión de equipos.
Data Scientist es lo que entendemos, en general, como el auténtico científico de datos, con conocimiento matemático, estadístico, scripting en diferentes lenguajes, machine learning…
Data Visualization Specialist es un Data Analyst con más skills de presentación de informes y visualización. Es también similar al perfil de business intelligence pero con el enfoque de hacer informes más reutilizables y automatizados, de cara a reportes más complejos y profundos que un simple dashboard. Buscan nuevas preguntas que hacer en la información, en lugar de intentar únicamente contestar las que ya se tienen.
Por último, identificamos tres perfiles, menos habituales y bastante concretos, como son el Financial Analyst, Statistician Analyst y Quants, estos dos últimos muy estadísticos y matemáticos más cercanos al campo de research.
Si tuviéramos que categorizar estos perfiles según sus tareas, tendríamos:
Data business: Data Analyst, Business Analyst y Financial Analyst.
Data creative: Data Visualization Specialist.
Data developer: Data Scientist y Data Engineer.
Data researcher: Statistician Analyst y Quants.

Clúster de perfiles según categorías de tareas a realizar. Fuente: Harris et al.,2013 as shown in Creating a Data-Driven Organization. Fuente: O’Reilly
Y si hablamos de soft-skills, ¿qué cualidades deberían presentar los diversos roles dentro del perfil de científico de datos?
Orientación al detalle haciendo hincapié en la calidad.
Escepticismo para cuestionarse todo antes y durante el proyecto.
Curiosidad para llegar a nuevas conclusiones.
Pragmatismo para aprovechar al máximo los recursos.
Foco en negocio porque no hay que olvidar que trabaja para dar resultados al cliente, incluso si ese cliente es uno mismo.
Storyteller o capacidad para desarrollar la historia que cuentan los datos.
Después de este repaso, esperamos que tengas una foto de los verdaderos perfiles de científicos de datos que hay en el mercado. No solo está el científico de datos en sí, sino que la evolución de esta rama de la analítica para negocio ha permitido la aparición de nuevos perfiles con su respectiva especialización que se complementan unos a otros.
En Keepler buscamos Data Scientist
Imagen: pexels.com | bruce mars
Deja tu comentario