Hay mucho material en internet sobre ‘las mejores 50 preguntas para entrevistar a un data scientist’ y similares. Le aseguro que cualquier candidato aspirante a data scientist ha leído y aprendido todas esas mismas preguntas y respuestas que probablemente usted le hará y espera que le haga, respectivamente.
Tras observar y trabajar con muchos de estos profesionales de los datos -tanto entrevistados y contratados, como profesionales internos formados en disciplinas de datos- algunas conclusiones he obtenido. Al fin y al cabo, soy data scientist y aprendo con la observación y contrastación de datos y evidencias -como no podía ser menos-.
Despues de haber entrevistado a muchos aspirantes a data scientist, asi así como haber entrenado a mas de 300 personas en ciencia de datos, me gustaría compartir mi experiencia en el proceso de contratacion, y algunas consideraciones adicionales.
Cómo entrevistar a un data scientist
La mejor estrategia de entrevista a un candidato a data scientist es enfocarse en su habilidad de resolver problemas; no tanto en sus conocimientos técnicos, ni tampoco en su formación (que por supuesto tambien son necesarios). No digo con esto omitir preguntas técnicas – conceptos estadísticos, algoritmos y modelos, programación, etc.-, sino enfóquese en entender cómo razona el candidato para resolver problemas.
Le aseguro que en la vida real el 90% de los problemas que tendrá que resolver como data scientist serán problemas aparentemente irresolubles.
“Según estudios psicológicos, la resolución de escenarios absurdos mejora la creatividad y el análisis de patrones”
No tenga inconveniente en platear al candidato escenarios absurdos e irreales, y preste atención a como razona el candidato su propuesta de resolver el problema. Quizá aporta una solución también absurda (prepárese para ello), pero si aporta una solución es mucho más que no aportar nada.
Una técnica que ha sido muy eficiente en mi experiencia es preparar una prueba al candidato, ver cómo la resuelve y pedirle que explique sus conclusiones. Es decir, en vez de realizar una ‘entrevista’ como tal, preparar una prueba con un set de datos, y solicitar al candidato que resuelva un objetivo en un tiempo requerido, y que explique sus conclusiones y resultados.
Por ejemplo, si el candidato va a trabajar en un departamento de operaciones de cadena de suministro, se puede disponer de un set de datos en internet (hay cientos disponibles) y pedirle que haga un modelo predictivo del tiempo de entrega de las mercancías, y que explique los resultados obtenidos. Deje que use el lenguaje de programación o el framework o las herramientas de su preferencia. Lo importante es que resuelva el problema, no enfocarse en las herramientas que usa para ello. Si por casualidad usa herramientas o programación que no son de su preferencia, no lo pre-juzgue. El objetivo es que el candidato aporte una solución, no si sabe más o menos de un lenguaje de programación, herramienta o paquete determinado (quizá de su preferencia).
¿Pero qué es y qué hace un data scientist?
Un data scientist -en palabras sencillas- es un profesional capaz de resolver problemas operativos con datos, cualquier tipo de datos (grandes, pequeños, estructurados, no estructurados, etc.); bien sea interpretando el pasado, diagnosticando las causas de eventos, o bien estimado el evento más probable de ocurrencia en el futuro. Además, un data scientist debe saber interpretar los resultados obtenidos de sus investigaciones, y lo que es más importante: debe ser capaz de explicar dichos resultados a cualquier audiencia -técnica o no-.
Exacto; un data scientist es un individuo versado tanto en conocimientos técnicos (estadística aplicada, programación, ingeniería de datos, inteligencia de negocios, etc.), como en habilidades blandas (comunicación, interpretación, pensamiento crítico, etc.). Y quizá, lo más importante y más escaso: debe conocer y entender el área operativa o de negocio donde va a desempeñar sus funciones. De no ser así, debe tener la habilidad de aprender rápidamente como opera la actividad donde desempeñará sus funciones de data scientist.
Considere que no es lo mismo un data scientist que opera en recursos humanos, como otro que trabaja en marketing, o finanzas, o servicio técnico, u operaciones internas, o ingeniería, o farmacéutica, o producción industrial. Los datos son datos (estamos de acuerdo), pero el entorno es determinante por muchos matices que es necesario conocer.
Fuente: businessoverbroadway.com
Le aseguro que un buen data scientist no descansa hasta encontrar una solución ‘aparentemente imposible’ a problemas ‘aparentemente imposibles’. En la vida real, esto es más habitual de lo uno se imagina.
Consideraciones de la organización
Es fundamental tener muy claro el objetivo de por qué necesitamos contratar un data scientist. Es decir, definir muy bien el alcance de nuestro problema de recursos humanos. Así mismo, es tanto o más importante, conocer el estado de la organización en el ciclo de madurez de la ciencia de datos.
Menciono esto porque no siempre está tan claro. He conocido gerentes que solo quieren contratar data scientists para dar una ‘imagen de modernidad digital y progreso’ frente a otros gerentes o departamentos, pero sin saber qué trabajo se encomendará al futuro candidato. En este caso, conseguirá agotar al recurso humano y se irá a otro lugar tan pronto le sea posible.
Por otro lado, hay organizaciones que están convencidas de que están listas para aplicar Machine Learning o Inteligencia Artificial, pero realizan la mayoría de su reportería de manera manual (copiar-pegar) en hojas de calculo o en diapositivas; o lo que es peor, no tienen un sistema de bases de datos debidamente arquitectado u organizado.
Para concluir
Antes de contratar a un data scientist, evalúe seriamente reeducar a su personal existente y dotarlo de conocimientos técnicos relativos a ciencia de datos. Su personal existente ya conoce bien su cultura empresarial, los problemas mas habituales y saben bien lo que funciona y lo que no funciona en su organización. Esto es algo que puede llevar años a un data scientist.