Estoy seguro que a estas alturas el lector ha oído acerca de estas nuevas profesiones relacionadas con los datos: analista de datos, analista de negocios, inteligencia de negocios, científico de datos, desarrollador de inteligencia artificial y otros tantos.
Lo cierto es que nadie tiene una definición muy clara de qué es un científico de datos, más allá del concepto intuitivo de saber que un científico de datos es una persona que trabaja con muchos datos. No es mi intención entrar en el interminable debate sobre la definición de qué es un científico de datos, pero manteniendo esta premisa de que ‘es una persona que trabaja con muchos datos’ -donde habría que matizar que es ‘muchos’-, y por ende resuelve problemas de negocios con datos. Eso sí, cualquier tipo de datos -estructurados, no estructurados, semiestructurados- y con cualquier volumen de datos -desde unos cuantos miles de líneas hasta billones de líneas distribuidas en muchos clústeres-.
Independientemente de la definición de qué es exactamente un científico de datos, me aventuro a decirle que es muy probable que usted acabe siendo uno de ellos.
Comencemos mostrando un gráfico elaborado por Statista, donde se observa que el crecimiento del volumen de datos creado, capturado, copiado y consumido a nivel global desde 2010 y con previsión hasta 2025 crece a un ritmo interanual medio del 45% -siendo un crecimiento exponencial creciente-. O lo que es lo mismo, que la generación de datos se duplica cada 2 años, como se puede ver en este informe de Statista.
Si nos paramos a pensar, lo primero que se intuye es que la población también crece y el uso de herramientas tecnológicas también crece, como los teléfonos móviles o inteligentes.
A continuación, observemos el ratio de crecimiento de la población, según publica Our World in Data:
Es evidente que la población crece, pero cada vez a un ritmo mucho menor, estando en la actualidad en un ratio de crecimiento en torno al 1.2% (aproximadamente).
Ahora analicemos el ratio de crecimiento de telefonía móvil, dado que es quizá el dispositivo tecnológico más accesible a la población, aunque no es el único.
Lo que se desprende del crecimiento medio interanual del mercado de telefonía móvil es que el ratio medio de crecimiento es de aproximadamente un 2%
Así que, según lo visto hasta ahora, la generación de datos crece a un ritmo cercano al 45% interanual, pero la población lo hace a un ritmo aproximado del 1.2% -y decreciendo-, y los dispositivos móviles a un ritmo del 2%.
¡A simple vista, falta algo… o quizá no!
Si falta algo, faltan muchas cosas en realidad. Pero vamos a simplificar lo que falta con algo que no hemos considerado. Las máquinas y sistemas también producen datos que se capturan, almacen, copian y consumen. Y adicionalmente a esto, los seres humanos generamos cada vez más datos.
Es decir, y con ánimo de ser simplista, se dispone cada vez más de mayor cantidad de datos para analizar.
La siguiente pregunta que me gustaría abordar: ¿cómo vamos a ser capaces los profesionales de analizar cada vez más cantidad de datos por persona (proporcionalmente)? No podemos incrementar los recursos humanos al mismo ritmo del crecimiento de datos disponibles. Aquí viene otra gráfica interesante, también publicada por Wikipedia
Esta gráfica muestra la cantidad de transistores en microprocesadores, que se duplica cada año. De hecho, la grafica tiene una forma exponencial, dado que en 2012 había microchips con 1 millón de transistores, y en 2020 microchips con 50 millones. Multiplicar por 50 la capacidad de transistores en tan solo 8 años parece realmente impresionante.
Es decir, la capacidad de computación tecnológica crece a un ritmo muy superior que la generación de datos por la humanidad.
Esto significa que, para ser capaz de analizar cada vez mas datos por una única persona, es necesario dotarla de herramientas tecnológicas actualizadas y adecuadas. No solo de herramientas tecnológicas, sino de conocimientos, técnicas y procesos que permitan a un ser humano la habilidad de procesar y analizar cada vez más y más datos.
En la actualidad, cualquier profesional trabaja con datos. El volumen de datos aumenta cada vez más, por lo que usted acabará siendo un científico de datos, eso sí, altamente especializado en su ámbito profesional.