Seldon, el primer Data Scientist

Seldon, el primer data scientist

Cuando leemos u oímos hablar de Seldon, con seguridad nos vendrá a la mente el personaje de la serie Big Bang Theory, Sheldon. Yo estoy convencido que este personaje se llama así por Hari Seldon.

Seldon fue, o mejor dicho será, el padre de la Psicohistoria. Nacerá en el año 11.988 de la Era Galáctica en Helicon y morirá en Trantor en el 12.069 a los 81 años.

Según el propio Seldon, la Psicohistoria es una ciencia combinada de matemáticas, psicología e historia que puede predecir acontecimientos futuros. Pero tiene que sustentarse sobre dos pilares o axiomas fundamentales:

1. La población en la cual el comportamiento fuera a ser modelado, debía ser suficientemente grande (±75 billones).
2. La población debía permanecer ignorante de la aplicación de los análisis psicohistóricos.

Esto obviamente es ciencia ficción… ¿no?

Ciencia no tan ficción: El poder del aprendizaje automático.

Isaac Asimov ya predijo en La Fundación, escrito en 1951, y a través de Seldon, que si se tienen suficientes datos, se pueden predecir acontecimientos futuros, y lo más importante, suavizar su impacto si es lo que interesa. Esta creo que es la primera aproximación que se hace al Big Data, Machine Learning e Inteligencia Artificial, términos y conceptos tan de moda y que son escuchados a diario.

¿Es La Fundación de #IsaacAsimov la primera aproximación al #BigData, #MachineLearning y #AI? Clic para tuitear

Actualmente se utilizan distintos algoritmos de machine learning, como regresiones, con el fin de pronosticar o predecir distintos acontecimientos para luego tomar decisiones enfocadas a la consecución de un objetivo. Lo que hizo Seldon fue combinar estas tres ciencias (matemáticas, psicología e historia) para crear la Psicohistoria. Esta Ciencia se encargará de recoger, desde el origen de los tiempos, toda la información del comportamiento del hombre; historia, economía, crisis o acontecimientos extraordinarios. Teniendo en cuenta la cantidad de datos de que dispone Seldon y una tecnología superavanzada capaz de procesarlos, será posible predecir el futuro, y no solo eso, tomar decisiones que puedan mitigar ciertas crisis o actuar de un modo tal que salgamos beneficiados de lo que a priori pudiera parecer que es un acontecimiento poco ventajoso. Esto que aparentemente es ciencia ficción, no lo es tanto.

Si intentásemos recrear con métodos de machine learning esta predicción, con toda seguridad, sería de aprendizaje sin supervisión y utilizaríamos un algoritmo de regresión. Veamos un ejemplo muy simple:

Imaginemos que valoramos del 1 al 10 cada siglo, donde 1 es que no ha habido ninguna crisis, la convivencia ha sido totalmente pacífica y la economía no ha sufrido ninguna recesión y 10, todo lo contrario, crisis política, recesión económica y conflictos bélicos globales y de gran magnitud.

Aplicando un cálculo de regresión lineal (mínimos cuadrados), con los valores ficticios que hemos introducido, vemos que en el siglo 60 tendremos un 98% de probabilidad de sufrir una crisis global y de gran magnitud. Algo parecido pero con infinidad de variables más es de lo que se encargaban los psicohistoriadores en la Fundación.

Hoy en día, las empresas y países más poderosos del mundo disponen de los mejores analistas, data scientist, tecnologías… Tienen a su disposición auténticos genios y recursos ilimitados dedicados a este tema. Analizan todos los acontecimientos que te puedas imaginar: crisis bursátiles, conflictos bélicos, desastres naturales, acontecimientos deportivos… Todo aquello que genere gran cantidad de datos es susceptible de ser analizado. Esta información es clave para crear estrategias que puedan ayudar a conseguir unos objetivos. A diferencia de lo que la mayoría de la gente cree, el poder del aprendizaje automático no está en saber si venderemos más o menos, ni si saldrá un partido político u otro, el verdadero poder del machine learning está en que da igual la predicción que resulte del análisis, lo verdaderamente poderoso es que sabemos con un alto grado de probabilidad qué es lo que va a pasar y en consecuencia, actuaremos.

Todo aquello que genere gran cantidad de datos es susceptible de ser analizado #bigdata Clic para tuitear

Imaginaos una tanda de penaltis en la que el portero sabe a un 95% dónde irá el balón. Lo poderoso no es saber dónde el contrincante tirará el balón y parar el penalti, lo interesante es que como sabemos casi con toda seguridad que lo pararemos, enviaremos a todos nuestros jugadores a esperar en el área contraria el lanzamiento de nuestro portero después de haberlo parado.

Esto es lo que el equipo de Donald Trump hizo para hacerle presidente del país más poderoso del mundo. Probablemente utilizaron series temporales para predecir que, según el modelo, Hilary Clinton iba a ganar las elecciones para luego volver a aplicar otros algoritmos de machine learning relacionados con el análisis de sentimiento en redes sociales para inclinar a su favor las votaciones. Todo esto contado de una manera muy frívola, por supuesto.

En esta línea, existe un análisis muy interesante publicado por Yu Wang (Computer Science – University of Rochester), Xiyang Zhang (Psychology – Beijing Normal University) y Jiebo Luo (Computer Science – University of Rochester) titulado, When Follow is Just One Click Away: Understanding Twitter Follow Behavior in the 2016 U.S. Presidential Election.

Fuente: When Follow is Just One Click Away: Understanding Twitter Follow Behavior in the 2016 U.S. Presidential Election

Pero lo que más me llama la atención es que, según el axioma nº 2 de Seldon, (2. La población debía permanecer ignorante de la aplicación de los análisis psicohistóricos.), el mero hecho de saber que se está siendo objeto de una medición o análisis, perturba el resultado. El observado no puede saber que lo está siendo.

¡Vaya! ¿Ficción otra vez? Pues creo que no.

Superposición cuántica y la paradoja del observador

En física experimental y física cuántica, la paradoja del observador hace referencia a una situación en la que el fenómeno observado se ve influenciado por la presencia del propio observador o investigador.

Dado que yo no soy físico teórico, qué más quisiera, voy a limitarme a copiar la explicación que hace Wikipedia al respecto porque creo que es de muy fácil comprensión. Animo a su lectura completa.

Pues bien, una superposición cuántica ocurre cuando un objeto posee simultáneamente dos o más valores de una cantidad observable. Hay que dejar claro que esto solo sucede en partículas subatómicas o cuánticas, tan pequeñas que un fotón de luz las puede hacer colapsar en un sentido u otro. Aquí es donde podríamos hacer válido la 2ª ley Seldon: la población debía permanecer ignorante de la aplicación de los análisis psicohistóricos porque si el observador (partícula cuántica) detecta que está siendo observado, puede variar su comportamiento (colapso).

Conclusión

Tenemos delante de nosotros un la posibilidad de utilizar correctamente estas herramientas y estos estos conocimientos para mejorar la calidad de vida de todos. De este modo estaremos ayudando a la conservación del planeta, conseguiremos hallazgos tecnológicos inimaginables y evolucionaremos como nunca el hombre lo ha hecho.

Desgraciadamente esto, a día de hoy, sí que parece ficción.

Agradecimientos:
A Isaac Asimov por enseñarme el camino,
a Nico, compañero y crack en sus ratos libres,
y al Gato de Schrödinger esté como esté.

Data Analyst & BI Analyst en Keepler. "Lo que yo quería ser era pianista. Llevo trabajando con datos de un modo u otro desde que empecé a trabajar en oficinas, allá por el pleistoceno. Tengo la suerte de hacer lo que me gusta y aprender continuamente. Me encanta analizar datos para descubrir tendencias y me encanta el diseño minimalista para mostrar estos datos. En mis ratos libres hago música... o lo que sea".

Port Relacionados

% Comentarios (2)

Me ha encantado tu post, Andrés. Ojalá que algún día se pueda llegar a tener tantas cantidad de datos que se puedan utilizar de una manera correcta y en ayuda a la humanidad y no a la destrucción de la misma

Muchas gracias!!

ojalá, por nuestro bien mas que nada.

¿Qué opinas?

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.