La revolución de los datos, aquí y ahora (y con nosotros)

En los últimos años, seguramente hemos tenido alguna vez la extraña sensación de que la tecnología decide antes que nosotros. O por nosotros. O sin nosotros. Esa sensación, cada vez más recurrente, está fundamentada en dos cuestiones de base. Primero, la tecnología hace la vida más fácil en muchos sentidos —¿cómo pudimos vivir tanto tiempo sin una app que proponga el camino para llegar más rápido al trabajo?—. Segundo, simplificarnos la vida es un objetivo de muchas empresas, y el hecho de que ese objetivo funcione gracias a la tecnología logra entusiasmarlas para generar nuevas ideas, productos y servicios, y así realimentar el ciclo.

Entonces, si la tecnología puede decidir (casi) como nosotros, se ha creado con ella una suerte de bola de cristal —virtual, tecnológica, «mágica»—.¿O no?

Un corto camino al éxito

Veamos un poco el camino recorrido. La Inteligencia Artificial surge como concepto en el año 1955 de la mano de Minsky, Shannon y otros padres fundadores de la informática moderna. Ellos propusieron, por medio de la programación, llegar a «simular las funciones superiores del cerebro humano».

Mucho material de ficción se ha producido sobre el tema, y seguramente es esto lo que inspira nuestras sensaciones y suspicacias. No obstante, también se ha producido mucho material de no-ficción en cientos de papers y desarrollos informáticos, lo que ha elevado la vara de la Inteligencia Artificial para acercarla lo más posible a lo planteado en 1955.

A lo largo de esta corta historia, se han producido algunos quiebres que es importante destacar. Conocida es la historia de Deep Blue, una supercomputadora desarrollada por IBM, que en 1996 venció al campeón mundial de ajedrez de ese entonces, Gary Kaspárov. El fuerte de Deep Blue fue su capacidad de procesamiento, que le permitía calcular 100 millones de jugadas por segundo.  Con ello lograba probar todos los caminos posibles en un tiempo muy reducido, simulando con bastante fidelidad la forma de jugar del jugador ruso.

Por otra parte, no tan conocida es la historia de un muchacho de unos treinta y tres años, que revolucionó los últimos cinco en gran medida. Ian Goodfellow, que había sido rechazado por MIT, entre otros fracasos, fue a tomar algo con sus amigos para festejar la graduación de uno de ellos. Cervezas mediante, un participante de la reunión le pidió ayuda para un proyecto muy interesante: ¿es posible armar un algoritmo que pueda generar fotos por sí solo?. En ese no tan lejano año de 2014, pensar esto implicaba sumergirse en una maraña de miles de números haciendo cuentas, peleándose y volviendo a amigarse. Lo único malo de esta ensalada numérica es que simplemente no funcionaba. Goodfellow, cerveza mediante, echó mano de un recurso de Data Science que estaba allí desde la década del 50, pero que parecía estancado en ese momento: las redes neuronales. El planteo era ciertamente poner a pelear números, pero utilizando la tecnología a través de la aplicación de esas redes. La idea es que una red intenta generar una foto artificial como si fuera real, y la otra intenta detectar fotos que sean falsas, para diferenciarlas de las reales. Ambas compiten entre sí, y el resultado de este ingeniosísimo método es que las dos mejoran notablemente. Con esto se mejoraron muchísimas tecnologías modernas en la ciencia y la industria. Aquí el punto fuerte fue la aplicación ingeniosa de los algoritmos, con mucho poder de cálculo, por supuesto.

¿Y los datos?

Hace muchos años leí una nota que me llamó la atención, sobre un pequeño crustáceo denominado krill, que prometía ser el alimento del futuro. La idea es que hay muchos, son muy valiosos por una serie de propiedades, y podrían servir como alimento para paliar el déficit de nutrición en millones de personas alrededor del mundo. El krill siempre estuvo ahí, se sabe de su valor pero todavía no se llega a utilizar provechosamente y con los recaudos adecuados. Con los datos pasa lo mismo: las empresas poseen grandes cantidades desde hace muchos años y no hay dudas sobre su potencial. Sin embargo, no fue hasta hace pocos años que logramos encontrar formas de trabajarlo para sacarle el mayor provecho posible.

La Ciencia de Datos, o Data Science, surge en la década del 70 como una prima hermana de la Inteligencia Artificial, en un intento de manipular los datos de forma inteligente, aplicando las herramientas matemáticas y estadísticas que la ciencia puede proveer.

En este sentido, los datos también tienen una historia para contar, ¡por supuesto!. En 2018 un estudio revolucionó el mundo de los que trabajamos en Data Science, asegurando que un algoritmo detectaba el cáncer de piel mejor que los médicos. Sensacionalismos aparte, ¿cuál era el secreto? Más de 100.000 fotos de melanomas introducidas en un algoritmo basado en redes neuronales. Aquí los datos fueron protagonistas por excelencia.

Con nosotros, aquí y ahora (y hacia adelante)

¿Dónde nos ubica esto? En SIMA tenemos el mayor número de monitoreos (+300 mil), lo que equivale al mayor registro en Argentina, y uno de los principales de toda Latinoamérica. Además, contamos con un equipo de Data Science que estudia y aplica inteligentemente los últimos algoritmos utilizados a nivel mundial, con la experiencia agregada del conocimiento sobre el valor que los datos le agregan al agro.

Aquí es donde contamos nuestra historia. Hace unos meses iniciamos una colaboración con el equipo NASA Harvest de la Universidad de Maryland, con el objetivo de predecir rindes de cultivos utilizando el poder combinado de las imágenes satelitales y el gran volumen de datos anonimizados y agregados provistos por SIMA. En ese sentido, estamos preparando un trabajo de investigación que refleja resultados sorprendentes, aumentando en un 20% el nivel de acierto en predicción de rindes sobre métodos actuales.

Esta tecnología que parecía de ciencia ficción está aquí y ahora entre nosotros. Es nuestro trabajo con el equipo de Data Science generar nuevas ideas y resolverlas con la aplicación de métodos novedosos basados en la corta pero productiva historia que comienza en 1955 y sigue hasta hoy. Es entonces en esa dirección en la que nos estamos moviendo: hacia adelante. Aplicando conocimientos y parándonos firmes sobre la solidez y el poder de los datos. En esta primera etapa logramos la construcción de nuevos algoritmos y métodos con la meta de simplificar y mejorar los procesos en el agro.

¿Bola de cristal? No: simplemente datos y un gran equipo de trabajo.