top of page

Al Robot: El poder de las predicciones


El poder de las predicciones


Se imaginan que tuviéramos el poder de predecir la siguiente tormenta, diagnosticar alguna enfermedad, predecir cual será la siguiente compra que hará un usuario, saber a dónde irán de vacaciones, encontrar barcos perdidos en altamar, identificar por quien votarán en las próximas elecciones.


Aunque lo anterior pareciera ser un caso de leer la fortuna para adivinar el futuro, como agarrar el periódico para leer mi horóscopo y saber que pasará durante mi día. Sin embargo, algunas sino es que todo lo comentado anteriormente ya es posible, hoy nos adentraremos en revisar algunos casos de empresas que ya están logrando alcanzar este tipo de predicciones.


Hay un fenómeno que está ocurriendo hoy en día donde vemos patrones, conexiones o ambos en sucesos aleatorios o datos sin sentido llamado apofenia que sucede tanto en los ámbitos de la Psicología como de la Estadística. El mejor representante en psicología sería la lectura del horóscopo y en estadística lo que llaman un falso positivo.


A veces se nos vende la idea que estamos tan avanzados en tecnología que se crean falsas expectativas en la población, como hacer creer que ya tenemos al androide que va a venir a conquistarnos, o que ya existe una organización que controla el clima, etc. Esto se debe en gran parte a que vivimos en un mundo poblado de datos, notas, comentarios, noticias falsas donde manipulan la estadística para hacer patrones creando relaciones donde en la vida real no existen, pero como la relación parece coherente nos tragamos el cuento rápidamente.


Se han logrado grandes avances, sin embargo, aún nos falta investigar más, aprender y mejorar muchas de las herramientas actuales. Hace poco veía la segunda portada que saco The Economist donde varias personas han llevado a cabo su interpretación, lo más curioso que me encontré en varias páginas que hacían su análisis de dicha portada es que apuntaban al reloj del juicio final, que ya estamos muy cerca.


Revise varias interpretaciones, y casi todo se centra en epidemias, erupciones volcánicas, virus, meteoros a punto de estrellarse con la tierra, bombas nucleares, guerra, y podría continuar pero en realidad es algo en lo que estamos sumergidos actualmente, que no lo vivamos o experimentemos en carne propia porque no vivimos en algún país que está sufriendo este tipo de ataques no significa que no esté sucediendo actualmente, entonces creo que antes de alimentar este pensamiento apocalíptico deberíamos ser un poco más analíticos. Solo para dejarte un dato estimado lector, el fin del mundo es y ha sido una de las grandes obsesiones de la humanidad, dicen que los mayas predijeron el fin del mundo en Diciembre de 2012, la mitología nórdica hablaba de que sería en Febrero del 2014, diferentes corrientes religiosas han ido cambiando la fecha cada vez que no sucede, entonces al estar sumergidos siempre en la espera de dicho fenómeno podemos dar interpretaciones que al final recaen en lo mismo pero que no necesariamente predicen el futuro, y es un poco de lo que veremos en este artículo.


Por eso quise hacer notar que este fenómeno no sucede únicamente en lo exotérico, también las ciencias se ven afectadas por ello, es por esta razón que se descartan algunos resultados por carecer de las relaciones necesarias que justifiquen el comportamiento de algún experimento. Siempre he sostenido el estar investigando, preguntándonos el porqué de las cosas para no quedarnos con la primera idea y dar una explicación falsa que con el tiempo se transforma en algo verdadero.


Tal es el caso de tan infame afirmación: “El ser humano solo utiliza el 10% del cerebro” derivado de un artículo científico que afirmaba “Hemos avanzado tanto en el estudio del cerebro que lo único que conocemos es lo que hace el 10 % del mismo” lo que derivó en que la primera afirmación sea utilizada por los couches que andan por allí con programas de autoayuda, emprendimiento, alcanzar metas, y ahora tomo mundo cree que nuestra utilización del cerebro es muy baja, por eso me gusta cuestionarme las cosas, para poder avanzar y comprender los fenómenos que pasan a nuestro alrededor. Esta frase impartida por el maestro al alumno es alentadora para que el estudiante saque toda su capacidad, pero no lo tomemos como algo literal.


A que me lleva todo esto, en el entendimiento de patrones, hay que saber leer bien los datos para no caer en falsas afirmaciones, explicando un poco los falsos positivos cuando correlacionamos variables con la intención de encontrar algo, al final nos parece que los resultados son coherentes, pero son relaciones sin fundamentos que pueden derivar en un error o peor aún tomar una decisión incorrecta.


Se ha encontrado realizando diversos estudios que una apreciación aislada no aporta suficiente valor como si lo tiene un conjunto de datos para determinar el valor de un resultado. Veamos el caso de adivinar cuantas canicas contiene un frasco, si preguntamos de manera aislada la mayoría de las personas dista en un porcentaje muy amplio del valor total de las canicas dentro de dicho frasco, pero cuando se toma todas las predicciones de un grupo de personas y se les promedia nos damos cuenta que con datos aislados no podemos acercarnos a un resultado viable, pero cuando hacemos la recolección de varios de ellos con la relación correcta podremos estar muy cerca del valor real o inclusive de dar exactamente en el blanco.


Por esta razón el dejar que un científico de datos, ingeniero en sistemas, programador decida como debe estructurarse algún programa para análisis de resultados puede resultar un gran error, a pesar de que esta persona este sumamente capacitada no tiene la sensibilidad de conocer lo que mueve el negocio porque no es el dueño de este, por lo tanto, requiere del análisis sensible de la experiencia con la explotación de los datos.


Un caso de la vida real sucedió en uno de los deportes estrellas en los Estados Unidos, el béisbol, un análisis estadístico de porcentajes de veces que un jugador llega a tomar una base ayudo al gerente general de los Athletics de Oakland a reclutar un equipo capaz de sacar de la mala racha a su equipo. Logrando así el histórico de 20 victorias consecutivas durante la temporada, es cierto que en la postemporada perdieron, pero su modelo fue revolucionario en 2002, que le permitió dado su bajo presupuesto reclutar jugadores baratos dado que sus otras estadísticas eran bajas, pero gracias a los algoritmos y la ciencia de datos no eran determinantes para lograr estar en base, hacer carreras y ganar partidos. Este modelo fue aplicado por los Red Sox de Boston que contaba con un mejor presupuesto para ganar la serie mundial dos años después del fenómeno en Oakland. Sin embargo, aquí no se encontraba solo el científico de datos, estaba el gerente que tenía la experiencia de un jugador y por supuesto conocía su deporte por no decir su negocio.


Ese es el gran potencial del machine learning, el procesar grandes cantidades de números, hacer relaciones, siempre y cuando sean coherentes que permita la toma de decisiones de un humano. Son herramientas de apoyo que permiten hacer los cálculos que nos tomarían días, meses o años de prueba y error sin la utilización de las máquinas. Nuevamente se tiene que llevar a cabo una relación coherente, de otra forma tendríamos lo que se denomina un falso positivo que solo funcionará una vez pero que jamás se podrá repetir llegando a tener un conocimiento erróneo de las cosas. El analista o científico de datos debe ser capaz de identificar la hipótesis nula, veamos 3 ejemplos:


  • Se considera que el paciente está enfermo, a pesar de que en realidad está sano; hipótesis nula: El paciente está sano.

  • Se declara culpable al acusado, a pesar de que en realidad es inocente; hipótesis nula: El acusado es inocente.

  • No se permite el ingreso de una persona, a pesar de que tiene derecho a ingresar; hipótesis nula: La persona tiene derecho a ingresar.

Lo que puede derivar a la larga en una expectativa falsa, denegar alguna prueba y provocar la desconfianza en el sistema, por esta razón no es un trabajo que se debe hacer a la ligera. Sin embargo, en mi experiencia esto se atribuye mucho a la ética del personal que requiere presentar cierta información a sus superiores, lo que yo pude encontrar era algo que en la jerga común se dice: “cucharear datos” con el objetivo de presentar resultados favorables.


El fenómeno anterior es muy común, se da a nivel persona, en empresas pequeñas y por supuesto a escala global. Por eso hay que tener cuidado cuando en ciertos medios se nos presentan datos con gráficos muy vistosos porque esto puede desviar nuestra atención del valor real de los resultados presentados. Por eso no dejaré de insistir en aprender el lenguaje del futuro, que es aprender a leer los datos “Data Fluency”.


Veamos otro caso exitosísimo de lectura de datos, que ha llevado a esta empresa a catapultarse sobre su competencia y que durante la pandemia ha logrado tener un repunte extraordinario. Hablo de la empresa Walmart quien ha hecho un extraordinario trabajo analizando sus datos permitiéndole adelantarse a su competencia, así como predecir lo que sus clientes consumirán.


Antes de que el termino de Big Data fuera acuñado, la empresa Walmart ya dominaba con sus técnicas de análisis de información que recolecta diariamente de sus consumidores, recuerdan cuando la cajera preguntaba si habíamos encontrado todo lo que buscábamos, y cuando la respuesta era negativa se anotaba en una lista. Muchos pensarían que eso sería una nota mala para la tienda, y que tal vez estaban siendo calificados cuando es todo lo contrario con esos datos alimentados con las compras de miles de clientes podrían dictar las necesidades de consumo de cierta población que acudía a esa tienda en particular.


Por eso cuando acudimos a estas tiendas en diferentes zonas, notamos que los productos también cambian de acuerdo con la región para satisfacer a sus clientes. Con la tecnología actual como las aplicaciones web, la banca electrónica, sensores de proximidad, entre otras Walmart es capaz de identificar a través de cámaras y sensores lo que se toma de cada anaquel, al llevar a cabo análisis de las facturas electrónicas observan el patrón de consumo de sus clientes. Utilizando sus tarjetas de crédito puede monitorear el tipo de compras de sus clientes y las zonas donde acude a comprar.


Eso es un mundo de datos, y tan solo Walmart cuenta con su propio Big Data de escala mundial, veamos:


  • Walmart cuenta con más de 20,000 tiendas en 28 países.

  • Cuenta con una aplicación que le permite revisar los precios que maneja su competencia. Lo que aprovecha para bajar sus precios.

  • Cuenta con 150 petabytes de información. Lo que le permite hacer un análisis predictivo, dándole una enorme ventaja sobres su competencia. Tiene su propia nube de datos.

  • Cuenta con un equipo especializado para la venta en línea que le dio la posibilidad de mantener o aumentar sus ventas, siendo la mayor parte de ellas en línea durante la pandemia.

  • Cuenta con más de 200 fuentes de datos diferentes: datos externos e internos que le ayudan en el análisis interno sino del comportamiento global exterior.


Estos son solo algunos de los puntos que podríamos hablar de Walmart, pero el trabajo no termina allí, han hecho algo sumamente importante para que le permita predecir el comportamiento de sus clientes.


Crearon un concepto parecido a los Starbucks, un punto de reunión donde acompañados de un café se sentarán a platicar los líderes de un área con los científicos de datos para pedirles consejos en como analizar la información que arrojaba el sistema. En muchas empresas se contratan consultoras externas para desarrollar sus plataformas de análisis, se crean las bases de datos y se le entregan al cliente para que haga la explotación de sus datos, en pocas palabras para sacar una serie de reportes, que a la larga no llevan a nada concreto. Esto hace que las personas se frustren al no entender cómo funcionan las herramientas y decidan regresar a sus métodos tradicionales.


Con esto Walmart cambio ese concepto y permitió conectar a sus áreas con los datos para aprovechar los sistemas aumentando los rendimientos de la empresa. Y ahora con la ayuda de internet pueden hacerlo de manera global, tirando consultas en línea con los analistas para entender que está pasando con las tiendas. Un ejemplo claro es cuando una tienda en algún punto del mundo no lograba que se comprará una nueva golosina en las celebraciones de Halloween, al consultar al científico de datos sobre cómo lograr vender el producto se descubrió que el producto seguía almacenado y no se había colocado en los anaqueles correspondientes por lo tanto no estaba a la vista de los consumidores objetivos. Todo esto es posible porque Walmart ha analizado donde y como colocar los productos para su compra.


Esto es un claro ejemplo de cómo las empresas deben ir aprendiendo como leer sus datos y permitirles a sus empleados el acercarse a explotarlos creando una cultura orientada al análisis de información.


Un dato aislado no permite llevar a cabo un análisis completo de un fenómeno, cuando se generan grandes fuentes de datos, así como se tiene las herramientas y el interés por explotarlo podemos predecir situaciones que ayudarán a tomar mejores decisiones.


Aquí observamos un claro ejemplo del uso de datos que los consumidores arrojamos diariamente, parece un caso insignificante cuando vamos al super a realizar nuestras compras semanales, cuando juntamos a varios individuos podemos predecir los gustos, tendencias y preferencias de una población específica. Ahora imaginemos si nosotros subimos todos estos datos de forma constante a través de internet utilizando alguna aplicación o red social la cantidad de cosas que podríamos hacer para prevenir accidentes, actuar de forma oportuna ante una catástrofe, sin embargo, a veces no nos percatamos del regalo que hacemos al mundo para obtener una venta.


Consultando con compañeros del medio dedicados a la seguridad de información me doy cuenta de que nuestros inocentes actos de subir fotos, comentar alguna situación, comprar lo que nos gusta en línea, los correos que mandamos y los que no mandamos aportan miles de millones de datos que ciertas empresas han empezado a utilizar para llevar todas las acciones que comentaba al iniciar esta columna, por eso muchos de esos casos son una realidad hoy en nuestras vidas. En algunos casos resultan un beneficio para nuestra sociedad, pero en otros casos podrían ser utilizados para prácticas cuestionables. ¿Qué tan dispuestos estamos para seguir compartiendo nuestros datos con el objetivo de tener una vida más fácil?


“Las cosas fáciles y gratuitas tienen un gran valor para el que sabe vender”


Aviso Oportuno

1/13
WhatsApp Image 2024-05-15 at 1.09.41 PM.jpeg
organon_Mesa de trabajo 1.jpg
La Lealtad 243x400px.jpg
BANNERS INUNDACIONES_LA LEALTAD (1).jpg
bottom of page