Google anuncia la supremacía cuántica: John Martinis y sus colegas en el Goolge AI Quantum (Mountain View, CA, USA) publicaron en Nature el pasado 23 de octubre lo que se considera todo un hito en la computación cuántica. El ordenador cuántico Sycamore de 53 cúbits funcionales ha ejecutado un algoritmo que genera ruido cuánticamente certificado demostrando la supremacía cuántica (el algoritmo genera ruido, secuencias de números aleatorios, y no tiene aplicaciones prácticas relevantes). El artículo de Google estimó que el supercomputador Summit (el número uno del TOP500) necesitaría 10 000 años para ejecutar lo que Sycamore logra en menos de 3 minutos; desde IBM han criticado el anuncio, primero afirmando que a Summit le bastan al menos de 3 días y luego afirmando que se trata de un hito irrelevante porque no tiene aplicaciones prácticas. El artículo es  Frank Arute, Kunal Arya, …, John M. Martinis, “Quantum supremacy using a programmable superconducting processor,” Nature 574: 505-510 (23 Oct 2019), doi: https://doi.org/10.1038/s41586-019-1666-5.

La inteligencia artificial Pluribus, que juega al póker, venció a jugadores humanos: Pluribus tiene un nivel de juego sobrehumano en la versión más popular del póker online, Texas hold´em sin límites para seis jugadores. Desarrollado por la Universidad Carnegie Mellon (EE.UU.), en colaboración con Facebook AI, ha derrotado a seis jugadores profesionales de póker de primer nivel. Sus creadores, Noam Brown y Tuomas Sandholm usaron un sistema de aprendizaje en el que la IA jugó contra cinco copias de sí misma. Su rendimiento se considera sobrehumano en este juego multijugador tan complicado, algo que parecía casi imposible hace unos años. Pluribus venció a 13 jugadores profesionales de póker, entre los que están algunos de los mejores del mundo, en 15.000 manos. Según los jugadores, su mayor fortaleza reside en su habilidad para usar estrategias variadas. Muchos jugadores humanos tratan de hacerlo, pero la mayoría sencillamente no puede.
A diferencia de otros juegos, como el ajedrez o el go, el póker es un juego con información incompleta en el que los oponentes no saben qué cartas tiene el contrario. En el juego de Pluribus se observa una tendencia hacia los «equilibrios de Nash», estrategias cooperativas en las que ningún jugador tinee por objetivo tener el máximo beneficio, sino que el beneficio se reparta entre todos.  por cambiar su estrategia siempre y cuando la táctica del rival tampoco cambie. Esto implica que una máquina gana cuando el rival no puede mantener el equilibrio. En un juego con más de dos jugadores apostar por el equilibrio de Nash puede llevar a la derrota, por ello no resulta práctico entre humanos. La estrategia de autoaprendizaje de Pluribus le permite adquirir la habilidad de detectar cuándo es práctico usar este tipo de enfoque. El artículo es Noam Brown, Tuomas Sandholm, “Superhuman AI for multiplayer poker,” Science 365: 885-890 (30 Aug 2019), doi: https://science.sciencemag.org/content/365/6456/885; ver también Alan Blair, Abdallah Saffidine, “AI surpasses humans at six-player poker,” Science 365: 864-865 (30 Aug 2019), doi: https://doi.org/10.1126/science.aay7774.

Una inteligencia artificial de Google (Deepmind) vence a jugadores del videojuego StarCraft II: La inteligencia artificial AlphaStar juega a StarCraft II (en este videojuego los seres humanos luchan contra alienígenas) es capaz de derrotar a jugadores profesionales y alcanzar el máximo nivel en la clasificación. Se incluye la visión del mundo “a través de una cámara” y “límites muy estrictos” en la frecuencia de las acciones, para que el juego online sea con las mismas condiciones que los jugadores humanos. AlphaStar ha alcanzado el máximo nivel posible en la clasificación, Grandmaster. Este videojuego es uno de los más complejos en el género de la estrategia en tiempo real, con gran relevancia para el mundo de los e-sports.
Más allá del mundo de los videojuegos, el algoritmo se podría adaptar para solucionar otro tipo de problemas complejos. Se basa en redes neuronales que analizan una situación de juego mediante aprendizaje automático, en lugar de con reglas específicas, y ver qué acción es mejor. En StarCraft II, existen 1026 opciones por cada ‘movimiento’ y miles de movimientos por juego. El programa todavía no está por encima de ‘todos’ los profesionales. El artículo se publicó en Nature como Oriol Vinyals, Igor Babuschkin, …, David Silver, “Grandmaster level in StarCraft II using multi-agent reinforcement learning,” Nature 575: 350-354 (30 Oct 2019), doi: https://www.nature.com/articles/s41586-019-1724-z.

Comentarios

Entradas populares de este blog