Una inteligencia artificial gana por primera vez en partidas de póker con varios jugadores
El robot Pluribus consigue ganar a profesionales del póker en juego de seis jugadores, utilizando una estrategia de aprendizaje sin intervención humana. Teniendo aplicación en la resolución de problemas complejos como en ciberseguridad o sistemas de coches autónomos.
El robot Pluribus, diseñado para jugar al póker ha conseguido ganar a profesionales en su variante llamada Texas hold'em, la versión más popular del póker, en partidas de seis jugadores. El robot se enseña a sí mismo, basándose en un aprendizaje por refuerzo. Comienza jugando al azar y va perfeccionando su técnica y estrategia a medida que va detectando con qué jugadas gana más dinero. En cada mano del juego, comprueba jugadas posteriores con las que ganaría. Si verifica que con éstas consigue mejores resultados es más probable que sea las que use para el juego.
Los investigadores resaltan que la diferencia de este robot con respecto a otros es precisamente la estrategia de elección de jugadas. Pluribus juega con una estrategia fijada que no se basa en observar las tendencias de sus oponentes. Cada vez que tiene que decidir, compara el esquema de juego con el estado de la partida. Revisa unos cuantos movimientos hacia adelante valorando hacia dónde conduce cada acción posible y cuál es la mejor. De esta forma le es posible mejorar sin que intervenga la acción humana, y acaba escogiendo algunas estrategias que los humanos no utilizan en su juego.
La investigación publicada en Science proporciona datos sobre el modo de juego de Pluribus: el robot no sólo consigue ganar a quince jugadores humanos profesionales en una sesión de doce días con más de 10 000 manos de seis jugadores. Cuando juega contra sí mismo, juega una mano en unos 20 segundos, aproximadamente el doble de tiempo que lo haría un jugador humano profesional. Para su funcionamiento se ejecuta con dos unidades centrales de procesamiento. Durante el juego en vivo, debido a la estrategia de juego utilizada y su eficiencia, solo necesita 128 Gb de memoria.
El hecho de que un robot pueda jugar al póker con varios jugadores supone poner las bases de futuras inteligencias artificiales que puedan abordar problemas complejos de la vida real, por ejemplo aplicaciones para coches autónomos, negociaciones automatizadas de subastas e incluso detección de fraudes.
El póker se ha utilizado como problema desafío en el campo de la inteligencia artificial y de la teoría de juegos durante décadas. La razón para escoger este juego es simple: ningún otro juego recreativo popular recoge los retos de la información oculta de una forma tan efectiva y elegante como el póker. Aunque ha sido útil como punto de referencia para las nuevas técnicas de la inteligencia artificial, el reto de la información oculta en el marco de la estrategia no está limitado a los juegos recreativos, sino que tiene aplicaciones en muchos de los desafíos del mundo real tales como la ciberseguridad, el establecimiento de precios o las pujas.
Referencia: Noam Brown y Tuomas Sandholm . 2019. Superhuman AI for multiplayer poker. Science
Según el ángulo de emisión de los ecos los murciélagos pueden captar a las presas posadas en las hojas, lo cual tiene implicaciones en la evolución de las interacciones depredador-presa.
A partir de placas solares y uniendo un dispositivo de purificación de agua se ha conseguido sin disminuir el rendimiento de ambos procesos obtener electricidad y agua limpia. Lo que supone la optimización de los recursos en países de climas áridos de forma sostenible.
El robot Pluribus consigue ganar a profesionales del póker en juego de seis jugadores, utilizando una estrategia de aprendizaje sin intervención humana. Teniendo aplicación en la resolución de problemas complejos como en ciberseguridad o sistemas de coches autónomos.