La jugadora campeona de bridge Sharon Osberg escribió una vez : “Jugar al bridge es como administrar un negocio. Se trata de la caza, la persecución, los matices, el engaño, la recompensa, el peligro, la cooperación y, en un buen día, la victoria”.
Si bien no es de extrañar que el ajedrez cayera en manos de las supercomputadoras de procesamiento de números hace mucho tiempo, esperaría que los humanos mantuvieran una ventaja más inexpugnable en el bridge, un juego de información incompleta, cooperación y comunicación astuta. Durante milenios, nuestros cerebros han evolucionado para leer colas faciales sutiles y lenguaje corporal. Hemos reunido sociedades en expansión que dependen de la competencia y la cooperación de millones. ¿Seguramente tales habilidades están fuera del alcance de las máquinas?
Por ahora si. Pero tal vez no para siempre. En los últimos años, la IA más avanzada ha comenzado a invadir algunos de los territorios que más orgullosamente poseemos; la capacidad de navegar en un mundo incierto donde la información es limitada, el juego tiene matices infinitos y nadie tiene éxito solo.
La semana pasada, la startup francesa NukkAI dio otro paso cuando su IA de juego de bridge NooK superó a ocho campeones mundiales de bridge en una competencia celebrada en París.
El juego se simplificó y NooK no se enfrentó exactamente a los jugadores humanos, más sobre eso a continuación, pero el rendimiento del algoritmo fue, por lo demás, espectacular. En particular, NooK es una especie de algoritmo híbrido que combina IA simbólica (o basada en reglas) con el enfoque de aprendizaje profundo dominante en la actualidad. Además, en contraste con sus pares de aprendizaje puramente profundo, NooK es más transparente y puede explicar sus acciones.
“Lo que hemos visto representa un avance fundamentalmente importante en el estado de los sistemas de inteligencia artificial”, dijo a The Guardian Stephen Muggleton, profesor de aprendizaje automático en el Imperial College London . En otras palabras, no está mal para una computadora fría y calculadora.
Caja Negra, Caja Blanca
Para jugar al bridge, quizás el juego de cartas o de mesa más desafiante jamás abordado por la IA, el equipo de NukkAI combinó el aprendizaje de refuerzo profundo con la IA simbólica, un enfoque utilizado por Deep Blue de IBM para derrotar a Garry Kasparov en el ajedrez en los años 90.
Los algoritmos de aprendizaje por refuerzo profundo se componen de una red de neuronas artificiales interconectadas. Para aprender un juego, un algoritmo se juega a sí mismo miles de millones de veces, evalúa su rendimiento después de cada ronda y mejora gradualmente ajustando y volviendo a sintonizar sus conexiones neuronales hasta que finalmente domina el juego.
La IA simbólica, por otro lado, se basa en reglas. Los ingenieros de software codifican las reglas que la IA necesita saber para tener éxito. Estos pueden ser, por ejemplo, que un alfil puede moverse en diagonal cualquier cantidad de casillas en un tablero de ajedrez, o que si un oponente sigue una estrategia particular, emplear alguna contraestrategia aumenta las posibilidades de ganar. Este enfoque está bien para lo finito, pero a medida que aumenta el espacio de todos los movimientos posibles en los juegos complejos, se vuelve insostenible.
Es por eso que la derrota en 2016 del campeón mundial de Go, Lee Sedol, por AlphaGo de DeepMind fue un gran problema. En ese momento, los expertos no esperaban que la IA venciera a los mejores jugadores de Go durante una década. AlphaGo mostró el sorprendente poder del aprendizaje profundo en comparación con la “buena IA tradicional”.
Pero el aprendizaje profundo tiene sus inconvenientes. Una de ellas es que es una “caja negra”. Es misterioso cómo los miles de millones de nodos en una red neuronal logran cualquier tarea determinada.
El movimiento 37 de AlphaGo contra Lee Sedol fue una elección que ningún ser humano haría: calculó las probabilidades de que un profesional hubiera elegido ese movimiento en 1 en 10,000, pero hizo el movimiento de todos modos y ganó. Aún así, el algoritmo no pudo explicar qué en su entrenamiento informó su confianza. Esta opacidad es un problema cuando las apuestas son más altas que en un juego de mesa. Para confiar en los automóviles autónomos o en los algoritmos médicos que toman decisiones y diagnósticos de vida o muerte, debemos comprender su lógica.
Una solución potencial, defendida por investigadores como NukkAI, combinaría el aprendizaje profundo y la IA simbólica, explotando las fortalezas de cada uno en lo que se denomina un enfoque “neurosimbólico”.
NooK, por ejemplo, primero aprende las reglas del juego y luego mejora sus habilidades jugando. La combinación refina el “cerebro” probabilístico del algoritmo, dijo Muggleton a The Telegraph , llevándolo más allá de las estadísticas. NooK, dijo, utiliza “el conocimiento previo de la misma manera que aumentamos nuestro propio aprendizaje con información de libros y experiencias previas”. Como resultado, el algoritmo puede explicar las decisiones: es una IA de “caja blanca”.
Es por eso que el bridge, un juego de comunicación y estrategia que se resiste a ser conquistado por la IA, es una gran prueba para el enfoque. “En el bridge, no puedes jugar si no explicas”, dijo a The Guardian la cofundadora de NukkAI, Véronique Ventos .
Hay algoritmos para jugar al bridge, pero no se comparan con los mejores humanos. En la competencia de NukkAI en París hace poco más de una semana, la situación parece haber cambiado.
Diversión y juegos
El Desafío NukkAI enfrentó a NooK contra ocho campeones mundiales de bridge.
Cada campeón jugó diez juegos de diez juegos , mientras que NooK jugó 80 juegos de diez juegos u 800 tratos directos. En lugar de jugar entre sí, los humanos y la IA jugaron las mismas manos contra los mismos oponentes, un par de bots de puente (no construidos por NukkAI) llamados Wbridge5.
Un juego de bridge comienza cuando los jugadores hacen una oferta sobre cuántos trucos, o rondas de juego, creen que pueden ganar. La puja más alta se llama contrato, y quien establece el contrato es el declarante. El compañero del declarante, o el muerto, pone su mano sobre la mesa boca arriba y sale del juego. El declarante ahora juega ambas manos contra sus oponentes e intenta ganar suficientes bazas para cumplir con su oferta.
El Desafío NukkAI eliminó las ofertas para simplificar el juego, y tanto los humanos como NooK asumieron el papel de declarante en cada juego, con la pareja de bots del puente como oponentes (o defensores). La diferencia entre la puntuación de NooK y la puntuación de cada jugador humano se promedió en cada conjunto. NooK venció a sus rivales en el 67, o el 83 por ciento, de los 80 sets jugados.
“Es bastante desesperado para los humanos”, dijo el campeón francés Thomas Bessis . “Hay momentos en los que no entendemos por qué la IA está jugando mejor que nosotros, pero lo es. Es muy frustrante”.
La victoria de NooK es una hazaña impresionante, pero hay advertencias . Saltarse el proceso de licitación y jugar solo el papel de declarante eliminó partes desafiantes y matizadas del juego en las que los socios deben comunicarse entre sí y engañar a sus oponentes. Además, es un desafío para un ser humano mantenerse concentrado durante 100 manos seguidas, pero no tanto para una computadora. Finalmente, el cofundador de NukkAI, Jean-Baptiste Fantun, dijo que confiaba en que la máquina prevalecería sobre miles de acuerdos, pero se mostró menos optimista acerca de sus perspectivas sobre solo 800. En otras palabras, cuanto más juegue, mejores serán sus probabilidades de ganar. así que jugar muchas manos consecutivas puede haber ayudado a la IA a empujar a los humanos en este caso.
“Entonces, incluso en el bridge, hay otras cosas por resolver”, dijo Fantun . “Todavía tenemos una hoja de ruta por delante”. Es decir, es demasiado decir que el bridge ha caído en manos de la IA, como el ajedrez o el Go. Pero la IA que supera a los mejores jugadores humanos en parte del juego es un hito clave en el mapa de Fantun. Y aunque los algoritmos de IA cada vez más grandes , como GPT-3 de OpenAI, continúan impresionando, el rendimiento de NukkAI en puente puede agregar peso al argumento a favor de un enfoque híbrido.
A continuación, tendrán que demostrar que NooK puede jugar y ganar, sin necesidad de descargos de responsabilidad.
Fuente:
Dorrier, J. (2022f, abril 3). A Hybrid AI Just Beat Eight World Champions at Bridge—and Explained How It Did It. Singularity Hub. Recuperado 4 de abril de 2022, de https://singularityhub.com/2022/04/03/a-hybrid-ai-just-beat-eight-world-champions-at-bridge-and-explained-how-it-did-it/