Saltar al contenido

La nueva IA de Deepmind puede vencerte en los 57 juegos de Atari 2600

Abr 6, 2020
La nueva IA de Deepmind puede vencerte en los 57 juegos de Atari 2600

La Inteligencia Artificial (IA) es una tecnología que se ha apoderado de todas las industrias desde el pasado reciente. Desde tareas de vigilancia hasta incluso analizar rasgos humanos , la IA ha mostrado grandes promesas en todos los sectores en los que se ha implementado. Ahora, una nueva IA presentada recientemente muestra que puede vencer a los seres humanos en todos los juegos clásicos de Atari 2600.

La empresa matriz de Google, la filial de investigación con sede en Londres de Alphabet, Deepmind ha creado Agent57 que supera los puntos de referencia humanos estándar en los 57 juegos de Atari 2600. Anteriormente, vimos a la compañía crear una IA que podía renderizar modelos 3D a partir de imágenes 2D . Esta vez, en un artículo reciente , la compañía declaró que ha creado el Agent57, que es el primer agente de aprendizaje por refuerzo profundo (Reinforcement Learning ) que tiene la capacidad de vencer a cualquier humano en los juegos de Atari 2600 , los 57 de ellos. De ahí el nombre Agent57.

En 2012, Deepmind recomendó el Arcade Learning Environment , que es una colección de 57 Atari 2600 (llamado Atari57), como un conjunto de tareas de referencia para que lo domine una IA. Según la compañía, esta variada gama de juegos desafía a la IA de muchas maneras. Entonces, desde esta vez, estos juegos de Atari se han convertido en un punto de referencia en la comunidad de Reinforcement Learning (RL).

Ahora, Deepmind, para crear el Agent57, vinculó su agente de exploración anterior, «Never Give Up» (NGU) con un metacontrolador. Esto fue para lograr un equilibrio de exploración-explotación en los juegos. Según Deepmind, si un agente aprende cuándo explorar un juego y cuándo explotarlo, puede lograr un rendimiento superior al nivel humano en los juegos fáciles y difíciles .

Al combinar el metacontrolador con el agente de exploración NGU, nació el Agent57 que puede aprender una familia de políticas en los juegos y el metacontrolador selecciona la elección de una política. Esto permite al agente vencer a cualquier humano en los 57 juegos de Atari 2600.

Sin embargo, la compañía de investigación con sede en Londres todavía piensa que Agent57 se puede mejorar. A medida que la IA aprende más cuando falla en una tarea, tiene mucho alcance en el futuro.

Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.

ACEPTAR
Aviso de cookies