Новый искусственный интеллект MuZero от DeepMind
В 2016 году компания DeepMind представила AlphaGo, первый искусственный интеллект, победивший одного из лучших игроков мира в го. Два года спустя новая версия искусственного интеллекта AlphaZero с нуля овладела го, шахматами и сёги. Новая разработка MuZero является значительным шагом в сторону алгоритмов общего назначения. MuZero осваивает го, шахматы, сёги и игры на Atari без необходимости объяснять правила игры, благодаря своей способности планировать выигрышные стратегии в неизвестной среде.
В течение многих лет исследователи искали методы, способные построить модель окружающей среды, и затем использовать эту модель для планирования наилучшего курса действий. MuZero решает эту проблему, изучая модель, которая фокусируется только на наиболее важных аспектах окружающей среды. Объединив эту модель с мощным поиском AlphaZero, MuZero установил новый рекорд в играх Atari, а также сравнился с AlphaZero в го, шахматах и сёги.
После тренировки на 20 миллиардах кадров из игр Atari, MuZero показал результат, в среднем в 50 раз превышающий результат игроков-людей.