Ученые создали ИИ со способностью самообучаться всем играм | |
Система ИИ AlphaGo была разработана Дэвидом Сильвером и его коллегами в конце 2014 года, и ее работа была протестирована на чемпионе Европы Фане Хое (Fan Hui), который проиграл все пять матчей машине. В марте 2016 года AlphaGo победил чемпиона мира по го в серии из пяти матчей, только один из которых завершился победой человека. С тех пор ИИ победил лучших игроков в го и одержал 60 побед на двух китайских онлайн-платформах с настольными играми FoxGo и Tygem. Сильвер и его коллеги смогли достичь этих успехов, построив свой ИИ на базе не одной, а сразу двух нейронных сетей – особых алгоритмов, имитирующих работу цепочек нейронов в мозге человека. Следующим шагом в развитии AlphaGo стало устранение ключевого недостатка ныне существующих нейросетей и систем искусственного интеллекта – необходимости обучать их тому, что они должны делать, используя огромные архивы данных, вручную обработанные человеком. Сильвер вместе с командой решили эту задачу, создав принципиально новую нейронную сеть, которая базируется на так называемых алгоритмах обучения с подкреплением. Эта нейросеть, в отличие от ее предшественника, который изначально обучался в играх с добровольцами и имел некоторые встроенные примитивные стратегии игры, начала свою работу с состояния абсолютного новичка без каких-либо знаний – ей были известны лишь правила игры в го, начальные условия и условия победы. Переход на алгоритмы самообучения не только позволил AlphaGo Zero обыграть со счетом 100-0 свою прежнюю версию, но и улучшил многие другие аспекты работы. В частности, процесс ее обучения занял всего три дня и примерно пять миллионов игр, что было на порядок меньше запросов первой версии ИИ. «Люди учились играть в шахматы, го, сёги и многие другие игры сотни и тысячи лет. AlphaZero самостоятельно достигла вершин мастерства во всех этих играх без какой-либо помощи с нашей стороны. Моя мечта - создать такую же систему, которая бы не просто умела играть, но и решать повседневные задачи, к примеру, создавала бы новые лекарства» - заявил Дэвид Сильвер (David Silver), главный разработчик компании DeepMind. Следующими этапами AlphaZero, как отметили ученые, могут стать «настоящие» компьютерные игры, такие как Starcraft II и Dota 2. Успех в данных играх, по их мнению, откроет путь для проникновения самообучающихся ИИ в менее формализуемые области науки, культуры и техники. | |