Почему киберпанк не имеет массовой популярности? 6 вещей, которые отталкивают «непосвященных» от этого жанра
Несмотря на всеобщую компьютеризацию, литературный жанр «киберпанк» и его идеи не относятс...

Читать

Главные герои киберпанка. Искусственный интеллект (ИИ)
В этой статье мы поговорим об одном из главных героев Уильяма Гибсона (мэтра стиля киберпа...

Читать

Что будет после киберпанка (Часть 2)
Каким будет мир после киберпанка? Утильпанк, биопанк, нанопанк...

Читать
Главная » Новости

Ученые создали ИИ со способностью самообучаться всем играм

AlphaGo Zero
Инженеры DeepMind представили AlphaGo Zero. Она самостоятельно может обучаться играть в любую настольную игру и обыгрывать человека.

Система ИИ AlphaGo была разработана Дэвидом Сильвером и его коллегами в конце 2014 года, и ее работа была протестирована на чемпионе Европы Фане Хое (Fan Hui), который проиграл все пять матчей машине. В марте 2016 года AlphaGo победил чемпиона мира по го в серии из пяти матчей, только один из которых завершился победой человека. С тех пор ИИ победил лучших игроков в го и одержал 60 побед на двух китайских онлайн-платформах с настольными играми FoxGo и Tygem. Сильвер и его коллеги смогли достичь этих успехов, построив свой ИИ на базе не одной, а сразу двух нейронных сетей – особых алгоритмов, имитирующих работу цепочек нейронов в мозге человека.

Следующим шагом в развитии AlphaGo стало устранение ключевого недостатка ныне существующих нейросетей и систем искусственного интеллекта – необходимости обучать их тому, что они должны делать, используя огромные архивы данных, вручную обработанные человеком. Сильвер вместе с командой решили эту задачу, создав принципиально новую нейронную сеть, которая базируется на так называемых алгоритмах обучения с подкреплением. Эта нейросеть, в отличие от ее предшественника, который изначально обучался в играх с добровольцами и имел некоторые встроенные примитивные стратегии игры, начала свою работу с состояния абсолютного новичка без каких-либо знаний – ей были известны лишь правила игры в го, начальные условия и условия победы.

Переход на алгоритмы самообучения не только позволил AlphaGo Zero обыграть со счетом 100-0 свою прежнюю версию, но и улучшил многие другие аспекты работы. В частности, процесс ее обучения занял всего три дня и примерно пять миллионов игр, что было на порядок меньше запросов первой версии ИИ.

«Люди учились играть в шахматы, го, сёги и многие другие игры сотни и тысячи лет. AlphaZero самостоятельно достигла вершин мастерства во всех этих играх без какой-либо помощи с нашей стороны. Моя мечта - создать такую же систему, которая бы не просто умела играть, но и решать повседневные задачи, к примеру, создавала бы новые лекарства» - заявил Дэвид Сильвер (David Silver), главный разработчик компании DeepMind.

Следующими этапами AlphaZero, как отметили ученые, могут стать «настоящие» компьютерные игры, такие как Starcraft II и Dota 2. Успех в данных играх, по их мнению, откроет путь для проникновения самообучающихся ИИ в менее формализуемые области науки, культуры и техники.

Источник


Технологии|      439 | Добавил: admin | Теги: ии | Дата: 2018-12-07
Новости по теме:
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]