Роботы в преферансе

До чего дошел прогресс!
До невиданных чудес!
Опустился на глубины
И поднялся до небес.
Позабыты хлопоты,
Остановлен бег.
Вкалывают роботы,
А не человек...

В клубе Гамблер с 2018 ведется разработка преферансных роботов. Для их создания применены технологии нейронных сетей, их обучение проведено на сотнях тысяч архивных партий. Роботы без устали готовы играть в преферанс. Нам бы их энергию :)

Информация, используемая роботами при игре:

роботам доступна только та информация, которая «легально» известна на данный момент. Кроме своей руки в анализе используются все предыдущие сделанные заявки, ходы, вся доступная информация;
роботы не знают против кого играют. Информация о соперниках (их уровень, опыт, и т.п.) не передается и не используется. Робот не знает против робота или человека играет.

Роботы на данный момент обучены играть только Питер по стандартным конвенциям авторассадки. При использовании их в других играх (ростов, скачки) роботы могут показать полное «непонимание» игры и совершать невыгодные действия.

В очевидных, с точки зрения человека, ситуациях роботы могут сыграть плохо или очень плохо. Это может случиться на висте всветлую или даже на розыгрыше всветлую. Дело в том, что нейронная сеть не использует перебор в принципе. Её функция – выявление наиболее похожей ситуации, и принятие аналогичного решения.

Роботы всегда играют с одинаковой скоростью. Во избежание психологического давления на людей-соперников разработчики искусственно замедлили ходы от роботов и добавили случайные паузы, чтобы «очеловечить» искусственный интеллект.

К сожалению, в редко встречающихся ситуациях роботы могут принимать катастрофические решения. Например, заторговавшишь, заказать 8БК на второй руке без масти...

Роботам пока далеко да мастеров преферанса. Но работа по улучшению качества игры продолжается.

Вопросы и ответы про роботов

1. Расскажите подробнее, как роботы используются в клубе?

Ответ: В игровом зале для тренировки, в турнире Рободуб (дубликатный турнир с роботами) и на фантогеймс – игра с роботами. В планах – для решения задачек по преферансу.

2. Насколько сильны роботы по уровню игры? Можете привести конкретные примеры результатов партий с известными преферансистами? Обыграют ли они Рентгена в Марьяже? :-)

Ответ: Середнячки – примерный уровень рейтинга 400 на текущий момент. Обыграть Рентгена не смогут никогда, не видят карты. С известными преферансистами еще не играли, но всему свое время.

3. Расскажите про обучаемость роботов. Происходит ли постоянное обучение?

Ответ: Во время игры роботы не обучаются. Пока что обучение (переобучение) происходит периодически на обновленном и/или исправленном архиве партий. Обучение производится на действиях, совершенных экспертами, незасимо от того, какой результат был достигнут.

4. Возможно ли игра 2-3 человека+робот? Может ли робот в такой пуле выявлять мошенничество? Не секрет, что опытные игроки могут вычислить шулера математически.

Ответ: Такая игра возможна. Даже сейчас можно открыть стол для друзей, и, ткнув на пустое место, посадить туда роботов. Но выявлять мошенников робот не сможет, и против таковых он будет совершенно беззащитен. Проиграет больше человека, так как будет играть как всегда.

5. Какие планы по развитию алгоритмов? Будут ли в дальнейшем опции при настройке игры для роботов? Что-то типа «Включить учет рейтинга игроков», «Включить учет ошибок в текущей пуле» и т.п.

Ответ: Конкретно про эти настройки не думали. В первую очередь потому, что непонятно как подобному обучать. Все, что робот использует, должно быть внесено в сеть во время обучения. У нас нет информации – учитывают ли (и как учитывают) игроки силу и ошибки оппонентов.

Однако, какие-то настройки возможны, и их можно будет сделать. Например, при игре на открытых картах (розыгрыш всветлую) робот мог бы использовать анализ Профессора, но пока это не реализовано. Такой симбиоз, очевидно, улучшит качество игры робота, по крайней мере не будет происходит неудач на открытых картах.

6. «Оживлять» поведение роботов планируете, делать его более естественным, добавить общение?

Ответ: Да, об этом думаем. Пока что на уровне шаблонных фразочек, но в дальнейшем – так же с использованием нейронных сетей.

На сегодняшний день «оживление» ограничивается лишь тем, что робот делает ход со случайным временным интервалом 0.5с-2с. Без искусственных задержек робот играет настолько быстро, что это подавляет. Ну и «приветствие» в начале игры :-)

Ответы дал разработчик Алексей Жуковский (Beetle).

Комментарии могут добавлять только зарегистрированные пользователи.

Вход Регистрация