Найдена супер стратегия для покера
Программа, научившая сама себя играть в покер, создала практически лучшую из возможных стратегий для одной из версий игры. Это в очередной раз показывает, как современная техника может помочь нам в поиске решений, например, связанных с медициной или любой другой отраслью.
Программа за два месяца разыграла с собой 24 триллиона покерных рук. Вероятно, это число больше, чем все, когда-либо разыгранное людьми, говорит Майкл Боулинг, который руководил проектом.
Финальная стратегия всё-таки не будет выигрышной в ста процентах случаев, из-за неудачных карт. Но в долгосрочной перспективе, она сможет выигрывать тысячи игр подряд! «Мы сможем соперничать с лучшими игроками в мире, и всё равно проиграют они» - говорит Боулинг, из Университета Альберты в Эдмонтоне, Канада.
В любом случае, Боулинг сомневается, что стратегия позволит кому-нибудь заработать состояние на игре. Она работает только при игре в лимитированный Техасский Холдем один на один, такая игра довольно ослабла в популярности за последние годы. Даже в интернете, при такой игре делаются маленькие ставки и, скорее всего, Вы выиграете совсем чуть-чуть.
В покере уже довольно давно используется математический подход к игре, называемый игровой теорией и Боулинг отчитывается, что были внедрены некоторые методы, которые могли бы стать полезными и в других ситуациях. Разработчики изучают возможность помощи врачам, например, определения необходимой дозы инсулина для больных сахарным диабетом. Игровая теория также была использована для планирования патрулирования улиц и может пригодиться в других областях, таких как разработка стратегий для переговоров, аукционов, кибербезопасности, проектировании лекарств и борьбы с эпидемиями.
В покере на двух игроков, каждому из них раздается по две карты втемную и пять других кладутся на стол, лицевой стороной вверх. Игроки делают ставки, затем выкладываются, и снов раздаются карты. Размер ставок фиксируется. Боулинг заявил, что его компьютерная стратегия слишком сложна, чтобы ее кто-либо смог выучить, но его университет создал сайт, где люди могут получить совет по игре от программы или даже попробовать против нее сыграть.
В то время, как ученые годами создавали программы для игры в покер, результат Боулинга выделяется тем, что речь идет о близости к созданию оптимальной стратегии. Это непростая задача, так как покер включает в себя несовершенство информации о картах противника.
Туомас Сэндхолм из Университета Карнеги-Меллона в Питтсбурге, который не принимал участие в новой работе, называет эти результаты вехой. Он сказал, что это впервые, чтобы соревновательная игра с несовершенной информацией, была по сути решена.