博弈论的最佳解决方案:关于GTO扑克的几点思考(上) 博弈论的最佳解决方案:关于GTO扑克的几点思考(上) 如需系统学习GTO,请点击查看德州扑克GTO视频课程:https://www.moshi

博弈论的最佳解决方案:关于GTO扑克的几点思考(上)

如需系统学习GTO,请点击查看德州扑克GTO视频课程:https://www.moshike.com/a/4232.html

GTO扑克中的“GTO”意思是”游戏最优策略”。在扑克中,这个术语会被抛出来表示一些不同的概念。

GTO指的是关于给对手建模的思想,以及根据范围和概率来思考扑克局面,而不是严格地以结果为导向。

有时候,这些想法会变成年轻的职业玩家在扑克室大喊一个给定打法是否属于“GTO”或者“反GTO”,我们经常在论坛里也会看到这样的帖子。

但是,GTO扑克的真正含义是什么?它适用于您的游戏吗?

寻求一个无法被剥削的策略

游戏的最佳解决方案具有精确的数学定义。

有趣的是考虑这些对扑克玩家意味着什么,以及该概念如何成为研究理想扑克策略的主要框架。

由于笔者这些天的大部分时间都花在构建扑克游戏水平强悍的计算机AI上,所以我经常在思考计算机如何看待无法被对手剥削的GTO扑克策略。

GTO(尤其是在现代扑克游戏中)主要是追求一种策略,使您无法被对手占便宜。

想想《杀死比尔》中的乌玛·瑟曼。或任何布鲁斯·威利斯电影中的他。

在扑克之外,在介绍GTO的时候总要讲到“囚徒困境”。

假设,我们两个人因共同犯罪被捕。如果我们俩都不说话,我们俩都只面临一个月监禁。但是,如果我们中的一个人背叛了另一个人,那么告密者就可以无罪释放,而另一个人会面临一年监禁。

如果我们俩都认罪,那么我们俩都会受到稍微严厉的判决监禁三个月,因为每个人的证词都可以用来对付对方。

即使我们在第一种情况下最好(没人认罪),但无论对方怎么做,每个人最好的策略还是与当局合作,(如果我不认罪,你认罪告密你就没事了,那如果我认罪了,那么你最好的策略也是认罪)。

在玩家相互利用而获得回报的环境中,即使各方都能从中受益,也可能不值得合作。

“泡沫困境”

这相当于两名玩家在锦标赛的泡沫阶段中进行对抗。

除了不怕泡沫破裂的超深筹码可以肆意地抢夺别人的筹码,其余玩家都可以从导致淘汰的对抗中受益。

因此,对抗的两个玩家只是通过试图淘汰对方来伤害自己。但是,他们不可能共同寻求互惠互利的解决方案。

对于一名有思想的扑克玩家来说,对对手试图击败你的尝试做出反应是很自然的,冠以GTO扑克的名头似乎有点多余。

当然,对手有策略。您对他持各种底牌的策略将有所了解,你的工作是在执行自己的策略时将其考虑在内。

换句话说,游戏对手。这就是GTO扑克的全部目的。

“解决”扑克游戏(以及其他游戏)

当你根据对手的策略调整策略时,他或她将根据你的策略进行调整,依此类推。

对于单挑限注德州扑克,艾伯塔大学团队将这一过程做出了合乎逻辑的结论,并于今年早些时候在《科学》杂志上发表了他们的结果。

他们利用计算机网络开了两个策略,反复调整以适应对方的游戏。

最终,他们达到了一种状态,在任何特定情况下,任何一方都无法获得比对方多获得甚至1%的优势。

这听起来很复杂,简单来说,从本质上讲,他们达成了一种策略,对手无法利用其他任何可能的策略来剥削我们,或者至少不会拥有超过1%的优势。

令人困惑的是,阿尔伯塔大学的团队声称已经“解决”了单挑限注德州扑克,而实际上他们只是为单挑限注德州扑克找到了一个GTO平衡,并且可能存在其他平衡点。这还有待发现。

根据该论文,他们的“接近完美”的单挑限注德州扑克机器人在按钮位90%以上加注,但是在面对3bet后,它几乎从来不做4bet,即使手上是AA。

这似乎暗示在按钮位用AA做4bet是错误的,或者至少不如通过平跟3bet来掩饰手牌那样有利可图。

第一次阅读他们的论文时,这肯定是我认为的含义。

但是,阿尔伯塔的人很快指出,在按钮位用AA跟注3bet,只是在他们发现的GTO平衡中是最佳的。

考虑到其他策略,用口袋对A进行4bet可能不是最优的。您可能可以用AA去做4bet,但是接下来需要调整其他策略。

至少,你也需要用其他的牌4bet,以免暴露你的AA。如果他们用AA做4bet,然后再把其他的策略跑一遍直到稳定,是否会达到不同的GTO平衡?那将是一个有趣的实验。

在实践中,如果您知道对手将用一对跟注AA,而不是知道你的4bet范围很紧的话,那么你就少赢了一注。

在The Thinking Poker Podcast的一集中,Andrew Brokos和Nate Meyvis很好地解释了这一点。

博弈论对最佳玩法有很强的定义,在这种情况下,您应该考虑到用任何一手牌做出的每一次玩法都是平衡的一部分。

但是,在实际情况下,考虑到你可能玩的手牌范围以及对手可能的手牌,在该情况下只有95%的打法是最优化的。

在节目中讨论过的一手牌中,一位听众在有限德州扑克游戏中没有位置在高牌Ace牌面,手持KK。

单挑时,这仍然是一手正ev的牌,但下注没有太大价值。对手有Ace不会弃牌,而过牌可以从诈唬哪里或者从更小的中对那里获得价值。

让我们考虑一下计算机AI可能遇到的情况。

假设您正在玩$ 100 / $ 200级别的限注德州扑克。底池里有$ 400,而你在翻牌前用KK加注。

此时你的期望价值可能约为+ $ 700(包括现有底池以及未来赢到更多筹码的价值)。现在在有高张A翻牌面,你的价值下降到+ $ 300左右。

更重要的是,过牌跟注的价值下降的幅度可能小于下注的价值。

假设双方都玩的很好,长远看不输不赢,估计你的手牌价值是另一种模拟GTO的方法。

博弈论的最佳解决方案:关于GTO扑克的几点思考(下):https://www.moshike.com/a/2682.html

FAQ

如何通过 WPK-微扑克 加入俱乐部或获取更多信息?

如何通过 WPK-微扑克 加入俱乐部或获取更多信息?

请访问weipuke.org,联系客服,添加微信,加入微扑克俱乐部,上下分无忧,以获取更多信息和加入指引。如有其他问题,请随时访weipuke.org联系我们的客服。

如何使用 Neteller 在 WPT Global 上存款?

如何使用 Neteller 在 WPT Global 上存款?

若要使用 Neteller 存款,請建立並驗證一個帳戶。然後,您可以使用多種方法為您的 Neteller eWallet 充值。要在 WPT Global 存款,請登入您的玩家帳戶並前往收銀台。點擊「存款」並從可用選項中選擇 Neteller。請依照螢幕上的指示進行存款。

WPT 会员的级别和费用是多少?

WPT 会员的费用根据不同的会员级别而有所不同:

  • 基础会员:完全免费,允许访问玩钱游戏。
  • VIP 会员:每月 $27.95,提供参与超过 $100,000 奖金的比赛机会。
  • 钻石会员:每月 $149.95,除了 VIP 会员的所有福利外,还提供独特的钻石赛事和更高的奖金池。
  • 超级星期六:每月额外 $100,可以添加到任何会员级别,提供每周六的特别卫星赛事,确保至少五个 WPT 现场活动的名额

线上德州扑克优质局百桌爆满,2000人规模大俱乐部!

1. 什么是《微扑克》wepoker俱乐部?

《微扑克》wepoker俱乐部是一个规模达2000人的线上德州扑克俱乐部,提供优质的游戏体验。

2. WPK-微扑克 俱乐部的桌数和玩家规模如何?

俱乐部拥有百桌爆满的游戏环境,确保玩家随时都有桌子可玩。

3. 如何进行结算和换桌?

玩家离桌后可立即结算,且可以快速换新桌,确保游戏的流畅性。

4. 新人和老客人是否有福利?

是的,新人上桌可享受红包福利,老客人回归时也有相应的回归福利。

5. WPK-微扑克 俱乐部的公平性如何保障?

俱乐部采用100%公平公正的游戏机制,并配备GPS、IP及最严密的伙牌查询系统,让您放心游戏。

6. 如何加入 WPK-微扑克 俱乐部?

请下载APP并联系客服(如何加入俱乐部具体详情请咨询weipuke.org微扑克客服 ),获取加入俱乐部的指引。

WPK-微扑克 俱乐部提供哪些级别的游戏?

WPK-微扑克 俱乐部提供哪些级别的游戏?

小级别:1/2 到 3/6

中级别:5/10 到 10/20

高级别:20/40

如有其他问题,请随时访weipuke.org联系我们的客服。

🎰 最新文章 🎥 😚 热门文章 😚
😈 推荐文章 🎁

适合新手的翻前打法 适合新手的翻前打法 翻前打法如果漏洞很大,后面三条街都很难再力挽狂澜。 翻前的动作是我们后面所有决定的基础,假如翻前技术掌握不好,翻后就很容易翻

暗三条应该快玩还是慢玩 暗三条应该快玩还是慢玩 在我看来,牌手们往往武断地决定是快玩还是慢玩一手大牌,我觉得这是个代价昂贵的错误。在德州扑克中,你的大牌占据你成本底线

学习德州扑克的方法 学习德州扑克的方法 扑克策略文章作者Barry Carter凭借自己多年在这个圈子从业的经验,并参照之前访问各类牌手所得到的信息,总结了几篇关于

口袋99翻前被3bet怎么办 口袋99翻前被3bet怎么办 牌局背景及过程 这手牌来自一个盲注1/3刀的无限德州扑克常规局(现场局)。桌上玩家筹码量如图。翻前,你在UTG位置

如何剥削对手的漏洞 如何剥削对手的漏洞 剥削策略的使用与平衡策略完全不同,平衡策略是假定对手将使用最优打法为前提,而剥削性策略则是假定对手的打法中存在一个或多个具

德扑高手的持续性下注为什么越来越小了? 德扑技巧和策略是一个更新迭代很快的时髦产物。优秀的牌手总是能另辟蹊径,其余的普通牌手所能学习到的,通常是当某种策略已经变成了“标准”。通常,

德州扑克中低额级别对抗超凶玩家的三个建议 德州扑克中低额级别对抗超凶玩家的三个建议 即便是扑克游戏问世的初期阶段,好的玩家们都知道赢下底池就必须要打得激进。和其他的建议一样,这种使用激

低级别牌桌盈利策略 低级别牌桌盈利策略 这张桌子上这个时间的赢利策略,换张桌子或换个时间就不中了。 用什么牌入池,加注多少,Cbet频率和大小,得不停调整。 我今天在

如何在持有非强牌的情况下赢下更多的底池 如何在持有非强牌的情况下赢下更多的底池 每个人拿到好牌和差牌的数量总体是上一样的,但为什么有的人就可以在这个游戏中成功,并把玩牌作为职业来生存

抓诈牌是什么意思 抓诈牌是什么意思你将在这篇文章看到的三手牌,将帮助你找出更多的诈唬以及在正确的时候弃牌。以下每手牌都将包括来自Upswing教练、中注额顶级

诈唬是什么意思? 德州扑克中的诈唬是什么意思? 在了解“诈唬”这个词之前,我们先来了解重温一下在德州扑克游戏中,怎么样才算赢?也就是说怎么样才能获得底池中的筹码

德州扑克马脚 德州扑克马脚 什么是马脚?是牌手本人在打牌时不自觉形成的各种小动作的习惯么? ▲线上丶线下德州扑克的优劣 由于互联网和移动支付越来越便捷,很多玩家

https://betxx.vip/pokerapp/
WPT Global全球微扑克