从博弈论的角度分析诈唬(1):什么情况下该诈唬 从博弈论的角度分析诈唬(1):什么情况下该诈唬 这篇文章的主要内容• 数学背景 • 最佳策略 • 纳什均衡点 诈唬是德州扑克游戏的重要组成部分,每一个优秀

从博弈论的角度分析诈唬(1):什么情况下该诈唬

这篇文章的主要内容• 数学背景

• 最佳策略

• 纳什均衡点

诈唬是德州扑克游戏的重要组成部分,每一个优秀的玩家都应该牢记。从不诈唬或太频繁诈唬,对一个德州扑克玩家来说都是巨大的错误。如何找到适当的平衡点?什么时候诈唬才是理想的选择?什么时候,以什么样的频率对某些玩家诈唬才能打出有收益的扑克呢?

这篇文章会涉及到诈唬的数学背景,并利用博弈论阐述一些策略。

我应该诈唬吗?你正处在河牌圈,牌面是6♠9♥K♠A♦5♣。

你确定对手有一手成牌。从他的行动你认为他可能有AA,KK或AK。你的牌是J♠10♠。

你听牌失败。底池是$100,你和对手还各剩$100,你先行动。这时过牌你就输了。(如果对手也过牌,你会输掉摊牌;如果对手下注,你也没足够的钱去诈唬他。)

假设对手读出了你的牌,在河牌之前,他猜到你在听牌。为了简单起见,我们假设他有80%的概率认为你听同花或卡顺失败,另外20%的概率认为你有87,在河牌击中顺子。

如果你有87,击中顺子,你应该价值下注,可惜你没有。你有两个选择:过牌放弃,或是尝试诈唬拿下底池。假设你在诈唬时,会全下所有$100,也就是一个底池,你的诈唬频率应该是多少?

这个问题的答案是什么?

要回答这个问题,我们需要利用一些数学工具。别担心,不会太复杂,你只需一点代数知识和一些常识。差点忘了,还有博弈论,但是只会用到很常识的部分。

把问题转化为数学我们会用到一些符号。P代表底池大小,B代表下注大小。q代表对手认为你会赢这手牌的概率。在我们的例子中,P=$100,B=$100,q=0.20.如果你对20%这个数字不满意,可以换掉,计算方法是一样的。同样,你也可以改变底池大小和下注大小。

我们需要用符号表示诈唬频率和对手的跟注频率。x代表诈唬赔率,y代表跟注赔率。如果我们有30%的概率诈唬(x = 0.3),从长期来看我们诈唬的频率就是30%。同样,y表示对手会跟注我们下注的频率。

所以我们初始的问题变成了求x的最佳值。

期望回报和纯策略首先,追溯到最初始的问题。我们打扑克的目标是什么?赢钱。准确地说,是赢尽可能多的钱。在做决定的时候,我们要问问自己,哪个行动会有最大的期望回报?

在这个例子中,如果你有优胜牌,你会做价值下注。在你下注以后,对手可能跟注(y),也可能弃牌(1 – y)。

当他跟注时,你会赢下现有的底池,再加上对手跟注的钱,也就是P + B。当他弃牌时,你只会赢得现有的底池,也就是P。(现有底池通常指你下注之前的底池大小。) 因此,如果你有一手获胜牌,你的期望回报Ew (w代表获胜winning)会是

Ew = y(P + B) + (1 – y)P

如果你的牌会输(听牌失败),情况就会变得更复杂。你有可能诈唬(x),也可能过牌放弃(1 – x)。

当你选择诈唬时,对手还是有可能跟注(y),或弃牌(1 – y)。当他跟注时,你会损失这次下注,所以你的净回报是负的,也就是–B。 当他弃牌时,你会赢得现有底池,也就是P。所以当你诈唬时,你的期望回报会由这两部分组成:

(1 – y)P – yB

如果你选择过牌(放弃这手牌),你赢不到一分钱,所以这种情况下你的期望回报是0。

综上所述,当你的牌会输时,你的预期回报 El (l代表失败losing)会是

El = (1 – x)0 + x(1 – y)P – yB

由于第一部分是0,我们可以直接忽略,公式变为:

El = x(1 – y)P – yB

假设你知道对手从不跟注(y = 0),你的期望回报公式还可以简化为:

El = xP

要最大化期望回报,你必须让x = 1,也就是说你应该每次都诈唬。

但是,如果对手总是跟注(y = 1),你的期望回报公式会变为:

El= – xB

在这种情况下,为了最大化期望回报,你必须让x = 0,这代表你永远不要诈唬。(所以明白了吗?永远不要诈唬一个跟注站。)

以上计算是知道对手在两种特殊情况下会采取什么策略,然后得出的应对结果,但是这两种情况非常极端,所以这个策略被称为纯策略。在真实的扑克游戏中,对手们会更加飘忽不定,他会有一定的频率跟注你的下注(y不会是0也不会是1)。他采取的会是混合策略。

最佳策略对手可以选择一个跟注频率y,让你无论使用什么策略(也就是无论x是多少),期望回报都不会改变。我们用yopt表示这个跟注频率(在某种程度来看,yopt就是y的最佳值。)

yopt很容易计算,下一篇文章会讲。

yopt = P/(P + B)

在我们的例子中,P = B = $100,所以yopt = 1/2。如果对手刚好有一半的机会跟注,你是打不过他的。如果对手根据y = yopt的策略打牌,你的期望回报将会是

El= xPB/(P + B) – PB/(P + B) = 0

(就是把yopt带入求El的公式)

这时,无论你选择什么策略(无论x是多少),你的期望回报都不会升高或降低。

有趣的是yopt只取决于底池和下注的大小,不受q(q代表对手认为你会赢这手牌的概率)的影响。这表明yopt并不总是y的最佳值。例如当 q=1时,也就是你的对手确定你有优胜牌,这时他不会有一半的跟注频率,因为他根本不会跟注。他会使用y=0的策略。

后面我们还会说,yopt在什么情况下才是最佳值。

同样,你也可以选择一个x,让对手无论选择什么样的策略(无论y是多少),他的期望回报都一样。我们用xopt表示这个特殊的x。但是,求xopt的值会更复杂一些,它的公式是

xopt = qB/(1 – q)(P + B)

如果你经常用会输的牌诈唬,对手的期望回报为

Eop = (1 – q)P – qPB/(P + B)

这个公式里没有y,所以对手的期望回报不会改变。

在我们的例子中P = B = $100,q = 0.2,所以xopt = 1/8。如果你有1/8的概率诈唬,对手就赢不了你,就算他非常善于观察,了解你的策略(知道x = xopt)。如果你的诈唬频率高于或低于1/8,善于观察的对手就会剥削你策略上的漏洞。所以当你面对非常优秀的对手时,xopt可以确保 你的策略是最佳的。

优秀的对手用什么频率跟注你的下注?yopt就是答案。如果你根据x = xopt的策略打牌,他选择任何打法都不能提高或降低期望回报。如果对手不使用y = yopt的策略打牌,你可以观察他的漏洞,利用他的错误,选择最佳的回应剥削。

只有当他的y = yopt时,你是无法剥削他的,这时无论使用怎样的打法,你的期望回报都不会改变。

记住,如果你不使用xopt的策略,对手也会调整打法来剥削你的漏洞。

现在你知道xopt和yopt在什么时候情况下才是最佳值了吧:当对手无法剥削你时。在博弈论中, 这两个策略(xopt, yopt )被称为纳什均衡点。这在博弈论和经济学中都是非常重要的概念。(没错,就是电影 《美丽心灵》中的纳什,1994年诺贝尔经济学奖的获得者)。现在你知道它在扑克中也扮演着重要的角色了吧。

接下文:从博弈论的角度分析诈唬(2):特殊情况中的期望回报:https://www.moshike.com/a/3601.html

FAQ

WePoker注册时的国旗要怎么选择?

WePoker注册时的国旗要怎么选择?

此部份默认即可,显示的国旗并不影响您的游戏进行。

线上德州扑克优质局百桌爆满,2000人规模大俱乐部!

1. 什么是《微扑克》wepoker俱乐部?

《微扑克》wepoker俱乐部是一个规模达2000人的线上德州扑克俱乐部,提供优质的游戏体验。

2. WPK-微扑克 俱乐部的桌数和玩家规模如何?

俱乐部拥有百桌爆满的游戏环境,确保玩家随时都有桌子可玩。

3. 如何进行结算和换桌?

玩家离桌后可立即结算,且可以快速换新桌,确保游戏的流畅性。

4. 新人和老客人是否有福利?

是的,新人上桌可享受红包福利,老客人回归时也有相应的回归福利。

5. WPK-微扑克 俱乐部的公平性如何保障?

俱乐部采用100%公平公正的游戏机制,并配备GPS、IP及最严密的伙牌查询系统,让您放心游戏。

6. 如何加入 WPK-微扑克 俱乐部?

请下载APP并联系客服(如何加入俱乐部具体详情请咨询weipuke.org微扑克客服 ),获取加入俱乐部的指引。

如何在 WPT Global 使用 Skrill 存款?

如何在 WPT Global 使用 Skrill 存款?

要使用 Skrill 存款,您需要创建并验证一个账户。然后,您可以使用各种方法将资金添加到您的 Skrill 电子钱包。要在 WPT Global 存款,请登录您的玩家账户并前往收银台。点击“存款”并从可用选项中选择 Skrill。按照屏幕上的说明进行存款。

WePoker App下载超级签是什么?

WePoker App下载超级签是什么?

什么是企业签?企业签可在iPhone、iPad下载,与普通版相比,可以有效减少软件频繁授权签名次数,服务由第三方提供。

WePoker网页版无法开启

WePoker网页版无法开启

由于目前WePoker客户端增添了许多较友善玩家功能,因此建议您尝试下载客户端进行游戏,以便可与朋友畅玩游戏。

🎬 最新文章 🎮 🎗️ 热门文章 🎥
🎵 推荐文章 💋

《龍女郎》6/5(四)傲嬌公主【伊沙贝拉】限定角色登場! 各位玩家, 我们将于2025年6月5日(四) 10:00 GMT+8 进行维护更新, 预计于14:00 GMT+8完成维护过程,请耐心等候。 期间玩家将无法登入及进行游戏

诱导和鼓励对手犯错 诱导和鼓励对手犯错 关于平衡的使用还有一个容易让人困惑的地方:我们大多数的对手并没有能力对我们的策略进行调整,而且即使我们在使用平衡的、不可被

如何在德州扑克牌桌上找出鱼玩家 如何在德州扑克牌桌上找出鱼玩家 在德州扑克中,你赢到的大多数资金都来自桌上的弱手(鱼玩家)。在本文中,我们将告诉你如何在牌桌上找到他们。 扑克是

《萌娘侵略版》7/1(二)更新全新XR英雄-【露茜娅】! 亲爱的领导者您好: 开始时间 2025/7/01 00:00 结束时间 2025/7/15 23:59 【更新内容】 1.更新全新XR英雄-【露茜娅】。 2.更新XR英雄-【露茜娅】的约会一。 【活动介绍】 1

在多人底池中盈利最多的起手牌型 在多人底池中盈利最多的起手牌型如果你玩的牌局里有打得松而被动的对手,这篇文章正适合你。读完以后,你将了解下面这两个关键问题的答案: - 哪些牌型

德州摊牌率与摊牌赢率数据(下篇) 德州摊牌率与摊牌赢率,这俩数据你会用吗(上篇):https://www.moshike.com/a/394.html 3使用WTSD(摊牌率)

干燥牌面要不要持续下注 干燥牌面要不要持续下注 大多数牌手通常喜欢在干燥翻牌面做持续下注,这是因为一个简单的数学推理:你的对手不太可能击中干燥翻牌面。 但在如今的牌局中

《三國志侵略版》如何回报客服? 亲爱的主公您好: 请于客服信箱: email protected 回复您的游戏问题,我们将依来信顺序尽速处理您的问题。 回复格式如下: 角色名 游戏名 帐号(可于悬浮钮最上方查看)

什么时候应该半诈唬 什么时候应该半诈唬 当你在翻牌圈拿到一个强听牌时,游戏的激进通常是一个好的想法。这给了你两种方式获胜。你可以在完成听牌后通过摊牌获胜,或者在对

打牌怎么才能不上头 打牌怎么才能不上头? 可能在平时我们很难看穿一个人的真实性格和心理,每个人都会有粉饰和隐藏。但是在德州扑克的桌子上面,我们就非常容易看穿一个人

德州扑克控池打法 德州扑克控池打法 所谓控池打法就是:在干燥的牌面,你持有一手WA/WB(完全领先或完全落后)的中等牌,需要在底池过度膨胀前,过牌一条街,并跟注

德州扑克阻断牌是什么意思? 大家在平时的交流中,经常会听到“阻断牌”这个扑克术语。那么,阻断牌到底是什么?在实战中又该怎样应用?今天,我们就来聊一聊这个德州扑克阻断牌的

https://tawk.to/chat/66baf96f146b7af4a439abb9/1i76afcnk
WePoker