智商吧 关注:203,528贴子:1,885,327

有关概率的一个疑似悖论

取消只看楼主收藏回复

《智商》吧:有关概率的一个疑似悖论,haolizhong4924
【按:这是在《民科》吧看到的一个有意思的问题。说说我的看法,想请各位网友不吝赐教。原题见:《民科》吧,《百分之99的民科吧吧友都不会的一道简单数学题》,发帖者:@薛奎已统一理论】
.
原题:
这里有两个红包,其中一个红包的钱数是另一个红包的两倍,让两个人随机拿取其中一个红包。
此时,给他们一次交换红包的机会。
甲心想,我手里拿着的是x,如果对方拿着的是我的两倍即2x,那我得到x元钱。假设对方手里拿着的是我的1/2倍,那我损失x/2,也就是说,交换在平均上的收益大于损失。
然而乙也是一样想的。
请问为什么交换的钱在数学期望上上涨了?而且对于甲乙双方都一样?
.
除了讨论这个题目中疑似悖论的矛盾出在何处以外,我还想进一步讨论:
假如只给甲方看到拿着的钱数后决定交换与否的特权的话,甲方有没有办法,有什么办法,利用这个特权取得上涨收益的数学期望?
.
下面是我的看法。各位有什么高见望踊跃评论赐教。
(待续)


IP属地:陕西1楼2024-07-26 16:28回复
    (续)
    顶楼所说的想法错在哪里?错在:
    .
    通常,没有理由判定各个分情况出现的概率孰大孰小时,我们会按“概率均匀”来认定,即认为它们都相等。例如上面的叙述中,认定对方拿到的究竟是2x,还是x/2,认为概率各为1/2。
    但在采用这种“概率均匀”办法时,需注意两点:
    .
    一是:
    因“没有理由”,就按“概率相等”来认定,是早期古典概率论中常采用的原则。但是人们已经发现它的不合理之处。
    凡了解过“贝特朗悖论”的朋友可以知道,采用不同的参数作为样本空间,何为“概率均匀”,是有歧义的,会产生矛盾的。因此这个古典的原则并不可靠。
    所以,现代的概率论中,如果已知条件中没有显式地指明在哪种样本空间里“均匀”的话,初步分析时仅因“没有理由”而认定的“概率相等”,只能算作预估,不能算定论。
    随着进一步分析时新发现的信息提供新的“理由”,有可能需要改动的。
    .
    二是:
    如果是“无限多种分情况”,那么,不管是否给出概率如何分布的已知条件,都不可以认为“概率均匀”,必须认为存在一个不是常数的“分布曲线”,且满足一定数学特征,否则会违反概率论的公理。
    .
    后面这第二点,是因为:
    按概率论公理,各分情况下的概率之和应该等于1。
    无限多种分情况,求其和须采用极限概念(对连续分布用无穷积分,对离散分布用级数);
    .
    例如一个量是非负实数,设它取值为x附近的概率密度为p(x),则必须:
    x由零到∞的积分∫p(x)dx = 1。
    .
    但我们知道,如果认为“概率均匀”,即p(x)是一个常量,那么:∫p(x)dx或者不收敛(如果p(x)≠0),或者收敛为零(如果p(x) = 0),总之,不可能是1。
    要想使无穷积分∫p(x)dx收敛为1,p(x)就不可以是常量。
    .
    本题目的问题就出在这两点上。
    下面具体到本题来说明。
    (待续)


    IP属地:陕西2楼2024-07-26 20:27
    收起回复
      (续)
      设两个红包中的钱,少者为n,多者为m,m = 2n。
      第一次拿取,拿到的x是等于m,还是等于n,因没理由,暂认为概率各1/2。
      对再次交换后的预期:如果x是m,交换后损失x/2;如果x是n,交换后收益x。故顶楼的想法是认为:二者平均,损失小于收益。
      .
      但顶楼这个计算,除了认为x是m和n的概率各1/2以外,还认定了x值已经确定。
      试想,说“x/2 < x”,是指的同一个x。如果x值不确定,即考虑到可能拿到不同x的情况的对比,拿得x较大时的“x/2”,不见得比拿得较小x时的“x”小。x值确定,才能有上述估计。
      .
      然而,一旦x值确定,那么x值内隐含的信息就与上述“概率各1/2”有冲突了。
      这是因为,下面的分析可以得知:
      如果x越大,则“x是n的概率”越小,“x是m的概率”越大。
      .
      所以,这两个概率不可能固定等于1/2。
      .
      下面说明如何分析出这个规律。
      (待续)


      IP属地:陕西3楼2024-07-26 20:39
      回复
        (续)
        n和m都是未知正数,分布于正半数轴,有无穷多种可能取值。上面2楼第二点已说明过:此时题目虽没有说其概率如何分布,我们也可断定一定不是均匀分布,而是有一定的分布曲线,如下图。
        .
        曲线pm(x)、pn(x)的具体形状数据虽然不知道(图中只是示意),但可以肯定存在下述特征:
        首先,曲线下面积为1(这是根据概率论的公理);
        其次,右边无穷远处趋于0(这是积分收敛的必要条件);
        还有,因为m = 2n,所以pm(x) = pn(x/2)/2。故m的曲线比n的曲线向右加宽到2倍,而高度(概率密度)缩小到一半,曲线的峰值点也向右移了。

        可以看出,如果拿到的x值等于图中H点,那么这个x是n的概率和是m的概率一样大。不过,因为曲线具体形状未知,故这个H点的位置也是未知的。
        x值越小,则x是n的概率越大;
        x值越大,则x是m的概率越大。
        .
        也就是说,x较小,则交换后较大概率出现收益;x较大,则交换后较大概率出现损失。
        再算上每次损益时的损益量,可知损益量的数学期望是x的函数,大致趋势应是x较小时为正,x较大时为负。
        (待续)


        IP属地:陕西4楼2024-07-26 20:55
        收起回复
          (续)
          这就可以解释顶楼的矛盾了。
          .
          若完全不考虑x的大小,那么,除应认为将拿到的x是m还是n,概率各1/2以外,对于交换一次后的损益的数学期望,也应该认为是零(即交换前后钱数的数学期望不增不减),才合理。
          .
          若确定了x值,那么,对再次交换后损益的的预期,则除要考虑如上所说的损失x/2和收益x的大小以外,更应该考虑发生损失和收益的概率大小。
          而这两个概率是随x的不同而不同的,并非简单地各1/2了。
          .
          从上面分析知道,假如曲线pm(x)和pn(x)数据已知,交换一次后的损益的数学期望可以定量算出;即使曲线不知,但趋势仍然可知;即:
          若x较小,期望为收益;若x较大,期望为损失。
          并非顶楼所说的都是收益大于损失。
          更何况,交换前,甲乙两人见到的x是不同的。
          .
          这就是顶楼疑似悖论的来源。
          (待续)


          IP属地:陕西5楼2024-07-26 22:08
          回复
            (续)
            上面的分析合理与否,如有疑惑,可以如下验证:
            .
            上面所说的“确定了x值后”的概率,其实就是一种条件概率,即“当x等于某个确定的值”条件下的概率。此时的数学期望也就是该条件下的数学期望。假如曲线pm(x)和pn(x)数据已知,它们都是可以定量计算出来的。
            .
            如果前面的分析无误,那么我们根据这些条件概率,用全概率公式反推出“无条件概率”,即前面所说的不考虑x的大小的概率,应该和开始的认定一致:各二分之一。同样办法,反推出不考虑x的大小交换一次后的损益的数学期望,也应该是零。
            不妨推导一遍看看。
            .
            先考虑概率:
            x值确定后,
            x是n的概率为Qn(x) = pn(x)/(pm(x)+pn(x))
            x是m的概率为Qm(x) = pm(x)/(pm(x)+pn(x))
            .
            而具体拿到x的概率也有其分布曲线,其概率密度应为
            Q(x)=(pm(x)+pn(x))/2
            .
            按全概率公式,不确定x值时,拿到x是n的概率应为:
            x由零到∞的积分∫Q(x)Qn(x)dx
             = ∫((pm(x)+pn(x))/2)(pn(x)/(pm(x)+pn(x))) dx
             = ∫( pn(x)/ 2)dx
            我们已经知道pn(x)的曲线下面积为1,显然这个积分等于1/2。
            同样道理,拿到x是m的概率也等于1/2。

            再考虑交换损益的数学期望:
            x值确定后,如果再交换的话,出现损益的期望S(x)应为:
            S(x) = Qn(x) * (+x) + Qm(x) * (-x/2)
              =  pn(x)/(pm(x)+pn(x))* (+x)
               + pm(x)/(pm(x)+pn(x)) * (-x/2)
              = (pn(x) * (x) - pm(x) * (x/2) ) / (pm(x)+pn(x))
            按全概率公式,不考虑x的大小,再交换出现损益的期望应为:
            x由零到∞的积分∫Q(x)S(x)dx
             = ∫((pm(x)+pn(x))/2)((pn(x) * (x) - pm(x) * (x/2) ) / (pm(x)+pn(x))) dx
             = ∫( (pn(x)* (x) - pm(x) * (x/2) ) / 2) dx
            将pm(x) = pn(x/2)/2代入,得:
            上式=∫( (pn(x) * (x) - pn(x/2)/2 * (x/2) ) / 2) dx
              =∫( pn(x) * (x) / 2) dx - ∫( pn(x/2) * (x/2) /4) dx
            设t= x/2,代入第二个积分,则:
            上式=∫( pn(x) * (x) / 2) dx - ∫( pn(t) * (t) / 2) dt
            其中第一个∫是x由零到∞的积分,第二个∫是t由零到∞的积分,显然两个积分结果相等,故:
            上式= 0 。
            .
            都与前面的认定一致,无矛盾。
            (待续)


            IP属地:陕西6楼2024-07-26 22:15
            收起回复
              (续)
              下面,在开始讨论顶楼后面说的那个“进一步”的问题之前,先对有朋友针对我的上文所提的质疑、追问,做点解释。
              .
              ◆我上面3楼说:计算时,说:“如果x是m,交换后损失x/2;如果x是n,交换后收益x;而x/2 < x”这话,就意味着“x值已经确定”。
              对此,有朋友质疑说:“我在没有看钱数之前说这话呢?还能算x值已经确定吗?”
              .
              其实,“看不看”是次要的,重要的是您这话所依据的背景条件是什么:
              .
              背景条件一:m和n已经确定(由发红包者决定),而拿到哪个未知。此时要猜测的是能拿到哪个。
              背景条件二:已经知道拿到的钱数x,而不知这个x是m还是n。此时要猜测的是发红包者是如何发的。
              .
              用俗话说,前者的“概率”指的是拿钱者的“手气”,后者的“概率”指的是发钱者的“脾气”(所以我4楼要考虑钱数的概率分布曲线)。
              .
              我说意味着“x值已经确定”,意思就是:说这话时依据的是后一个背景条件,而不是前一个。
              .
              试想,假如说这话时依据的是前一个背景条件,x值没有确定而m和n已经确定,那么,这句话里的两个x不是同一个数,前一个x是m,后一个x是n,而本来m就是n的两倍,这里再说x/2 < x显然不对了。
              (待续)


              IP属地:陕西7楼2024-07-27 13:25
              收起回复
                (续7楼)
                多谢各位朋友指教。因故拖延了几天望原谅。
                .
                下面再说顶楼最后提出的“进一步讨论”的问题。即:
                假如只给甲方特权,看到钱数后可决定交换与否的话,甲方有办法“占便宜”吗?
                我的答案是:有办法。
                .
                上面我们已经得出了结论:
                在知道钱数x以前就做决定要不要交换,对最后的数学期望没有影响。
                .
                不难证明:以下三种对策,不管采取哪一种,最后的数学期望是一样的:
                一、一律不交换;
                二、一律交换;
                三、随机地以一定概率(此概率与钱数x无关)来决定交换与否。
                .
                然而,在看到钱数x以后,就多知道了一点信息。
                上面我们已经分析过,交换后的损益量的数学期望是x的函数,虽具体的曲线形状未知,但大致趋势知道了:是x较小时为正,x较大时为负。如下图。

                所以,有了“知道x”这个条件,只要有一种对策,能使得:x越小,就越倾向于“要交换”;x越大,就越倾向于“不要交换”;那么,最后的数学期望是可以比上面三种对策再提高的。
                .
                下面具体设想一下。
                (待续)


                IP属地:陕西11楼2024-08-08 19:20
                收起回复
                  (续)
                  设想,甲方自己定一个自认为的“中间数”Y,决定对策是:“如果x<Y,就交换;否则,就不交换”,行不行呢?
                  这样做,从概率上说,也能一定程度“占便宜”,至少不吃亏。
                  .
                  这也不难证明。
                  11楼说的损益量数学期望,虽然具体曲线不知道,但肯定会存在一个过零点X0。假如我们选的Y恰好等于X0,显然最好,不必说了。
                  .
                  假如Y和X0不等,例如Y<X0,那么这种对策的效果,等于在上面11楼的三种对策中“对策一”的基础上改动——将x<Y的区间由原来的“一律不交换”改为交换,而x<Y的区间中原来交换的期望是收益大于损失,故此对策等于对“对策一”的优化,效果不劣于“对策一”。
                  .
                  反之,假如Y>X0,那么按相似的道理,这种对策等于在上面11楼的“对策二”的基础上优化,效果不劣于“对策二”。
                  而“对策一”、 “对策二”效果一样。故此对策概率上是“占便宜”的。
                  .
                  不过,我们已经知道,x不可能在实数域“均匀分布”,必有如4楼所述的分布曲线。
                  而只有所选的“中间数”Y,处于该曲线的分布区域以内,上述“优化”才会实际有效。
                  而该曲线,如7楼所说完全取决于“发钱者的脾气”,甲方在确定Y时对其完全未知。
                  像下面三个图,只有第一个优化才有作用。假如像后两图,Y选到了分布区域以外,x<Y和x>Y二者必然只有一种可以出现,上述“优化”的机会必然不会遇到。实际上就完全和对策“一”、“二”一样了。
                  .

                  也就是说,这种对策虽然概率上是“占便宜”的,但因Y选的不好而不起作用的可能性很大。所以不够可靠。
                  (待续)


                  IP属地:陕西12楼2024-08-09 13:51
                  回复
                    (续)
                    楼上(12楼)的对策之所以“不够可靠”,关键在于:Y的选择,只有选在x的概率曲线的分布区域中才有作用,而甲决定Y的时候,完全不知道x的概率曲线。
                    .
                    要想避免因不知x的分布范围而形成“不起作用”的结果,可换个思路。
                    .
                    因为下面的讨论要和11楼的“对策三”联系,为此先对 “对策三”做一点解释:
                    .
                    “对策三”里说到的“随机地以一定概率来决定”是一种什么操作?
                    具体就是:
                    .
                    自己制定一种规则,使得:
                    按照这个规则操作一次所得的决定结果,是随机的,别人无法预知;但假如按照同一个规则多次试验所得的结果的统计,可以确定其概率为一个要求的值。
                    例如:做决定前掷骰子,掷到2、5点就交换,掷到1、3、4、6都不交换。这就是一种“概率为2/6(即1/3)地随机交换”。
                    .
                    11楼所说的“对策三”的意思就是:
                    只要你决定交换与否,是按照上面所说的那样一个规则,而这个规则所确定的“一定概率”,与钱数x无关,那么,最后的数学期望,就与“对策一”和“对策二”都一样。
                    (待续)


                    IP属地:陕西13楼2024-08-19 18:00
                    回复
                      (续)
                      现在我们说的换个思路,就是:
                      类似于11楼的对策三,同样是“随机地以一定概率来决定交换与否”,但不同的是:此概率由看到的钱数x来确定,x越大,“要交换”的概率就越小,“不要交换”的概率就越大。
                      .
                      具体点说,就是设计一个值域在1到0之间的减函数g(x),实际操作时,使“要交换”的概率等于g(x), “不要交换”的概率为1-g(x)即可。
                      设计g(x)的办法有很多。例如:令g(x)=1/(x+1),或者g(x)=0.9^(-x),……,等等。
                      若g(x)不同,则效果有量的差别,但都满足这里的讨论。
                      .
                      因为g(x)可能需要连续改变,不是简单分数,不便采用楼上所说的掷骰子等,实际操作时可以借助一个类似“抽奖转盘”那样的工具,具有0到1之间的连续均匀刻度,你确定要求的概率g(x)以后,做决定前就转一次,所停位置的刻度不超过g(x)就交换,超过就不交换,即可。
                      当然,也可以利用电脑编写一个0到1之间的随机数发生器来代替这个“抽奖转盘”,不详述了。
                      .
                      只要拿这种方法和11楼的“对策三”做个比较,不难证明它肯定是优于“对策三”的。
                      所以,它是一种利用看到钱数后决定交换与否的决定的特权“占便宜”的对策。
                      (待续)


                      IP属地:陕西14楼2024-08-19 18:19
                      回复
                        (续)
                        可以将12楼和14楼的对策,做一比较。
                        .
                        如果对减函数g(x)的要求宽一点,允许不严格的减函数(即允许有水平段),那么可以把12楼方案看做14楼方案的一个特例,即14楼方案等于是定义g(x)为:
                        “如果x<Y,则g(x)=1;否则,g(x)=0”。
                        如此,“不严格的减函数”g(x)的“减”,只出现在Y点前后,其它部分全是水平段。
                        .
                        前面说,12楼的方案有“因Y选得不好而不起作用的可能性”。
                        但是,如果选得好,起的优化作用可能比14楼方案更明显。
                        .
                        这是因为,12楼方案里g(x)在Y点前后由1直接减到零;
                        而14楼g(x)的递减,分布在0到无穷的范围,每一部分的“减”,都是少量的,故与11楼的“对策三”相比虽有优化,但优化的程度不可能大。
                        .
                        举一个极端化的例子:
                        假设该活动内定钱数大者m在30~40元,小者n在15~20元。
                        .
                        如果采用12楼方案,那么:
                        假如甲确定的Y在20~30元之间,则100%可以拿到大者,结果最优。
                        但假如确定的Y在20元以下,或40元以上,拿到大者的概率只是50%,等于完全没有优化。
                        .
                        而采用14楼方案,拿到大者的概率总能大于50%,但都大不多。
                        .
                        再从实用的角度做点讨论:
                        .
                        12楼的方案的“不可靠”,源自不知钱数的分布曲线,所以无法避免将Y选在“不起作用”的地方。
                        但在实践中,钱数的分布曲线虽不公开,但并非所有信息都不能根据客观情况来估计猜测。只要知道了部分信息,就可能在上述方案基础上进一步优化。
                        .
                        如:我们如果猜到m的下限不会小于Y1,则可令x<Y1时g(x)=1;
                        如果猜到n的上限不会大于Y2,则可令x>Y2时g(x)=0;
                        在其它区间中再按“减函数”要求来设计g(x);
                        如此,g(x)“减”的陡度可以尽量的加大,效果自然会进一步增大。


                        IP属地:陕西15楼2024-08-22 16:35
                        收起回复
                          楼上的@贴吧用户_053QPDt🐾 : 兄:
                          .
                          您提的问题,我没有太清楚您的意思,我猜想您想说的,其实是无条件概率和条件概率之间的关系与差别,以及不同条件下的条件概率互相之间的差别,不知我猜想的对不对?
                          .
                          现实的同一个问题,一切背景都不变,仅仅把一个参数由“未知”改成“如果已知”,那么这个问题中若干概率的算法就会改变。
                          当然,这里所说的由“未知”改成“如果已知”的参数,必须是对条件概率有关系的因素,而不是您楼上说的如“左手扔还是右手扔”这类无关的因素。
                          而本题中的x确是对条件概率有关系的,这并非仅仅“心理学”,上面的推导没有一处是来自“心理学”。
                          .
                          然而,改变后的概率虽然和先前不同了,但并不矛盾。按照概率论理论上的公式是可以互相验证的。上面的6楼,就是在做验证,结果表明互相并不矛盾。
                          .
                          举一个例子说明。
                          (待续)


                          IP属地:陕西19楼2024-08-23 22:10
                          回复
                            (续)
                            例:
                            四张扑克牌,已知其两红两黑。在不翻看的情况下随机抽出两张,分别给甲、乙二人。
                            因没有任何其他已知条件,故由第三方估计各自得到红、黑牌的概率,显然应为:
                            甲得红牌概率:1/2,得黑牌概率:1/2;
                            乙得红牌概率:1/2,得黑牌概率:1/2。
                            .
                            然而,要问“如果知道”了乙实际得牌后,甲得红、黑牌的概率是多少?
                            则应为:
                            如果乙得红牌,那么:甲得红牌概率:1/3,得黑牌概率:2/3;
                            如果乙得黑牌,那么:甲得红牌概率:2/3,得黑牌概率:1/3。
                            这里所得的甲得红牌、黑牌的概率,和前面所得的两个1/2不一致了,但并不矛盾。
                            .
                            按全概率公式可以验证:
                            甲得红牌的概率 = 乙得红牌概率 × 如果乙得红牌甲得红牌概率 +
                                    乙得黑牌概率 × 如果乙得黑牌甲得红牌概率
                                   = (1/2) × (1/3) + (1/2) × (2/3) = 1/2。
                            不矛盾。
                            .
                            这个例子中,“如果乙得某牌”这个信息,就相当于上面题目中“如果甲拿到钱数为x” 这个信息,
                            是一个添加的、有定量的影响力的已知条件。
                            它并不是您楼上说的如“左手扔还是右手扔”无关的因素。
                            .
                            这个例子中,
                            “如果乙得红牌,那么甲得红牌的概率就会小些;如果乙得黑牌,那么甲得红牌的概率就会大些;并非都是1/2了”这个结论,
                            就相当于上面题目中,
                            “如果x较小,那么它是m的概率就会小些,是n的概率就会大些;如果x较大,那么它是m的概率就会大些,是n的概率就会小些;并非都是1/2了” 这个结论。
                            .
                            不知我这个答复是否说到点子上?


                            IP属地:陕西20楼2024-08-23 23:08
                            收起回复
                              楼上的@贴吧用户_053QPDt🐾 : 兄:
                              .
                              您上面的叙述中,问题在于您把“不能断定某事件发生与否”,偷换成“不能知道有关该事件的概率的任何信息”了。
                              不肯定的或不完整的“部分信息”,不等于“没有信息”。
                              .
                              例如20楼的例子里,假如不是两红两黑,而是一红一黑,
                              那么,乙看了自己的牌后,就可以肯定甲的牌了,
                              这就是得到了“完整信息”了。
                              .
                              但现在不是一红一黑,而是两红两黑,乙看了自己的牌后,仍不能断定甲的牌,
                              这就是“部分信息”。
                              增加了“部分信息”,虽不足以得出肯定结论,但足以用来调整概率的大小了。
                              .
                              您所谓的“你连判断m,n的能力都没有”,只是还不足以断定它是m还是n,
                              您并不能说我们不知道有关它是m还是n的概率大小的任何信息。
                              .
                              我们不知x的分布曲线,但是肯定知道x不可能在0到无穷“均匀分布”。这是知道了“部分信息”。
                              据此,根据上文的分析,就可以知道:
                              假如x=40时它属于较大者的概率为p1,假如x=50时,它属于较大者的概率为p2,那么p1<p2。
                              .
                              既然我们已经知道了p1<p2,那就可以知道:p1、p2不可能都等于1/2。
                              这是我们根据“部分信息”,经数学推导得出的。对吧?


                              IP属地:陕西22楼2024-08-24 13:28
                              回复