4-1 第一个孩子是女儿,那么下一个孩子是男孩还是女孩?
在第1讲和第2讲中,我们运用了客观的数据来设定先验概率。接下来,在第3讲中,由于没有客观数据可用于先验概率的设定,于是我们主观地设定了先验概率。在第4讲中,将带领大家进一步了解神奇的贝叶斯推理方法。请阅读以下问题设定。
问题设定
假设夫妻俩的第一个孩子是女儿。那么,接下来生的孩子依然是女儿的概率为多少?
也许你会怀疑,上述问题设定是否有实际意义?很多人会觉得,这个设问实在太模糊,以至于让人根本不知该如何作答。换句话说,人们会认为“每一次生男生女的概率各为一半。就算第一个孩子是女儿,但下一个孩子的性别与这根本无关,所以接下来依然是女儿的概率也还是0.5吧”。
事实上,笔者曾经将该问题设定的贝叶斯推理写入某本书,并收到了读者写来的表示反对的邮件。邮件内容是“我的医生朋友说,事实上,并没有容易生男孩、容易生女孩这回事,生男生女的概率都是一样的”。
当然,我知道这位读者想要表达什么,只是我认为,他并没有认真思考那本书的解说内容,他的思考始终处于停滞状态,只是一味地表示反对,对此,我感到有些遗憾。
第一,从统计学观点来看,生男生女的比率并不是各占一半的。事实上,生男孩的比率会稍微高一点。在日本,生男生女的概率比约为51∶49。即使具体比率上有所差别,但“男孩的概率高一些”这一特性,是全世界共通的。不管原因如何,在生物学上,男女的出生率有着其固有的结构,因此,不能说这种现象与投硬币有着同等的概率。
第二,那位读者的医生朋友观察的是“关于多数夫妻生下来的多数孩子的样本统计”,而不是“针对某对特定的夫妻所生的孩子进行的统计”。即使人类整体在统计时呈现出51∶49这样稳定的比率,但某一对特定夫妻所生孩子是男还是女的问题上,并不一定遵循这个比率。这对夫妻有其固有的特性,因此也不能否定是否存在“生女孩稍微容易一点”或“生男孩稍微容易一点”这种性向的可能性。
标准统计学(又称内曼-皮尔逊统计学)在阐明全人类范围内的男女例这一性向问题时是有效的,但不能用来解答“特定的某一对夫妻更容易生男孩还是女孩”的问题。这是因为,如果不使用达到一定程度的大量数据,就不能运用标准统计学来推断,关于这一点,在第8讲中会进行详细的解说。理由是,对于某一对特定的夫妻,他们所生的孩子数量,并不足以用来进行统计验证;而且,在生下大量的孩子的过程中,随着年龄的增长,身体条件也会发生变化。
然而,即便是这种对于特定夫妻的生育问题的推断,也可以使用贝叶斯推理来完成。理由在于,贝叶斯推理在某种意义上来讲是一种“宽松”的推断。所谓的“宽松”是指:设定不可思议的先验概率,并且其数值可以是主观性的。关于这一问题设定,下文将按照明贝叶斯推理的独特顺序来进行说明。