统计学关我什么事:生活中的极简统计学
上QQ阅读APP看书,第一时间看更新

1-3 第二步:设置发生“向店员询问”事件的条件概率

在这一步,我们要做的是:为“来买东西的人”和“随便逛逛的人”这两类顾客分别设定“向店员询问”的概率。如果没有相关经验和数据作为支撑,这项工作是无法完成的。上一节讲到,即使没有相关经验,也可以设定先验概率。但此处的“各个分类的行动概率”,必须是基于一定的经验、实证、实验的数值。

图表1-2中的数值,是为了计算简便而设定的,并非真实数据。

图表1-2 关于“向店员询问”这一行为的条件概率

从图表1-2中可以看出,“来买东西的”顾客向店员询问的概率是0.9,而“随便逛逛的”顾客向店员询问的概率只有0.3。

需要注意的是:图表1-2从横向来看,0.9+0.1=1,0.3+0.7=1,两行都满足标准化条件;而纵向来看,0.9+0.3≠1,也就是说并不满足标准化条件。具体分析一下:横向的一行,表示某一类别的顾客可能采取的两种行动。比如第一行数字,表示“来买东西的人”向店员“询问”或“不询问”这两种行为,顾客有可能询问,也有可能不询问,最终采取的行动一定是其中之一,没有第三种可能性。而纵向来看,第一列数字表示,“来买东西的人”向店员询问的概率为0.9,“随便逛逛的人”向店员询问的概率为0.3,两个数字相加之和并不等于1。这是因为,对象范围包含了两个不同类别的顾客,并且也没有涵盖所有的行动。

图表1-2中的数字,表示“某一特定类别采取各种行动的概率”,这在高等数学中被称为“条件概率”。用“原因”的概念来解释,即“在原因明确的情况下,某一类别采取各项行动的结果概率”(第15讲中将介绍:如何用符号来表示条件概率)。

将两个类别的顾客,进一步按照“询问”和“不询问”的条件来分类,那么前文所述的两个大类别又可以细分为四个小类别,分别是:“来买东西的人询问店员”“随便逛逛的人询问店员”“来买东西的人不询问店员”“随便逛逛的人不询问店员”,如图表1-3所示。

图表1-3 四种互不相同的可能性

一共存在四种可能性:来买东西的人询问店员(左上区域)、来买东西的人不询问店员(左下区域)、随便逛逛的人询问店员(右上区域)、随便逛逛的人不询问店员(右下区域)。概率的具体计算方法将在第10讲中具体介绍,此处对于结论先进行说明:各个区域所表示的概率与每个长方形的面积相等。长方形的面积可以用乘法求得,如图表1-4所示。

图表1-4 四种互不相同的可能性各自所对应的概率

下面我们来确认一下,这四个“可能世界”(所有可能发生的情况)的概率之和:

0.2×0.9=0.18 0.2×0.1=0.02

0.8×0.3=0.24 0.8×0.7=0.56

(0.18+0.02)+(0.24+0.56)=1