从零开始学Python数据分析与挖掘
上QQ阅读APP看书,第一时间看更新

4.5 伪随机数的生成

虽然在Python内置的random模块中可以生成随机数,但是每次只能随机生成一个数字,而且随机数的种类也不够丰富。如果读者想一次生成多个随机数,或者在内置的random模块中无法找到所需的分布函数,作者推荐使用numpy模块中的子模块random。关于各种常见的随机数生成函数,可见表4-4,以供读者查阅。

表4-4 常见随机数生成函数

读者可能熟悉上面的部分分布函数,但并不一定了解它们的概率密度曲线。为了直观展现分布函数的概率密度曲线,这里以连续数值的正态分布和指数分布为例进行介绍。如果读者想绘制更多其他连续变量的分布概率密度曲线,可以对如下代码稍做修改。

见图4-1。

图4-1 各形态的正态分布密度曲线

如图4-1所示,呈现的是不同均值和标准差下的正态分布概率密度曲线。当均值相同时,标准差越大,密度曲线越矮胖;当标准差相同时,均值越大,密度曲线越往右移。

见图4-2。

图4-2 各形态的指数分布密度曲线

图4-2展现的是指数分布的概率密度曲线,通过图形可知,指数分布的概率密度曲线呈现在y=0的右半边,而且随着lambda参数的增加,概率密度曲线表现得越矮,同时右边的“尾巴”会更长而厚。