深度学习从0到1
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

4.11 独热编码

在神经网络、深度学习的分类问题中,我们通常会把分类问题的标签转化为独热编码(One-Hot Encoding)的格式。

(1)比如在手写数字识别的任务中,数字有0~9一共10中状态,所以每个数字都可以转换为长度为10的编码:

① 0->1000000000;

② 1->0100000000;

③ 2->0010000000;

④ 3->0001000000;

⑤ 4->0000100000;

⑥ 5->0000010000;

⑦ 6->0000001000;

⑧ 7->0000000100;

⑨ 8->0000000010;

⑩ 9>-0000000001.

(2)比如对于根据图片判断性别的模型:

① 男性可以编码为10;

② 女性可以编码为01。

(3)比如给花的品种进行分类的模型,假设有红、黄、蓝三种花:

① 红花可以编码为100;

② 黄花可以编码为010;

③ 蓝花可以编码为001。

根据以上的几个例子,大家应该都可以了解独热编码是怎么回事了。在后面的分类应用中,我们经常会把分类的标签处理成为独热编码的格式,然后用来训练模型。