![深度学习从0到1](https://wfqqreader-1252317822.image.myqcloud.com/cover/588/39479588/b_39479588.jpg)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
4.11 独热编码
在神经网络、深度学习的分类问题中,我们通常会把分类问题的标签转化为独热编码(One-Hot Encoding)的格式。
(1)比如在手写数字识别的任务中,数字有0~9一共10中状态,所以每个数字都可以转换为长度为10的编码:
① 0->1000000000;
② 1->0100000000;
③ 2->0010000000;
④ 3->0001000000;
⑤ 4->0000100000;
⑥ 5->0000010000;
⑦ 6->0000001000;
⑧ 7->0000000100;
⑨ 8->0000000010;
⑩ 9>-0000000001.
(2)比如对于根据图片判断性别的模型:
① 男性可以编码为10;
② 女性可以编码为01。
(3)比如给花的品种进行分类的模型,假设有红、黄、蓝三种花:
① 红花可以编码为100;
② 黄花可以编码为010;
③ 蓝花可以编码为001。
根据以上的几个例子,大家应该都可以了解独热编码是怎么回事了。在后面的分类应用中,我们经常会把分类的标签处理成为独热编码的格式,然后用来训练模型。