![深度学习从0到1](https://wfqqreader-1252317822.image.myqcloud.com/cover/588/39479588/b_39479588.jpg)
1.4 深度学习的应用
深度学习最早兴起于图像识别,在最近几年可以说是已经深入各行各业。深度学习在计算机视觉、语音识别、自然语言处理、机器人控制、生物信息、医疗、法律、金融、推荐系统、搜索引擎、电脑游戏和娱乐等领域均有应用。
图像识别——图像识别可以说是深度学习最早实现突破性成就的领域。如今计算机对图片的识别能力已经跟人类不相上下。我们把一张图片输入神经网络,经过网络的运算,最后可以得到图片的分类。如图1.15所示,我们可以看到,对于每一张图片,神经网络都给出了5个最有可能的分类,排在最上面的可能性最大。图1.15中的置信度表示的就是该图片的概率值。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_29_2.jpg?sign=1738933246-gsLB9QKtDTl9mAZMiV703kVHRzhNlbdp-0-188bd061150c648a6753151b35717bcc)
图1.15 图像识别
目标检测——利用深度学习我们还可以识别图片中的特定物体,然后对该物体进行标注,如图1.16所示。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_30_1.jpg?sign=1738933246-Gb6EemQcQrSUGKTbdfL4FQFjXhLctrEW-0-f1231125288709f9b0d48bad2677a934)
图1.16 目标检测[1]
人脸识别——深度学习还可以识别图像中的人脸,判断是男人还是女人,判断人的年龄,判断图像中的人是谁等,如图1.17所示。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_30_2.jpg?sign=1738933246-YUgcuvFuNzM59qslROgqRg1pIHQvOyAz-0-5c17a935ad9658f5f11b29bb9a96618a)
图1.17 人脸识别
目标分割——目标分割可以识别出图中的物体,并且可以划分出物体的边界,如图1.18所示。
描述图片——把一张图片输入神经网络中,就可以输出对这张图片的文字描述,如图1.19所示。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_31_1.jpg?sign=1738933246-cbDDLMBa3BZNMdEjx8Y6pyDHAQUuyXLZ-0-a77097f2b6a980a64a82e72ca16e3f40)
图1.18 目标分割[2]
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_31_2.jpg?sign=1738933246-yzYMVjKswJh8qcto7ifED59rvq7HbLis-0-055f5f0ff1a061f25cc4a5a7ffc01e30)
图1.19 图片描述
图片风格转换——利用深度学习实现一张图片加上另一张图片的风格,然后生成一张新的图片,如图1.20所示。
语音识别——深度学习还可以用来识别人说的话,把语音数据转换为文本数据,如图1.21所示。
文本分类——使用深度学习对多个文本进行分类,比如判断一个评论是好评还是差评,或者判断一篇新闻是属于娱乐新闻、体育新闻还是科技新闻,如图1.22所示。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_32_1.jpg?sign=1738933246-ZFhoOt5uBHEL9bLXdH9T801vEQwP7SRk-0-ddb23ee169d1278161e66012c2ec0281)
图1.20 图片风格转换[3]
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_32_2.jpg?sign=1738933246-9urbktV2Em1VFxGG8Chv8mnW75MVxf1i-0-24f7d8a11029e863ea8c9d492501a6cf)
图1.21 语音识别
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_32_3.jpg?sign=1738933246-svYR4yf0rc08G18vBAEfrYD4mWcBuV96-0-12459365897088540f6a876f41eb4915)
图1.22 文本分类
机器翻译——使用深度学习进行机器翻译,如图1.23所示。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_33_1.jpg?sign=1738933246-iYfxlVMGg8mZrGdGJ6a7Lb0FtcflGFfT-0-6a78ebd8f8554fe129fbea9f15f5d58c)
图1.23 机器翻译
诗词生成——把一个诗词的题目传入神经网络,就可以生成一篇诗词,如图1.24所示,其就是AI写的一首诗。虽然这首诗有些看不太懂,但是已经“有内味了”。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_33_2.jpg?sign=1738933246-Aznxi4qN7JV0maW2QzuCSndin8UwUJfv-0-0694116de36314d16d699425cfb9e326)
图1.24 诗词生成
图像生成——深度学习还可以用来生成图片。比如我们可以打开网站https://make.girls.moe/#/,设置好动漫人物的头发颜色、头发长度、眼睛颜色、是否戴帽子等信息就可以生成符合条件的动漫人物,并且可以生成无数张不重复的照片,如图1.25所示。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_33_3.jpg?sign=1738933246-T9qACFMQae7A06TiX28uDcfGtttDOAEb-0-06342941d6f271d3d57051f4baa3e936)
图1.25 图像生成
这里只是列举了非常少量的例子,深度学习的已经逐渐深入各行各业,深入我们的生活中。