![机器学习实战:模型构建与应用](https://wfqqreader-1252317822.image.myqcloud.com/cover/359/44389359/b_44389359.jpg)
上QQ阅读APP看书,第一时间看更新
4.3 使用映射函数进行增强
在第3章中,当使用ImageDataGenerator
为模型提供训练数据时,有一些增强工具可以使用。你可能好奇如何在使用TFDS时达到同样的效果,因为你不再像之前那样从子文件中获取图像。最好的方法是在数据适配器上使用一个映射函数。让我们看一看如何实现。
早期,利用Horses or Humans数据,我们很简单地从TFDS加载数据并为它创建批次,就像这样:
![](https://epubservercos.yuewen.com/A03276/23627497809544006/epubprivate/OEBPS/Images/088-2.jpg?sign=1739597453-lVRiJhMNaoM5TgGagomZ1wV0Bcvtb8pg-0-bb364cee2e1745717aa938a8d74cb45e)
为了进行转换并把它们映射到数据集中,你可以创建一个映射函数。这只是标准的Python代码。例如,假设你创建了一个叫作augmentimages
的函数并且让它做一些图像增强,就像这样:
![](https://epubservercos.yuewen.com/A03276/23627497809544006/epubprivate/OEBPS/Images/088-3.jpg?sign=1739597453-rJdsgjjmqgtaoyw1Q7I6b1RewB9XdG3f-0-769fcbfcf31a8ec2d5161a9db485ecb4)
接下来将其映射到数据来创建一个新的数据集train
:
![](https://epubservercos.yuewen.com/A03276/23627497809544006/epubprivate/OEBPS/Images/088-4.jpg?sign=1739597453-j5QAzPcYYuv9OpQ7wqmtrZLkVdlaZ8ow-0-6fd00884ac7c2d8fb643098170731c7b)
创建批时,从train
而不是从data
进行创建:
![](https://epubservercos.yuewen.com/A03276/23627497809544006/epubprivate/OEBPS/Images/088-5.jpg?sign=1739597453-VmvnvqO4ohN7E6VQX143SY9vZtIeMpAQ-0-d4132f0ace0193ca3bc53c979758c3de)
你可以看到在augmentimages
函数中有一个随机的向左或向右翻转的图像,通过使用tf.image.random_flip_left_right(image)
实现。tf.image
库中有许多函数可以用来做增强,更多细节请查看文档(https://oreil.ly/H5LZh)。
使用TensorFlow Addons
TensorFlow Addons(https://oreil.ly/iwDv9)库包含更多函数。一些在ImageData-Generator
增强中的函数(例如rotate
)只能在该库中找到。
使用TensorFlow Addons非常简单,只需要使用下面的代码安装库:
![](https://epubservercos.yuewen.com/A03276/23627497809544006/epubprivate/OEBPS/Images/089-1.jpg?sign=1739597453-CwVo9EIFMGHCXmwxt5s16pGF2rtyiwOy-0-913a8166f90097be3f5d113ecdab312c)
安装完成后,你可以在映射函数中混合这些插件。下例中rotate
插件被用于之前的映射函数中:
![](https://epubservercos.yuewen.com/A03276/23627497809544006/epubprivate/OEBPS/Images/089-2.jpg?sign=1739597453-FRBL76xWoBjpjSieamNhT84FUNG4zzrd-0-746affd3b1939fc5aee1c12bfcdab651)