从训练到推理：创建用于图像识别的神经网络

杜小含

2022-12-24 09:23:28

传统的图像处理软件依赖特定任务的算法，而深度学习软件则通过训练神经网络来识别图像中的好坏区域。幸运的是，专用算法和图形用户界面（GUI）工具的发展使得生产商能够更加轻松、快速且经济地训练神经网络。

训练是通过向深度神经网络（DNN）提供大量数据，使其能够执行特定任务（如图像分类或语音转文字）的过程。DNN通过对数据进行预测，并根据错误反馈不断调整神经元间的连接强度，以提高预测的准确性。随着训练数据的增加，DNN的预测准确性也会不断提高，直到达到预期水平。

例如，训练一个DNN来识别图像中的三类物体：人、汽车或机械齿轮。通常，数据科学家会使用一个包含数千张标记图像的数据集，每张图像分别标记为“人”、“汽车”或“齿轮”。这些数据集可以是现成的，如谷歌的Open Images数据集，它包含了大量的图像和标签。

神经网络的设计取决于要解决的问题和特定的应用需求。训练过程中，数据科学家通过多次实验尝试不同的DNN设计，以达到预期的准确度。输入和输出之间是隐藏层，它们包含了多个神经元。对于简单的任务，几层神经元足够，但对于复杂的任务，则需要更多的层和连接。

为了训练系统，通常需要数百甚至数千张手动分类的图像。然而，采集并标注这些复杂的数据集是开发过程中的一个挑战。深度学习特别适用于光照、噪声、形状、颜色和纹理等变量较多的环境。例如，深度学习可以用于检测拉丝金属表面的划痕，这类划痕难以通过传统方法识别。

用户采集图像后，可以使用GUI工具进行神经网络训练。只需点击“训练”按钮即可开始训练，用户可以根据需要调整超参数以提高准确性。验证模型的准确性可以通过使用不同的图像数据集和诊断工具，如混淆矩阵和热图来完成。

使用深度学习GUI工具的最佳方法是实际操作演示。例如，使用Astrocyte进行异常检测的训练，用户可以按照步骤导入图像数据集、分配标签、训练模型，并在完成后保存模型。

训练完成后，需要优化DNN以降低功耗和延迟。常用的方法包括剪枝和量化。剪枝可以移除对最终结果贡献较小的部分，量化则减少权重的位数，以提高速度和减少硬件资源的需求。

当DNN模型训练和优化完成后，就可以投入使用。图像作为输入，DNN尝试对其进行分类。Teledyne DALSA提供了Sapera Processing和Sherlock软件包，帮助用户在PC或嵌入式设备上实现推理。

神经网络是功能强大的工具，但调整和优化它们可能是一项复杂的工作。不过，随着GUI工具的发展，深度学习正在变得更加普及。未来，这类工具将在图像分析方面表现出色，超越传统的算法。

神经网络推理图像别的用于创建训练

本文来源：图灵汇文章作者：杜小含

中科院团队用AI图像识别搭建新系统，允许自动识别和分选单个细胞