众所周知,要进行任何训练,首先需要一个数据集。如何建立合适的 Deep OCR 数据集?
从 Deep Learning Tool 22.06 开始,您可以使用 Deep OCR 标记的新功能。有两种可能的使用方式:
- 您可以从头开始创建 Deep OCR 数据集:只需在 Deep Learning Tool 中初始化一个 Deep OCR 项目(参见屏幕截图),然后加载想要标记的图像即可。为了进行标记,需要沿读取方向在单词周围绘制一个矩形,工具会给出文本建议,您可对其进行修正或确认(参见屏幕截图)。
- 另外,您也可以使用标准示例 deep_ocr_prelabel_dataset.hdev。它会根据要标记的图像和预训练的 Deep OCR 给出的文本建议创建一个数据集。您可以将创建的数据集(hdict 文件)导入 Deep Learning Tool 22.06,并对建议的标记进行修正。
一般而言,训练图像应包括可代表推理过程中各种可能性的集合。此外,建议使用平衡的数据集,也就是所有字符的出现次数大致相同。当然,出色的结果需要良好的标记。良好的真值边界框看起来应当像是 Deep OCR 检测模型的输出(参见屏幕截图)。如果对数据集感到满意,您需要将数据集导出为 hdict 文件,然后进入下一步,也就是训练。