光学字符识别(OCR)技术已经别普遍应用于将手写或者图片上的文本内容转化成机器可读文本内容。据venturebeat报道,目前,亚马逊的研究人员正开发一项基于OCR技术文本识别技术“TextTubes”,目的是让算法可以识别出曲线变形的字符。
亚马逊在分别在CTW- 1500 和Total-Text这两个训练系统评估了TextTubes的表现,CTW- 1500 是一个数据集,其包含了从自然场景和图像库中收集的 1500 幅图像和 10000 多个文本实例,每幅图像至少有一个弯曲的实例。Total-Text则包括了大约 1255 幅训练图像和 300 幅测试图像,其中每张图片有一个或多个弯曲的文本实例。
报告称,TextTubes在CTW- 1500 上获得了业界领先的结果,准确率为83.65%,相比之下,最接近的方法准确率为75.6%。
加入未来TextTubes应用到商业中,那么对那些依赖OCR开展业务的企业来将从中受益。据估计,在80%以上的数字处理过程中仍保留着纸质文本;大约97%的小企业仍然使用纸质支票。这也就是到 2025 年OCR解决方案市场预计价值高达133. 8 亿美元的原因。