2022-11-24 16:07:44 来源 : 互联网
OCR字符识别,是指对部件或产品上刻印的字符进行确认、辨别、判定的检测识别。此项技术目前已广泛应用于工业自动化生产的产品质量管理环节当中,企业通过为机器视觉检测设备安装OCR系统,快速完成对产品生产日期、保质期、生产批号、条码等字符信息的检测,从而更好地进行产品管理和追溯。
应用现状作为机器视觉的典型应用方向,OCR的工作原理即为:通过工业相机、工业镜头拍摄字符图像,运用机器视觉软件进行相应处理分析,判定被检产品是否合格,并输出检测结果和相应信号。
(资料图片仅供参考)
这其中,软件处理环节才是OCR技术真正的“用武之地”。常规的技术处理流程为:
背景图像处理——字符切割——字符注册——字符识别与判断——结果输出。
实际的工业应用中,软件的处理过程都会在短时间内完成。但由于字符组合的复杂性、字符印刷材质的多样性、以及生产过程中产生的多类字符缺损,为了保证字符识别的精准度,就需要在软件系统中进行大量的标注训练和调参工作,这在一定程度上增加了软件使用的复杂度,拉长了落地投产时间。
尤其在物流行业发展快速,电商全面覆盖的今天,产品SKU的极大丰富,生产效率要求的进一步提高,OCR的处理速度也就相应的需要新的技术进行升级。
针对以上行业发展趋势和客户需求洞察,维视智造技术研发团队于近期成功迭代了维视VisionBank AI通用智能视觉开发平台中的OCR功能,上线【深度通用字符识别模块】。该模块在VisionBank AI的高效架构之上,延续了操作简单的图形化开发方式,基于深度学习算法的技术加持,将为用户带来更智能、更便捷的使用体验:
01无需调整参数在字符识别过程中,当字体的分割参数和图像不匹配时,将无法呈现良好的识别效果,通常的解决方法就是进行调参,反复测试直至效果达到最佳。VisionBank AI此次上线的深度通用字符识别功能模块,可实现智能参数自适应,免去了耗时耗力的调参工作;
02无需登录字体库传统的算法识别,需要登录每个字符的模型,以保证字符的准确识别,VisionBank AI的深度通用字符识别功能模块则可轻松免去这一步操作;
03无需深度学习训练对于复杂的场景,使用深度学习字符识别时,往往需要大量的字符样本训练。而VisionBank AI的深度通用字符识别的强大技术能力,只需拖拉一个模块即可实现字符的直接识别;
04多字符类型识别VisionBank AI深度通用字符识别功能模块目前已可对数字、字母(大小写)、符号、汉字、日语等多种字符类型完成一步识别;
05全场景兼容该功能模块可满足几乎全场景的使用,兼容各种复杂的应用场景,可对快消、零售、医药、机械制造等所有行业中涉及包装编码检测的场景提质增效。
部分应用案例
VisionBank AI的此次的OCR功能更新,除新增深度通用字符识别模块之外,还同步增加了【通用读码】模块,包含31种码制,条码、二维码均可使用,进一步升级了VisionBank AI在识别场景中的通用能力。
VisionBank AI是维视智造面向工业4.0时代,打造的”工业视觉检测大脑“。作为一款拥有近20年技术积累,传统算法融合深度学习的通用智能视觉开发平台,VisionBank AI具备“应用简单、稳定高效、深入场景、快速迭代”四大优势,可为机器视觉赋予更强大的类人脑能力。
平台基于极简的系统架构,及通用易操作的三大算法模块(传统算法&基础工具模块、深度学习算法模块及光度立体算法模块),可帮助企业在实现各类设备视觉功能研发的同时,优化平台成本,做到“0漏检”,从而有效提升生产效率和管理水平,实现生产的数字化、智能化升级。维视智造股份