logo
天地变化的道理
使用率很高网站
生活要常常分享
您身边百科全书
免费为您秀产品
光学字符识别
光学字符识别 光学字符识别(,缩写:OCR)是指对包含文本内容的图像或视频进行处理和识别,并提取其中所包含的文字及排版信息的过程。例如,一个常见的应用是将包含文档图像的不可编辑状态的 PDF 文档通过 OCR 技术识别后,转换为可编辑状态的 Word 格式文档。 通常来说,根据不同文本内容的特性而言,OCR 技术的应用场景大致可分为以下几类: 过程. 输入. 对于不同的图像格式,有着不同的存储格式、不同的压缩方式,目前有OpenCV、CxImage等。 前期处理. 二值化. 如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。 对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。 图像降噪. 对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。 倾斜校正. 由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。 中期处理. 版面分析. 将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤目前仍待优化。 字符切割. 由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。 字符识别. 早期以模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。 版面还原. 人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。 后期处理. 根据特定的语言上下文的关系,对识别结果进行校正。 输出. 将识别出的字符以某一格式的文本输出。 发展历史. OCR的概念是在#重定向 -{H|zh-cn:重定向;zh-tw:重新导向;}-后来#重定向 -{H|zh-cn:重定向;zh-tw:重新导向;}-#重定向 -{H|zh-cn:重定向;zh-tw:重新导向;}-#重定向 -{H|zh-cn:重定向;zh-tw:重新导向;}-
光学字符识别
本站由爱斯园团队开发维护,感谢
那些提出宝贵意见和打赏的网友,没有你们的支持,
网站不可能发展到今天,
继往开来,善终如始,我们将继续砥砺前行。
Copyright ©2014 iissy.com, All Rights Reserved.