投稿指南
来稿应自觉遵守国家有关著作权法律法规,不得侵犯他人版权或其他权利,如果出现问题作者文责自负,而且本刊将依法追究侵权行为给本刊造成的损失责任。本刊对录用稿有修改、删节权。经本刊通知进行修改的稿件或被采用的稿件,作者必须保证本刊的独立发表权。 一、投稿方式: 1、 请从 我刊官网 直接投稿 。 2、 请 从我编辑部编辑的推广链接进入我刊投审稿系统进行投稿。 二、稿件著作权: 1、 投稿人保证其向我刊所投之作品是其本人或与他人合作创作之成果,或对所投作品拥有合法的著作权,无第三人对其作品提出可成立之权利主张。 2、 投稿人保证向我刊所投之稿件,尚未在任何媒体上发表。 3、 投稿人保证其作品不含有违反宪法、法律及损害社会公共利益之内容。 4、 投稿人向我刊所投之作品不得同时向第三方投送,即不允许一稿多投。 5、 投稿人授予我刊享有作品专有使用权的方式包括但不限于:通过网络向公众传播、复制、摘编、表演、播放、展览、发行、摄制电影、电视、录像制品、录制录音制品、制作数字化制品、改编、翻译、注释、编辑,以及出版、许可其他媒体、网站及单位转载、摘编、播放、录制、翻译、注释、编辑、改编、摄制。 6、 第5条所述之网络是指通过我刊官网。 7、 投稿人委托我刊声明,未经我方许可,任何网站、媒体、组织不得转载、摘编其作品。

笔迹自动比对可行性探析(3)

来源:自动化应用 【在线投稿】 栏目:期刊导读 时间:2020-09-01
作者:网站采编
关键词:
摘要:[1]樊雅琴,王炳皓,王 伟,唐烨伟.深度学习国内研究综述[J].中国远程教育,2015(6):27-33+79. [2]单大国等.刑事科学技术[M].北京:高等教育出版社,2016. [3]孙羽菲

[1]樊雅琴,王炳皓,王 伟,唐烨伟.深度学习国内研究综述[J].中国远程教育,2015(6):27-33+79.

[2]单大国等.刑事科学技术[M].北京:高等教育出版社,2016.

[3]孙羽菲.低质量文本图像 OCR技术的研究[D].北京:中国科学院研究生院(计算技术研究所),2005.

[4]周俊峰.正常汉字笔迹鉴定标准研究[D].重庆:西南政法大学,2007.

赵文朓(1996-),男,辽宁沈阳人,硕士研究生。研究方向:图像检验。

单大国(1961-),男,吉林长春人,中国刑事警察学院副院长,教授,硕士。研究方向:声像资料检验。

一、引 言在公安实践中,笔迹检验作为文件检验的重要内容之一,在传统上工作内容主要由文件检验技术人员进行,通过文字形态确认、特征选取、特征比对,最终给出鉴定意见。人工笔迹检验和文字识别的方法准确率高,且具有很强的说服力。但是文件检验技术人员在熟练掌握文件检验的各项技能并能做出高质量的鉴定之前,往往需要大量的练习和实际案件的积累。此外,样本的搜集和筛选也要耗费大量的人力物力,这在一定程度上加剧了警力不足的问题。随着计算机的普及,公安工作科技化集成的不断推进,逐渐强大的计算机功能给刑事科学技术办案人员提供了越来越多的辅助破案手段。这也提供了一条新的笔迹检验道路——利用计算机代替人工进行比对。二、文字识别与比对研究现状文字识别技术早在上世纪就被提出,经过十余年的沉寂,2007年左右出现了大幅进展。尤其是在智能手机和手写输入在生活中日渐流行后,文字识别技术更是随着手写输入精准化的需求迅猛地发展起来。目前较为流行的文字识别技术是基于 OCR的文字识别技术和基于深度学习理论的文字识别技术。基于OCR的文字识别技术发展得较为成熟,是将包含文字内容的图像经过一定的步骤进行处理,并在数据库中搜索出相应的文字内容,最后输出图像内容的文本形式的过程。基于OCR的汉字识别技术是基于拉丁文的识别原理和步骤,经过数据库的扩充和优化,最后形成的专属于汉字的识别方法(如图1)。基于深度学习理论的文字识别技术是从计算机的深度学习理论出发,将深度学习理论应用于文字识别,建立起的一个关于文字智能识别的系统(如图2)。但是无论是基于 OCR的文字识别技术还是基于深度学习的文字识别技术都仅仅停留在文字(包括手写文字)的识别上,没有进一步的对于人的笔迹或文字形成方面的研究。文字比对的商业关联性低是文字比对方面研究停滞在单一识别层面的主要原因。在文字比对(笔迹检验)方面的研究少之又少,甚至呈现空白状态。图1 OCR技术工作流程图2 一种深度学习原理的实例三、传统笔迹检验方法在计算机应用方面的探究传统的笔迹检验可以根据所分析的系统大小分为宏观层面、中观层面、微观层面三个层次,即笔迹的宏观层面特征、中观层面特征和微观层面特征。在进行人工比对时,这三个方面的特征都应当着重进行比对分析,通过样本与检材之间的宏观层面、中观层面、微观层面上的共同点或差异点来给出最终结论。三方面应当共同指向“是同一人书写”或者“不是同一人书写”,而不应在某一层面上出现较大分歧。这种出于鉴定人经验性的判断,在实际判断时,不同的鉴定人之间给出的鉴定意见也不尽相同。宏观层面中观层面微观层面三个层次上的笔迹特征各有其显著特点,并且证明效力也彼此有别。笔迹的宏观层面特征包含整体风貌特征与整体布局特征。整体风貌特征指的是书写人书写整篇文稿时,通篇的行文特点。虽然整体风貌特征也同样容易受到书写纸张和书写人主观意愿的影响,但如果书写笔迹并非伪装笔迹,一个人一段时期内的笔记整体风貌应当是较为一致的。然而实际文件检验工作中仍然需要根据单字与单字之间的关系找出全篇的整体特点。笔迹的中观层面特征包括文字搭配比例特征、形体大小特征以及笔顺特征。文字的形体大小特征是书写人所写的单字的大小、形态以及书写字体方面的特征。每个人写的字的风格有很大差别,根据书写字体风格可以分为细长、矮胖、方正、长圆等书写风格。字体的写法特征根据社会习惯可以分为楷体、行草、草书等。单字的大小特征就是依照字的高度与宽度来分别的字的特征。单字的形体特征是最容易被改变的一种特征,每个人的书写风格各异,而且书写风格会根据书写快慢、书写持续时间甚至是书写人的主观意愿改变。因此字体特征也是一种易于伪装的笔迹特征。书写水平高或者知识水平高的人,往往可以书写出多种字体,并且书写速度的改变会极大地影响字体,比如慢速书写易接近楷体,而快速书写就形成草书等。字的大小更是一种受书写载体变化而急剧变化的形体特征,同样一个人在笔记本上书写和在A4纸上书写时,字的大小会具有很大差别,即便是刻意控制,在书写较长时间后,A4纸上形成的文字大小也会与笔记本上形成的文字大小相差较大。文字搭配比例特征是指单字中各个偏旁或组成部分之间的位置关系特征。不同的人书写时各部分位置关系不同,并且带有很强的个人特点。笔迹的微观层面特征包含运笔特征和笔迹附加特征(即笔痕特征)。运笔特征是书写汉字笔画时,每一个笔画所形成的起笔、行笔、收笔过程中表现出的个人特征。每个人的起收笔特征在单个字中体现较为不明显,甚至绝大多数人没有特别的可以提取出作为个人特征使用的运笔特征。但是如果扩大样本量,分析同一人所写的大量单字,就会发现其运笔特征的规律。笔痕特征是人们进行书写活动时,书写工具在纸张等上形成痕迹时留下的书写工具特征痕迹。同一书写人使用同一只书写工具进行书写活动,在笔迹上体现的笔痕特征应当具有稳定性和特殊性。因此笔痕特征可以作为笔迹检验的一项依据。四、笔迹自动比对的可行性探析笔迹检验属于需要大量经验判断的学科分支,因此将这种出于鉴定人的经验性所给出的判断,应用到计算机上时并不像我们想象中的那样简单。宏观层面、中观层面、微观层面三个层次上的笔迹特征各自有其显著特点,并且证明效力也彼此有别。因此,选取合适的、准确率高的层面的笔迹特征会使得笔迹自动比对的研究事半功倍。笔迹文件在进行扫描、采样和量化时,会不同程度地在笔迹文件中添加不必要的干扰,或是将重要的信息消除。也就是说,一些细小的特征点(主要为笔痕特征)并不适合作为笔迹自动检验的检验对象。宏观层面特征在作为检验项目时,由于宏观层面特征本身证明效力不如中观层面和微观层面特征证明效力强,且在实际案件中寻找书写条件类似、载体相同的样本比较难操作,因此从中观层面和微观层面上选取笔迹自动检验的突破口优于从笔迹的宏观层面特征作为突破口。需要明确的是,笔迹自动比对的前提是文字识别。文字识别中极为重要的内容就是文字分区。将手写汉字进行分区,把一张带有文字信息的图像进行分割,每个单元包含且仅包含单个汉字的全部内容。这也就使得文字自动识别分区后的区块无法体现出字的大小信息,因而选取字的大小特征作为笔迹自动比对的突破点并非明智之举。搭配比例特征主要出现在存在左右结构和上下结构的手写汉字中。人工比对中将单字分割为几个部分,这种分割方式同样可以运用到计算机自动识别中,经过适度的膨胀处理,就可以得到各部分位置搭配比例的特征。再通过大量的样本数据累计,就可以得到比较可靠的文字搭配比例特征。笔顺特征按照出现频率的高低可以依次分为规范笔顺、通用笔顺、特殊笔顺三大类。在笔迹检验领域,笔顺特征是一种个人特征性极强且相对稳定的特征,因为每个人在习得字的笔顺之后,无论在何种情况下再次书写该字,都会下意识地按照习得笔顺的写法进行书写。尤其是书写人书写中出现特殊笔顺时,其应用价值就会更高。因此,如果能够利用计算机自动识别笔顺特征并进行比对,那么这将减轻大量的技术人员的负担。虽然微观层面特征中笔痕特征不宜优先选取为笔迹自动检验的特征,但是运笔特征与之不同,是一种十分重要的笔迹特征。采用运笔特征作为笔迹自动检验的首要依据的优势在于运笔特征是笔迹检验最能体现出个人书写习惯的特征,如果通过检材和足量样本的输入并比对,得出的鉴定结果应当是可靠的。在选择合适的笔迹特征作为笔迹自动比对的突破口时,构建合适的检验区块可以为笔迹自动比对减少不必要的弯路。计算机代替人工进行笔迹自动比对,应当分成四个区块操作,即笔迹的读取区块、笔迹特征识别区块,笔迹特征选取比对区块和输出区块。表1 笔迹的区块分属笔迹的读取区块笔迹特征识别区块笔迹特征选取与比对区块结果输出区块扫描采样和量化降噪处理二值化处理汉字分块特征分割特征提取特征比对比对特征评估结果输出当前发展迅猛的深度学习理论不断深入各行各业,公安系统在科技化的道路上将其吸纳,作为打击犯罪的有力手段。笔迹自动检验可以利用深度学习理论作为其指导理论的一部分。对于单一案件,计算机程序将侦查人员所搜集的样本进行识别、分割、整理归类等一系列操作,分析样本与检材之间相同点和差异点;但其更多的是在宏观层面上,分析某一类人群的书写笔迹特征,从宏观上对笔迹进行分割和归类,形成一个具有代表性的数据库。这样就可以把后来的案件直接输入计算机,在最短的时间内得到结论。五、结 论综上所述,笔迹自动比对在理论上是可行的。通过对笔迹特征的合理选取,完成四个区块的合理构建,将深度学习理论加以运用,可以实现笔迹检验工作自动化、智能化。在选取笔迹特征突破口时,应当选取证明效力强、特征提取和处理较为容易的笔迹中观层面特征作为重点研究对象,同时应当适当辅以宏观层面特征和微观层面特征,来确保笔迹自动比对的正确率。参考文献:[1]樊雅琴,王炳皓,王 伟,唐烨伟.深度学习国内研究综述[J].中国远程教育,2015(6):27-33+79.[2]单大国等.刑事科学技术[M].北京:高等教育出版社,2016.[3]孙羽菲.低质量文本图像 OCR技术的研究[D].北京:中国科学院研究生院(计算技术研究所),2005.[4]周俊峰.正常汉字笔迹鉴定标准研究[D].重庆:西南政法大学,2007.

文章来源:《自动化应用》 网址: http://www.zdhyyzz.cn/qikandaodu/2020/0901/644.html



上一篇:地名普查数据库建设的研究和实现<sup>①</sup>
下一篇:探讨不动产登记的电子化和自主化

自动化应用投稿 | 自动化应用编辑部| 自动化应用版面费 | 自动化应用论文发表 | 自动化应用最新目录
Copyright © 2018 《自动化应用》杂志社 版权所有
投稿电话: 投稿邮箱: