登陆注册
199900000039

第39章 手写字识别技术

第四章第七节手写字识别技术

 显示屏上“写字”

你是否见过别人在掌上电脑上,用一根类似笔的东西,在小小的显示屏上“写字”,然后这

个“字”就出现在显示屏上并被电脑“承认”继而存储下来。其实这就是手写字识别技术。

手写字的输入方法与笔绘板基本相同,也是把手写字的位置信息首先转换成二进制的数字编

码信息,并写入显示存储器,实时显示在显示屏上。但随后的处理就不同了,手写字识别技

术会把写入的手写字信息在计算机内用一定的人工智能技术,对手写字进行智能化的识别,

并产生与之匹配的数字编码的中文或英文字符,同时所产生的字符也送给显示屏显示,最后

经过输入者确认后才作为正确的输入结果。

这种书写技术可以使我们与计算机进行信息交流,它不仅可以输入文本文字,而且可以输入

计算机或通信设备能够“理解”的命令,以便对它们进行控制和操作。这也是手写字技术与

笔绘板技术的不同之处。笔绘板技术虽然也可以进行手写字输入,但实际上其输入结果并未

被计算机识别和理解,仅仅是对它“照葫芦画瓢”地进行存储、传送。目前,手写字识别技

术,特别是中文字识别技术经过十几年的研究已经获得很大的发展,虽然在实用中还存在一

定的局限,如一定的错误率,但由于它作为一种多媒体与人工智能结合的技术,而且特别适

合我国的国情——汉字的结构比较复杂而且规律性较少,所以发展的十分迅速。

 汉字输入

目前,汉字输入主要分为人工键盘输入和机器自动识别输入两种,自动识别输入又分为

语音识别和字符识别两种。汉字识别技术可分为印刷体汉字识别和手写体汉字识别两大类,

后者又可分为联机手写汉字识别和脱机手写汉字识别。从识别的角度来看,手写体识别难于

印刷体识别,而脱机手写识别又难于联机手写体识别。

汉字已有数千年的历史,也是世界上使用人数最多的文字,对于中华民族灿烂文化的形成和

发展有着不可磨灭的贡献,并将继续发挥重要的、其他文字形式无法取代的作用。然而,汉

字是非字母化、非拼音化的文字,在当今高度信息化的社会里,如何快速高效地将汉字输入

计算机,已成为影响人机交流信息效率的一个重要瓶颈。

 汉字识别的困难

手写汉字识别是一种重要的、适用于把手写文稿随时输入计算机的方法,也是机器字符识别

最为困难的一个课题。这些困难和问题表现在:

1汉字类别多,

仅《康熙字典》中就包含了49 000多个汉字,而常用的汉字就有4 000多个,因而汉字识别

问题属于大类别(或者称为超多类)模式识别问题,在模式识别理论和方法研究方面有重大

意义。

2汉字字形结构复杂

汉字集合中相似字较多,有些汉字的差别仅为一点或一个笔画,由于手写变形的存在,使得

手写体中相似字的区分比印刷体要困难得多。因不同人书写风格的差异造成手写汉字的变形

很大,具体表现在以下几个方面:

(1)基本笔画变化。横不平,竖不直,直笔变弯,折笔的拐角变成圆弧等。

(2)笔画模糊,不规范,该连的不连,不该连的却相连。

(3)笔画与笔画之间、部件与部件之间的位置发生变化。

(4)笔画的倾斜角、笔画的长短、部件的大小发生变化。

(5)对于脱机手写汉字,不同人使用不同的书写笔可能造成笔画的粗细变化。

其中,手写汉字字形的变化是最难以解决的问题。

一般认为,联机手写汉字识别比脱机手写汉字识别相对容易些。联机手写汉字识别是一种人

工实时地把汉字输入计算机的方法,它利用书写板把笔画变为一维电信号,输入计算机的是

以坐标点序列表示的笔尖移动轨迹,因而被处理的是一维的线条(笔画)串,这些线条串含

有笔画数目、笔画走向、笔顺和书写速度等信息;而脱机手写汉字识别处理的仅是二维的汉

字点阵图像,是汉字识别领域中最后一个十分困难的问题,目前仍然处于实验室研究阶段。

字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国家、各民族的文

字(如汉字、英文等)书写或印刷的文本信息,目前在印刷体和联机手写方面技术已趋向成

熟,并推出了很多应用系统;另一类是数据信息,主要是由阿拉伯数字及少量特殊符号组成

的各种编号和统计数据,如邮政编码、统计报表、财务报表、银行票据等,处理这类信息的

核心技术是手写数字识别。近年来我国开始大力推广的“三金”工程在很大程度上要依赖数

据信息的输入,如果能通过手写数字识别技术实现信息的自动录入,无疑会促进这一事业的

进展。因此,手写数字的识别研究有着重大的现实意义,一旦研究成功并投入应用,将产生

巨大的社会和经济效益。

 手写数字识别的理论价值

手写数字识别作为模式识别领域的一个重要问题,也有着重要的理论价值:

(1)阿拉伯数字是惟一的被世界各国通用的符号,对手写数字识别的研究基本上与文化

背景无关,这样就为各国、各地区的研究工作者提供了一个施展才智的大舞台。在这一领域

大家可以探讨,比较各种研究方法。

(2)由于数字识别的类别数较小,有助于做深入分析及验证一些新的理论。这方面最明

显的例子就是人工神经网络,相当一部分的人工神经网络模型都以手写数字识别作为具体的

实验平台,验证理论的有效性,评价各种方法的优缺点。

(3)尽管人们对手写数字的识别已从事了很长时间的研究,并已取得了很多成果,但到目前

为止机器的识别本领还无法与人的认知能力相比,这仍是一个有难度的开放问题。

(4)手写数字的识别方法很容易推广到其他一些相关问题,一个直接的应用是对英文这样的

拼音文字的识别。事实上,很多学者就是把数字和英文字母的识别放在一块儿研究的。

随着国家信息化进程的加快,手写数字识别的应用需求将越来越广泛,因此应当加强这方面

的研究工作。应用系统的性能的关键与瓶颈仍然在于手写数字识别核心算法性能上,最终目

标是研究零误识率和低拒识率的高速识别算法。此外,尽早建立反映中国人书写习惯的、具

有国家标准性质的手写数字样本库也是当务之急。

同类推荐
  • 世界文学经典文库:基督山伯爵(青少版)

    世界文学经典文库:基督山伯爵(青少版)

    主人公唐泰斯原先是正直单纯的水手,由于遭到别人的陷害,在与心爱的人结婚的那一天,命运发生了天翻地覆的变化,他一下子被关进了黑牢。在暗无天日的黑牢里,唐泰斯万念俱灰,绝望的他想到了死亡,想用死亡来结束这一切。然而唐泰斯最终战胜了自己的懦弱,他知道“踌躇令强者止步不前,障碍令弱者不敢动弹”,“人总得有所冒险才行”,他及时抓住了机会,在恩人的帮助下,获得了新生。十四年的牢狱之灾结束了,唐泰斯变成基督山伯爵开始了他的复仇。
  • 军事家成长故事(激励学生成长的名人故事)

    军事家成长故事(激励学生成长的名人故事)

    英国著名科学家弗朗西斯·培根曾言:用伟人的事迹来激励孩子,远胜于一切教育。该书就是遵循这一教育理念,遴选了世界上最伟大的名人,以生动的故事娓娓讲述了他们的成长历程。让孩子们读这161位世界名人故事,依循他们的成长路径前行,“名人”的桂冠就有可能在前面。
  • 影响中国学生的经典寓言故事之六

    影响中国学生的经典寓言故事之六

    影响中国学生的经典寓言故事,编选了经典的故事,让学生从中明白道理,学会成长,体会人生。
  • 凯迪克图画书经典全集

    凯迪克图画书经典全集

    《凯迪克图画书经典全集》所有的题材都由凯迪克亲自挑选,古老的经典童谣、18世纪著名作家的作品加上作者自己天马行空的想象,完美呈现每一部作品里,广受小朋友的喜爱。本书精选凯迪克最经典的10本图画书合为一本。期待您和您的孩子在如诗似画的阅读中,享受到无尽的阅读乐趣,领会到故事中值得深思的道理。
  • 中国文化未解之谜

    中国文化未解之谜

    人类总是充满好奇心,富有求知欲望,不仅对历史积淀的文 化知识和日益发展的科学技术具有浓厚的兴趣,而且对世界上许 许多多的未解之谜都充满了好奇心。这是人类的心理特征,也是 人类社会进步的一种基本动因。从地球到宇宙,从自然到历史, 从科学到艺术,在这许许多多的领域中,无不存在着这样或那样 的“未解之谜”。
热门推荐
  • 全职管家

    全职管家

    高考零分怕什么,哥自有妙招活下去!吃吃霸王餐,被车撞了?还获得神奇异能?哈哈,赚了!邂逅二美女,没想被逼做管家!还是全职的?这是艳福吗?!不料体内恶魔重生,展开了一场颠覆乾坤的阴谋,他勇担大任,创造世纪神话!
  • 明治天皇:孝明帝驾崩卷(下册)

    明治天皇:孝明帝驾崩卷(下册)

    《明治天皇》再现了日本从幕末走向明治维新的历史变革,以优美的文笔,宏大的场景,详细描绘了日本近代决定国运的倒幕运动的整个过程。本书塑造了一个个鲜活的日本近代史人物形象,以及他们的坚定信念,对“安政大狱”、“樱田门之变”等重大历史事件的描述详实生动,是一部了解近代日本不可多得的佳作。
  • 读破金瓶梅

    读破金瓶梅

    《金瓶梅》是一部传世杰作,被称为“第一奇书”。《金瓶梅》主要描写了西门庆的一生及其家庭从发迹到败落的兴衰史,并以西门庆为中心,一方面辐射市井,一方面反映官场社会,展现了一个时代的广阔图景和政治与社会的众生相,刻画了西门庆这一典型的人物形象和以潘金莲、李瓶儿等诸多女性。 徐景洲的这本《读破金瓶梅》以札记形式笑谈《金瓶梅》这部奇书里的奇人奇事,点评人物性格,品味艺术技巧,阅读注重细节,行文亲切有味。
  • 亚森·罗宾探案故事集(中)

    亚森·罗宾探案故事集(中)

    《亚森·罗宾探案故事集》是法国著名侦探小说家莫里斯·卢布朗的代表作。《亚森·罗宾探案故事集》一经出版,很快便在法国家喻户晓,之后更是风靡整个欧洲大陆,至今仍畅销不衰,深受广大青少年读者的喜爱。亚森·罗宾既是一名心思缜密的盗贼,也是一位特立独行的侦探。紧跟他的脚步,开始一场神秘惊险的探案之旅吧。
  • 不交作业之七十二般变化(好看系列)

    不交作业之七十二般变化(好看系列)

    叙事艺术的时尚化表达,是王钢作品最受儿童读者欢迎的一个重要的因素。王钢小说呈现了今天儿童生活的时尚性的一面,而且用很新鲜的、具有当下气息的语言准确地表现了校园生活和儿童内心。王钢的时尚化表达,是从两个方面进行的:一是用幽默的场景和夸张而富有情感冲击力的语言来展现形象的特征。二是小说里每一个小角色的性格和语言都是很独立性的,作家给每一个孩子都画下了一幅喜剧化的脸谱。值得注意的是,王钢意识到了儿童生活时尚化的一面,将这种时尚化加以艺术的呈现,给予审美的观照,赋予爱的色彩。
  • 产孕妇保养与保健

    产孕妇保养与保健

    本书从女性生理常识、心理健康、生理健康、婚前孕后、育儿护养、饮食禁忌等诸多方面,以科学严谨的角度,深入浅出地全方位进行阐述,同时突出实用性和可操作性。
  • 重生娱乐之我为王

    重生娱乐之我为王

    我的人生只为随心所欲四个字,所以妨碍我的要么自己滚,要么我让你滚。这就是一个女汉子,用女神的外表欺骗世人,欺世盗名的故事。
  • 侧妃劫

    侧妃劫

    好奇游玩,她竟莫名奇妙的被人指为刺客,偏偏师父还不许她显露武功,她就只有乖乖的任人宰割!王府中,冷冽的六王爷勾起了她的兴趣,他的狂傲,他的孤冷,还有那偶尔一露的温情,都让她深陷,让她迷蒙,让她欲罢不能。同样,她的倔犟,她的坚强,她的清雅淡越,不知不觉间,牵动他的每一根情愫,每一条神经。她如一团迷雾,让他越陷越深.他爱她,想要娶她为侧妃。她亦爱他,却断然拒绝。只因为,他给不了她所要的……谁许我,一生不变唯一的承诺,我情愿,倾尽心中所有的柔情!片段一“王爷,王妃娘娘养了只小猫,很是可爱呢!”某王淡淡一撇,不予理会。“王爷,王爷,暮侧妃也养了只宠物,不过……”“不过什么?”某人好奇。“不过……不过是只大老虎,还咬死了王妃的小猫!”“什么?老虎?”某王一跃而起……片段二“王爷也认为毒是我下的吗?”“不是你还会是谁?”邪魅的薄唇冷淡的抿起,平静的面容看不出一丝涟漪。“我若说不是我,王爷可愿相信?”想要做最后一丝的努力,想要让自己死心!“本王更看重事实,因为除了你,没人会有这么毒的心肠!”一句话,像重锤般狠狠砸落,粉碎了她仅有的一点点奢望。没有丝毫犹豫,段如风一转身,亲自接过丫鬟手里那碗墨黑的药汁,一步步的逼向她。“好,我喝!若这是你们大家的心愿,我岂能不成全!”兰蕊大笑。很好,都想自己死吗?只是,你们不要后悔才好!仰头,一口气喝完,将碗一丢,白瓷碗儿立刻跌的粉碎,心,亦碎了一地……一缕鲜血在她的唇角滴落,兰蕊缓缓倒下,唇边是绝美的笑容,“王爷,告诉你个秘密……”友情推荐:苏瑾儿《杠上黑心老公》纳兰初七《“正”妃》青涩鸢萝《神之咒》陈霆颖《总裁的替婚前妻》御剑行《下堂妃也逍遥》青涩鸢萝《总裁-别太坏》玲江仙《丫头,哪里逃》澜姗《血妻》红涩《黑道美容师》红豆皮皮《妖孽太猛》过期贝儿《腹黑前夫,你死定了》孙夫人《禁---爱》钱菲菲《重生---纨绔千金》谈笑然《重生之八百年以后》冥溪《相公太勾魂》陌潇湘《契约结婚》七星盟主《古代女法医》苏瑾儿《囚宠“罪”妃》六王爷段如风由亲亲编编小憬拥有!这是唯一有人要滴男主……哈哈!
  • 明治天皇:孝明帝驾崩卷(下册)

    明治天皇:孝明帝驾崩卷(下册)

    《明治天皇》再现了日本从幕末走向明治维新的历史变革,以优美的文笔,宏大的场景,详细描绘了日本近代决定国运的倒幕运动的整个过程。本书塑造了一个个鲜活的日本近代史人物形象,以及他们的坚定信念,对“安政大狱”、“樱田门之变”等重大历史事件的描述详实生动,是一部了解近代日本不可多得的佳作。
  • 男孩一生要结识的100位名人

    男孩一生要结识的100位名人

    读一本好书,犹如和一个优秀的人成为朋友,本书将让你和100个成功的人成为朋友。100位名人的成长经历,犹如100个锦囊妙计,在你需要的时候,一一打开,人生的道路就会越走越开阔。