•  最新新闻列表
  •  
 首页 > 媒体清华 > 内容

立足国家需求是“图像识别”发展新生机

——清华大学电子工程系智能图文信息处理研究室丁晓青团队“识别研究”新发展纪实

来源:中国科学报 2012-11-9 李亮

  文字识别、人脸识别、身份证识别、图像识别……在这个信息化时代,高新技术的发展为人类开启了一扇“识别”的方便之门,渗透到安检、交通、通信、公安等各个领域,为社会生活带来了新的体验。对于识别研究领域的所有科学家来说,如何物尽其用、造福于人,是他们孜孜不倦的追求。清华大学电子工程系智能图文信息处理研究室丁晓青及其团队成员刘长松、方驰等就是其中的代表。

  多年在识别研究领域里摸爬滚打,丁晓青早就练就了一身“慧眼明察秋毫,智能识人辨字”的本领,在印刷、手写汉字识别及多文种文字识别、多模式生物特征(人脸、笔迹等)身份认证方面不断取得多项具有国际领先水平的自主创新研究成果,形成TH-OCR系列文字识别软件和TH-ID生物特征(人脸、笔迹等)认证软件产品,先后获国家科技进步奖4次,部级科技进步奖一等奖4次,全国电子十大科技成果奖。

  50年风雨砥砺,年过七旬的丁晓青却依然和团队一起,在识别研究领域,在科技服务社会的道路上,进行着新的突破。

解民所苦,文字识别探索永无止境

  我国是统一的多民族国家,但直到21世纪初,与拉丁文、汉字相比,蒙古、藏、维吾尔、哈萨克、柯尔克孜等民族文字的识别研究几近空白,严重影响了文化信息化的发展。2007年,丁晓青成功主持研制了“统一平台主要民族文字识别技术与系统”,基本解决了我国少数民族文字文档识别问题,该系统已在国内和国际范围推广。

  为进一步推进科研工作,丁晓青团队深入研究并推出了基于蒙、藏、维等文档识别的各文种文档关键词检索以及跨文种理解系统。其奥妙在于可以将民族文字文档经过识别,变成计算机可以阅读的文档,这样就有可能基于对识别文档的分析和字典查询等工具,将其内容转换为汉字加以理解;反之,也可将汉文档转换为藏文档或蒙文档表示,从而实现“跨文种的识别理解”,极大地方便了不同民族文字间的相互理解和沟通。不仅如此,该团队还在国内外首次构建了蒙、藏、维文等多文种笔迹鉴别系统,支持大规模数据库笔迹检索,综合解决了多种民族文字笔迹鉴别的问题。可以说,在丁晓青及其团队的努力下,中国古老少数民族文字得以跨入“数字化”时代,并焕发出了新的活力。

  事实上,近年来,丁晓青及其团队在文字识别领域所取得的创新进展并不止这些,脱机手写文本识别、联机手写整句识别系统等也十分出色。其中,尤以汉字识别技术在增值税防伪税控中的应用更为引人注目。经过系列创新,他们对原有增值税发票识别系统增加了最困难的商品明细的识别功能等。2011年5月以来,该系统已在上海、陕西和深圳三地进行试运行。随着项目的进一步推广,不仅可以有效防止不法分子通过篡改企业名称、货物名称等汉字信息对外虚开增值税专用发票案件的发生,还可以令国税机关准确掌握企业生产经营的第一手信息,为国家当前营业税改增值税的“营改增”税制变革提供有力的支持。

与时俱进,人脸识别又有新发展

  文字和人脸是图像中最重要的两类目标,丁晓青带领她的团队,在长期进行文字识别研究取得多方面重要成果的基础上,开始了对人脸识别认证系统的探索与开发。多年攻坚克难,曾创下研制成功TH-ID人脸和笔迹生物特征身份识别认证系统,获得国际重要的FAT人脸认证评测最优算法奖,并荣获2008年国家科技进步奖二等奖的佳绩。

  随着国家安全对于人脸识别的急迫需求,人脸识别的研发与时俱进,实现了新的突破。利用超分辨率技术解决视频图像质量低下的困难;利用三维模型解决人脸姿态大变化问题;针对视频监控人脸识别和跟踪,解决对人脸各器官的特征点进行精确定位和跟踪难题,提出在多视角AAM的框架下,结合随机森林和线性判别分析的实时姿态估计和改进的在线表象模型等方法,极大地提高了跟踪的稳定性和应对光照、表情变化的能力。此外,他们还对人脸性别、种族、年龄、表情等深度属性的识别进行了深入研究,提出了一种基于皮肤纹理特征的高分辨人脸图像识别的方法,有效地提高了人脸识别的性能。  

  目前,团队所开发的系列人脸识别技术已经被长期应用于出入境自助通关、安全监控系统,以及应用于移动终端、电子类产品和互联网上。通过与海鑫金科公司合作,并已成功应用于上海世博会和广州大运会、深圳文博会等重要场合的安检系统、公安清网工程等;腾讯公司利用该技术开发的多种手机和互联网产品,已投入实际应用;人脸识别技术也获得韩国三星公司青睐,准备在其电子类产品中加以应用。

  值得一提的是,丁晓青团队在静止图像内容分析理解方面所获得的成绩显著,在字符识别核心技术的基础上,他们力求进一步解决存在的各种问题,例如深入研究连笔书写的手写文字无切分识别、复杂背景下文字的自动提取与识别等一系列问题。研制成功多光谱图像钞票鉴伪技术与系统、多国车牌识别系统。前者对于货币管理、打击犯罪、维护国家金融秩序的稳定具有重大意义;后者在高速公路、停车场、车辆监控、交通管理等领域被广泛应用。

  “如果说,在识别领域还作出了一些成就,那是因为我们整个团队的努力。研究室一代又一代成员走出校门,在识别研究领域成为骨干力量;一代又一代年轻人补充进来,成为新鲜血液。有理由相信,我们将在图像识别研究的道路上走得更远……”丁晓青说。

  对于未来,丁晓青充满了希望。

(http://news.tsinghua.edu.cn)
[更新:2012-11-09 14:58:27]
[阅读:人次]
清华大学官方微信 清华大学官方微博 校报《新清华》微信 清华电视台微信
相关新闻
  • 网友评议