天下之大 唯有识也

——记清华大学电子工程系智能图文信息处理研究室主任刘长松

来源:中国科学报 2013-3-12 周娜

  “天行健,君子以自强不息;地势坤,君子以厚德载物。”一百年前,梁启超在一次名为《君子》的演讲中引用了这句古语,让“自强不息,厚德载物”伴随着一所大学走过了百年征程。百年风雨路,水木湛清华。这所国际一流的综合性大学,历来是培养、孕育高科技人才的摇篮。走进清华园,能够感受到这所百年学府所承载的厚重;而走近刘长松,我们更为他自强不息的科研历程所感动。

慧视词典 开启英语学习新时代

  如果你在微博上看到有好友晒出TA新安装的英语学习的APP;如果你在图书馆看到有达人不停地在对英语杂志拍、拍、拍;如果你在教室发现有人不背单词,而是用手机在拍单词。你一定会十分惊讶,但是,如果你了解过慧视词典这款手机应用软件,或许你的疑惑就能解开了,因为他们正是在使用文通慧视词典安卓版进入动态视频实时识别翻译模式在学习、翻译英语单词。

  慧视词典是一款基于android平台的英文识别及翻译的应用程序,它可以通过手机摄像头拍摄英文字符图像,然后实时识别并进行翻译,利于英语学习及阅读。开发这款软件的清华大学电子工程系副教授刘长松告诉记者,这个产品是研究团队为推动其所研制的文字识别技术核心软件在智能手机平台上的应用而精心研制的,并通过北京文通科技有限公司进行用户服务,在各大安卓市场上免费下载。

  别看它只是一个小小的软件,但只要把它安装在手机上,不用人工输入,在不过多占用内存的前提下,就可以直接用手机摄像头拍摄英文字符图像,而且还支持模糊匹配对错误识别结果进行修正,做到实时识别并翻译。

  记者不禁疑惑,现在市场上英语翻译类工具五花八门,文通慧视词典的独特性在哪儿呢?刘长松说,文通慧视词典安卓版以其独有的识别核心技术,小小内存便可支持大大功能。它所特有的本地加载词典及识别核心,不用联网可脱机完成识别翻译,而且还支持动态视频模式及静态拍照模式两种方式识别翻译,当然识别结果还可以联网查询。

  刘长松拿出手机为我们演示了整个过程:当你的手机上安装了慧视词典这款软件后,遇到不懂的英文时,只需打开该应用,默认进入动态视频实时识别翻译模式。屏幕左上角是静态拍照模式及动态视频模式切换按钮;右上角是预览视频图像的缩放按钮;屏幕中间十字焦点中心是用于指向所要识别单词的位置;屏幕下方显示翻译结果,这里支持简要/详细翻译切换、锁定翻译结果及识别单词的网络搜索操作。如果你点击屏幕左上角的“摄像—拍照”按钮,就可进入拍照模式,而点击屏幕右侧中间位置的拍照按钮,采集当前文字图像后,触摸任意英文单词位置,即可显示识别及翻译结果。

  我们可以设想,当我们正试图提高我们的英语水平,在为获得第一手的研究资料而阅读大量国外的英文原著和学术期刊时,专业性的生词将不再阻碍我们的阅读速度。这是慧视词典为我们勾画的美妙蓝图,正如刘长松所言,这一应用将开启英语学习新模式。

升级技术 让伪钞假票无所遁形

  应用是科研的“真命题”。这也正是刘长松一向所推崇的,他认为,科研成果只有在信息化事业中推广应用,为人们的生活带来便捷才是真正的归宿。因此,让成果主动走向产业化,就成为他科研生涯中的重要一步。

  2011年5月1日,GB16999-2010《人民币鉴别仪通用技术条件》强制性国家标准正式实施。新版标准要求采集更丰富的信息,为“以真鉴假”提供了条件。这是我国反假货币类金融机具在标准化进程中迈出的重要一步,也是夯实反假货币类金融机具研发、生产与使用,市场准入与运行管理基础性工作的战略举措。而这一新颁布的国家强制性标准的背后,凝聚了刘长松团队的艰辛与汗水,他们为标准的出台提供了解决方案。

  2011年,由刘长松团队主持研制,清华大学与梓昆科技(杭州)有限公司合作研制成功的“多光谱图像钞票鉴伪技术与系统及应用”通过了教育部组织的技术鉴定。该系统以嵌入式数字信号处理器(DSP)平台为基础,集成了图像处理和鉴别算法,可以进行多光谱图像的采集、处理与识别。刘长松向记者解释说,这项技术正是利用了钞票中丰富的图像信息,实现了钞票的券别、套别、版别、钞票冠字号码的准确识别和真伪钞票的有效鉴别。该系统是国内外首次实现的同时具有多光谱图像鉴伪与冠字号码识别功能的实用系统,与传统钞票鉴伪方法结合,能够达到更高的假钞防范能力。

  谈到这项技术的应用前景,刘长松介绍说,多光谱图像钞票鉴伪技术与系统具有良好的可移植性与可扩展性,满足大规模生产和应用的需求。系统的硬件具备连接多种图像传感器的能力,可以方便地与不同规格和不同厂商的点钞机、ATM机、清分机等连接。未来还可应用于自动贩卖机等其他收取纸币的机具上。

  2001年,作为项目负责人,刘长松再次攻克了国家金税工程的核心难题之一 ——“增值税发票扫描识别系统”。该系统可以通过自动识别发票上的字符,为防伪税控系统判别增值税发票的真伪提供依据,使整个增值税发票防伪税控系统具有可行性。自研制成功后,该系统已经通过了国家税务总局亲自主持、严格把关的评测,鉴定结果显示其在技术上处于领先地位。目前,数万套“增值税发票扫描识别系统”已经广泛应用在全国各地的各级国税局内部,为防止虚开、伪造增值税发票,保证国家税收增长作出了重大的贡献。

  成绩属于过去,刘长松团队并未止步于此,通过对生活的细致观察,他们了解到,企业一直在为去国税局排队等待而深感苦恼。于是,在此基础上,他们逐渐把增值税发票扫描识别系统发展到直接应用在企业端。如此一来,企业就可以把该系统的识别结果通过网络上传到国税局,直接完成发票认证的工作,免去了耗费大量时间去国税局排队的麻烦,大大提高了工作效率。目前,该系统的企业端用户已经超过100万,仅增值税发票扫描识别系统带动的扫描仪销售产生的直接经济效益就远远超过3亿元,其社会效益意义非凡。

经年积淀 累累科技成果满枝头

  每一项科研成果的研发成功都不是一朝一夕的事。刘长松也不例外,他之所以能有今天的成就,这和他数年来的钻研、努力和积累是分不开的。

  1995年,刘长松获得清华大学硕士学位,2003年,任清华大学电子工程系副教授,一直从事文字识别理论和技术研究,并且在理论研究技术应用和产品化方面取得了突出成绩。

  在印刷体及脱机手写文字识别领域,刘长松作为主要研究人员研制了高性能东方文字文档智能全信息数字化系统,为纸质文档转化为电子出版物提供了最佳的解决方案,以此制作了《人民日报》、《南方周末》、《深圳特区报》等大量优秀的电子出版物。开发了文通e-Card名片识别系统,以及运行于手机上的名片识别模块;开发了通用表格识别核心技术,广泛用于银行票据识别、手写考卷评阅等领域;研制了身份证、护照、港澳通关证件等信息的识别系统,在海关、宾馆等广泛使用。

  在联机手写文字识别领域,刘长松开发了用于手机、PDA的嵌入式联机手写中文识别系统,广泛应用于三星、波导、联想、NEC等手机上;手写公式识别,用于Nokia手机中的手写计算器应用中;基于PC的联机手写输入系统,在Wacom,清华紫光、清华文通等许多硬件和小灵鼠等软件产品中应用。

  在多国车牌识别系统领域,刘长松提出了利用文字定位为基础的车牌定位算法,提出了适用于具有固定排列规则文字的模板匹配算法,结合抗干扰的灰度字符识别核心,具有识别速度快、适应性广、正确率高的特点。该系统目前支持PC/Windows、Linux、WinCE、DSP四种平台,是国内唯一的具有该能力的核心。并在中国大陆车牌识别的基础上,实现了中国香港、澳门、台湾,英国等多国/地区车牌识别,并获得广泛应用。如深圳海关车辆出入境通道、澳门交通管理、内地许多高速公路、交通监控、移动稽查等应用。

  众多付诸实践应用的成果,如同荣誉光环上闪烁夺目的宝石,铺就了刘长松的科研之路。

  1996年,他荣获联合国技术信息促进系统(TIPS)评选的“发明创新科技之星奖”;1998年,凭借“THOCR97综合集成汉字识别系统”获得教育部科学技术进步奖一等奖;1999年,该系统获得国际经济评价(香港)中心授予的世界华人重大科学技术成果证书;2000年,“THOCR97综合集成汉字识别系统”获国家科技进步奖二等奖;2003年,“高性能东方文字文档智能全信息数字化系统”先后获北京市科技进步奖二等奖和国家科技进步奖二等奖;2005年,“多字体印刷藏文(混排汉英)文档识别系统”被授予北京市科技进步奖三等奖;与此同时,“统一平台上少数民族文字(藏、维、哈、克、朝)文档识别系统”也获得了中国电子学会电子信息科学技术奖二等奖的好成绩;2009年,“TH-ID人脸和笔迹生物特征身份识别认证系统”获2008年度国家科技进步奖二等奖。

  2006年8月,刘长松被评为信息产业科技创新先进工作者的光荣称号;2008年,入选教育部“新世纪优秀人才支持计划”。

  不惟如是,刘长松还享有9项软件著作权、10项发明专利,并先后在国内外学术期刊和会议发表论文80余篇……

  有的人,一生碌碌无为,沉溺于一片幻想的世界,虚伪地幸福着;

  有的人,一生孜孜以求,在理想的道路上摸索前进,痛并快乐着。

  刘长松,这位在人生道路上锲而不舍、不懈追求,在科研路上孜孜以求、上下求索的清华人,正以百倍的热情、坚实的信念向着更为远大、更为深邃的理想坚定前行……

 

2013年03月12日 16:11:15  清华新闻网

更多 ›图说清华

最新更新