丁晓青:慧眼识“图”

●陈瑜

  丁晓青教授已经不再年轻,手上依稀可见的老年斑泄露了她年龄的秘密。然而,墨绿色的套装,活跃的思维,很难将其与年近古稀的老人联系起来。

  1962年,丁晓青毕业于清华大学无线电电子学系,获优秀毕业生金质奖章的她顺利留校任教。中间丁晓青从事过多个方向的研究。80年代,汉字能否进入计算机成为关乎汉字存亡的大问题。“当时形势非常紧迫,如果不能实现这个突破,就只能使用拼音。而文字是文化最重要的部分。”责任心驱使,丁晓青走进了文字识别,在经历了拆笔画识别算法等尝试后,1989年,丁晓青研究组独辟蹊径,通过图像识别,用统计方法解决了这一难题。而这一难题的解决不光让汉字输入计算机成为现实,更为重要的是,我国自有汉字识别技术摆脱了汉字输入技术可能受制于人的可能,目前美国就有专业公司在世界范围销售该产品。

  汉字输入难题解决后,丁晓青将眼光瞄准了少数民族文字。2007年,经丁晓青主持研究的“统一平台少数民族文字识别系统”,实现了将蒙古文、藏文、维吾尔文等六种少数民族文字的纸质出版物转换成电子出版物,不再依靠人工录入,印刷文档的扫描图像就会自动生成可编辑检索的电子文档。

  2000年,丁晓青61岁,就在大家认为她的科研生涯可以考虑画个句号时,她却悄悄将研究重心转向了人脸识别系统。“很多人都问我,为什么会从文字识别转向人脸识别,其实他们不知道,这当中的原理是相通的,都要用到图像识别。”说这话时,丁晓青难掩心中的喜悦。

  “眉毛、鼻梁、嘴巴等是人脸的基本结构,每个人的人脸结构基本相同,而不同人的人脸具有的是人脸的细微差别,人脸识别系统就是通过这种细微差别确定不同人的身份,找出可疑人物。”2006年,丁晓青教授研究组的人脸识别系统传来好消息:在美国NIST组织的2006年人脸识别供应商评测(Face Recognition Vendor Test 2006,简称FRVT2006)中,清华大学的这套识别系统获得了国际领先的测试成绩。

2004年9月,在国际人脸认证竞赛中,丁晓青教授研究组夺冠

  从文字识别到人脸识别,丁晓青教授这辈子大部分科研精力都花在了各种图像识别的研究课题上。1次国家科技进步三等奖,3次国家科技进步二等奖,4次部科技进步一等奖,全国电子十大科技成果奖……每个奖项见证着丁晓青的成长。

  “科技最终要有用,就要真正能够促进发展,转化成生产力。”对丁晓青来说,有可做的事情,做的事情人家需要,这就是幸福。“科技工作者应更多地做些实实在在的工作,不能太重名利。”做人脸识别研究时,丁晓青拿到自然科学基金少量的经费,基本上是靠自筹经费完成了整个研究。“科研人员从国家拿钱,只能做分母,不能做分子。”丁晓青认为,拿最少的钱干最多的事,对国家的贡献才越多。

  来源:《科技日报》 2008-09-03

2008年09月04日 12:10:59  清华新闻网

更多 ›图说清华

最新更新