•  最新新闻列表
  •  
 首页 > 综合新闻 > 内容

国际中文语言资源联盟年会:联盟搭台破解中关村幸福难题

科学时报 2006-02-20 安沙

  在2005年国际中文语言资源联盟年会上,高频词是产学研——产学研结合、发挥产学研优势、加强产学研商合作……我们可以清楚地感受到,产学研这道横跨在中关村诸多企业发展面前的幸福难题,却在中文信息处理这个民族企业的技术水平与国际先进水平相当的领域里,树立了合作的典范。

  “中文信息处理是中国信息产业中为数不多的、跨国企业未能垄断、而民族企业的技术水平与国际先进水平相当的领域之一。我们要在跨国企业虎视眈眈瞄准我国中文语音与语言技术市场时,抢先赢得关键的先机;同时通过市场的开拓和技术标准的确立,有力地推动民族企业在中文语音识别与语言理解领域的主导地位。”这是北京市海淀区副区长于军在1月14日国际中文语言资源联盟年会上一段热情洋溢的讲话。

  据悉,国际中文语言资源联盟(CCC)年会是由清华大学智能技术与系统国家重点实验室、北京中关村高新技术企业协会、国际中文语言资源联盟主办,中国社科院语言研究所、北京得意音通技术有限责任公司、清华大学-得意升文声纹处理联合实验室等协办。

  据国家信息产业部统计数据显示,2005年7月,我国电话用户总数达到7.00606亿户;互联网信息中心调查结果显示,截至2005年7月,中国上网用户达1.03亿人,其中使用宽带上网的人数达到5300万。预计今年,中国网民总数将超过美国而跃居全球第一位,中文将有可能成为世界第一大网上语言。

  在这样的产业机遇面前我们能做什么,又做了什么?本次年会响亮地喊出了“发挥产学研通道优势,开展自主创新活动,推动中文信息产业发展”的口号,并强调了为科研机构和企业之间提供无缝交流与合作平台的国际中文语言资源联盟,在推动中文信息产业所做的巨大贡献。

  对此,中国信息学会会长卢时彻说:“清华大学拥有国际先进水平的技术和人才,以清华大学信息技术为依托的国际中文语言资源联盟在科研机构和企业之间架起了一道相互沟通的桥梁,通过中文语音与语言技术领域产、学、研、商机构的加入和密切合作——尤其在建立我国自主知识产权的国际和国内技术标准方面的合作——为进一步扩大中文在全球信息化建设中的影响程度和应用范围、促进中文信息处理产业的快速发展、为中华民族在信息技术产业中发挥更大的作用,做出了积极的贡献。”

  清华大学副校长龚克也高度赞扬了该联盟所采用的产、学、研、商的合作模式。他表示,从技术方面讲,中文信息处理可能是我国实现创新跨越的突破点。刚刚结束的全国科学技术大会,党中央、国务院特别强调要进一步深化科技改革,大力推进科技进步和创新,大力提高自主创新能力。清华在信息技术领域拥有坚实的基础和雄厚的实力,在中文信息处理领域更是有长期的技术积累和优秀人才。“国际中文语言资源联盟”是清华信息科学技术国家实验室软平台建设的一个重要组成部分,有利于我校在中文信息处理领域与国内外相关企业建立良好的合作关系,共同研究和推动民族自主知识产权的国际和国内技术的标准,促进我校的技术创新和科研成果向产业转化。

  我国产学研合作开始于20世纪80年代,其在扩大技术创新的效应、促进各行业领域发展、加快经济建设方面发挥着重要作用。但就中关村区域所拥有的科研资源来看,仍然存在着转化率低的问题。整个北京地区,近几年每年的科研与开发项目约4万项,完成1.5万项,推广应用项目0.45万项,形成产业化的项目则更少。

  产学研是实现技术创新与产业化发展最好的途径,这点毋庸置疑。但是,“以企业为中心、以市场为导向”的新型产学研机制的建立仍然存在障碍。这样的现实同样存在于中文信息产业领域。国际中文语言资源联盟理事长郑方教授在联盟工作总结中提到:“中文信息处理产业面临‘自主创新成果’与‘产业规模’之间严重脱节的境况。一方面,科研成果缺乏产业考虑;另一方面企业由于各种主客观因素缺乏创新能力;更重要的是,科研机构和企业之间缺乏沟通。”

  在这样的大背景下,国际中文语言资源联盟为科研机构和企业之间提供了无缝交流与合作的平台,成为产学研合作的另外一种方式。联盟的宗旨是搜集整合现有中文语音和语言数据库以及创建新的语音及语言数据;整合现有的涉及中文语音和语言数据库资源的创建、标注、分析工具,提高工具实用性,以及开发新的工具;搜集、整理和介绍有关中文语音和语言的规范和标准;促进中文语音和语言数据资源的交流与共享。

  目前,联盟创建的数据库规模已经比2004年翻了一番,3个万人规模的巨型数据库正在开发中,为采集千万规模数据库奠定了技术基础;同时,联盟在产业化工作上也取得许多重要成就,创造了喜人的经济效益和社会效益。这一切才刚刚开始。

  国际中文语言资源联盟成立两年来,一直得到了海淀区政府和海淀园管委会的关心和支持。海淀区副区长于军在会上提到,“海淀区拥有众多的人才资源和技术资源,我们的企业群体和产业推进的各类机构也敢于和善于参加国际竞争,作为地方政府、作为园区的管理促进机构,我们也非常支持园区内的企业和科研单位以及各类要素在高新技术领域内与国际重要的学术和产业单位紧密结合,制订具有国际先进水平的标准,并且通过一系列的标准化战略,不断地推动区内的企业和企业的群体走向高端,充分发挥中关村高科技园区以及海淀区的技术优势,保持中关村科技园区海淀园在全国高新技术产业中的领先地位。”

  “联盟成员在产业化方面积极探索和进取,不断推出具有自主知识产权的语音和语言技术产品,不但在国内打开了很大的市场,而且还开辟了很好的国外市场,为中文信息处理产业的国际化,摸索出一条有益的路线。我希望联盟的成员更积极参加科技创新活动,促进中文信息领域官、产、学、研、商之间的互动与合作,带动园区内相关企业,建立分工合理、利益共享的产业关系,形成精细的交易关系,进而推动产业聚集,形成规模产业,促进中文信息技术的标准化、产业化和国际化。”海淀区副区长于军冀望于联盟的产学研合作方式大力推进中文信息技术的发展。带着新的希望,2006年,联盟将在继续创建新的数据库资源的同时,吸收新会员并不断扩大影响;关注并力争为2008年奥运会作贡献;继续推动人机交互模式的革新。

   背景资料

  2004年3月,在清华大学、北京市海淀区政府、北京中关村高新技术企业协会的大力支持下,由得意音通公司联合清华大学、中国社会科学院、美国约翰·霍普金斯大学、日本ATR、香港中文大学、新加坡中文和东方语言处理学会等国内外重要的语音与语言研发机构,发起并成立了国际中文语言资源联盟(英文名称为Chinese Corpus Consortium,简称CCC,网址为http://www.CCCForum.org)。

  国际中文语言资源联盟是由中文语音和语言数据资源建设及其应用的全球科技机构和公司自愿组成、不以盈利为目的、公益性的学术联盟。联盟的宗旨是搜集整合现有中文语音和语言数据库以及创建新的语音及语言数据;整合现有的涉及中文语音和语言数据资源的创建、标注、分析工具,提高工具实用性,以及开发新的工具;搜集、整理和介绍有关中文语音和语言的规范和标准;促进中文语音和语言数据资源的交流与共享。清华大学智能技术与系统国家重点实验室的郑方教授被选为联盟首任理事长,由得意音通公司负责日常管理。

  联盟以促进标准和发展产业为己任,坚持“自主创新、重点跨越、支撑发展、引领未来”的方向,以“产学研”渠道建设促进产业发展。联盟目前有数十个会员,遍布全球,包括科研机构和企业。

(http://news.tsinghua.edu.cn)
[更新:2006-02-21]
[阅读:人次]
清华大学官方微信 清华大学官方微博 校报《新清华》微信 清华电视台微信
相关新闻
  • 网友评议