张连毅

“让人机对话更轻松自然”

来源:北京晚报 2012-12-2 邵泽慧

  张连毅外表清瘦,带着一副眼镜,很像一位大学老师。清华大学环境工程专业毕业的他,却没有从事环保行业,而是迷恋上了人机智能交互领域(简称HCI)。在美国学习工作了六年后,张连毅回到中关村创业,成立了捷通华声语音技术有限公司。“让机器听懂人话并能说人话”已经成为眼下移动互联网领域一个非常有前景的行业,比如苹果推出的Siri。就在不久前,捷通华声发布了全球第一个人机交互感知云——灵云。张连毅说,它的作用就是,“让人与机器的交流像人与人沟通一样的简单自然。”

小唐龙不是Siri的中国版

  身着红色唐装,忽闪着蓝色的大眼睛,手机屏幕上跳出一个小唐龙。“您好,我能帮您做点什么?”小唐龙问记者。“今天天气如何?”“零下8到5摄氏度,偏北风三到四级。”“我想听周杰伦的歌。”“周杰伦的歌有好多,您想听哪首?《青花瓷》可以吗?”记者又接连问了好几个问题,小唐龙都应答如流。在捷通华声的产品演示现场,记者体验了一把人机对话。而小唐龙的本领还不止如此,除了能陪你娱乐聊天外,它还有导航的功能,如果你不想用手机看新闻,它还能给你播报出来。

  和苹果Siri严肃的女声不同,小唐龙操着一口童稚的声音和你说话,感觉就像邻家可爱的小朋友。这是不久前国内一家企业推出的第一个“能说会听、能写能识”的智能手机助手,而其依托的技术支撑平台就是捷通华声的“灵云”。小唐龙既不是Siri的中国版,也不是中国版的Siri,它的功能更加丰富有趣。   

生活中到处都有“灵云”

  小唐龙只是灵云技术的一个体现。灵云究竟是什么?张连毅说:“灵云可用语音、手写、拍照,手势,将来甚至可使用脑波识别等智能手段来操作、计算机等数字设备。”

  给记者的感觉张连毅是一位十分低调的企业家,因此捷通华声也很低调,在同一领域中不如汉王、科大讯飞等知名,但实际上捷通华声所拥有的自主知识产权的中文语音合成、语音识别技术在国内语音交互技术市场占有率达到50%以上,手写识别、扫描识别技术达到35%的市场占有率,而且它已与数千家企业合作,将HCI应用到各行各业中,包括政府、教育、金融、电信、能源、交通、医疗等。市民在日常生活中其实都在享受着灵云的服务。

 比如,上海世博会广播系统的语音技术,80%是由捷通华声提供支持。全国的高铁所有站台的信息播报系统,也都是采用灵云的语音合成技术。当市民去医院就诊时,耳边就会传来“请某某到第三诊室”声音,灵云可以准确地叫出每位患者的名字,有序与有效的安排,方便了患者,也让护士分诊的压力得到了缓解。

从触控时代到感知时代

  取得如此成就的背后是创业的艰辛。作为一家民营企业,张连毅坦言很难得到政策与资金的支持,他也曾经几次想到过转型,想要放弃。2010年,由于掌握了中文语音合成和识别的核心技术,总部位于美国的一家世界级语音技术公司找上门来,希望收购捷通华声,张连毅当时同意了,当真正要卖时他又犹豫了,一是放心不下员工们,二是HCI这个技术实在让他难以割舍,最终他拒绝了。

  张连毅回顾了一下计算机互联网的发展阶段,第一阶段是键盘阶段,代表企业IBM,键盘成为人们操作计算机的代表性的交互手段。第二阶段是鼠标时代,微软让鼠标成了普通大众使用电脑的最主要设备。第三阶段是触控时代,代表企业苹果把大众带到了移动互联网时代。

  而第四阶段,在张连毅看来就是“感知时代”。“一个更自然、更人性化的人机交互系统将成为未来发展的主流。让人机交互像人与人沟通一样的简单自然。在任何时间、任何地点都能够感受到轻松便捷。”张连毅说。

 

2012年12月03日 16:37:11  清华新闻网

更多 ›图说清华

最新更新