印奇:85后极客创造“刷脸”时代

来源:文汇报 2015-5-29

  不久以后,我们上网购物结算只要对着摄像头“刷脸”;在人脸识别的基础上,每个人都将拥有互联网时代的新账号体系,以帮助我们解决身份识别的问题。那时候想“证明你妈是你妈”、“你是你”这样看似荒谬的问题,也会轻而易举。

  从人脸识别到图像识别,乃至“所见即所得”的机器之眼,是毕业于清华大学的3位85后极客——印奇、唐文斌和杨沐努力想要实现的场景。2011年,他们在清华园里创立Megvii,至今一直专注于图像识别和深度学习领域。印奇告诉记者,“每个极客都有一个‘科技改变世界’的梦想。更幸运的是我们追梦的方向恰好赶上了一个很大的风口。”

三位清华学霸联手创业

  在清华大学培养计算机技术精英的姚期智实验班,印奇、唐文斌和杨沐是三个标准的“极客”。唐文斌从初中起就参加信息学编程比赛,先后多次获得ACM、CodeJam等各类编程比赛冠军,并担任国家信息学竞赛总教练7年之久。杨沐比印奇和唐文斌低一级,也曾斩获国际信息编程奥林匹克比赛金牌。三人各有所长,唐文斌专攻图像搜索,印奇擅于视觉识别,杨沐则以数据挖掘见长。从大二开始,印奇就在微软亚洲研究院实习,参与人脸识别引擎的研发。“那时候,我对人脸识别技术就很着迷,毕业后还全职工作了一年,参与研发的引擎后来被应用在X-box和Bing等微软产品中。”印奇回忆道,“那时候我就确定,要在这个领域做点啥。”

  2011年,一部iphone,让唐文斌和印奇走上创造之旅。iphone有前置摄像头,凭借两个人在视觉技术方面的积累,唐文斌在宿舍里约上印奇一起研发出名为《乌鸦来了》(CrowsComing)的体感游戏——玩家通过摇晃头部控制游戏里的稻草人,拦截从天而降偷食庄稼的乌鸦。这款小游戏一度冲上AppStore排行榜的前5名,还获得了清华大学第三十届“挑战杯”特等奖。

  彼时,联想之星投资负责人关注到了印奇的团队,“一个听上去很传统的领域,随着移动设备、云端计算能力的普及和识别算法的大突破,开始真正进入了临爆点。过不了几年,人脸登录、人脸搜索都将成为现实,届时人脸将是最自然、信息量最大的入口。有着广阔的应用场景。”这让印奇激动无比,投资者的到来,使他更加认定视觉识别技术必将迎来爆发。

数据!除了数据还是数据!

  2011年10月,旷视科技正式成立。

  印奇为公司制定了明确的“三步走”发展策略,即先搭建Face++的人脸识别云服务平台,目标是识人;第二步则是Image++,识别万物;最后则是实现“所见即所得”的机器之眼。

  印奇解释说,从人脸识别入手,是因为这是目前被使用最广、也是最便捷的识别方式。“每个人的面部图像在国家权威数据库中都有相应的数据,是唯一可以被商业化运用的生物验证体系。”

  2012年,公司首款核心产品Face++1.0版本上线,并不断快速迭代。印奇将这打造为一个开放的平台,上万个开发者在整个平台上享受免费服务,并为平台提供200多万张图片。在不作商用的前提下,Face++借用这些图片及其标注信息进行算法学习,基于上述数据和技术的积累,在更加显性的层面,Face++也开始尝试一些应用的制作。

  如今,Face++平台图库数量超越10亿级,有1.5万个APP与其合作。平台上活跃的开发者超过2.4万人,阿里、美图、世纪佳缘等一批图片、社交类企业都与平台建立合作关系,这使Face++成为使用量很大的人脸识别引擎。

  印奇将人脸识别用到的深度算法,比喻为“婴儿智力的黑盒”,那是一套模拟人脑神经网络的算法。这套算法对于计算平台的底层架构要求很高。在这项技术上,Google、Facebook、百度等互联网巨头水平很接近。而出奇制胜的法宝,就在于海量的数据以及优化算法。

  让印奇印象最深的是,李开复一直特别强调数据循环的重要性,“如果有两个客户,一个客户可以给你一年100万元资金,还有一个可以给你一年贡献1000万的数据,一定要数据!”

  人脸识别大致可分为人脸检测、人脸关键点定位和人脸识别三个大项。2014年,Face++连续收获FDDB、300-W、LFW三项国际评测的冠军,尤其在互联网新闻图片的人脸识别评测中,以97.27%的准确率力压之前业内第一的Facebook人脸团队。

创业是个“看两端”的过程

  联系到印奇时,他正在杭州湖畔大学进修。“能让我来这的原因只有一个,就是马云。”在印奇看来,创业必须是一个“看两端”的过程。创业之初,必须有用技术改变世界的执着和使命感,才能刨除功利性的心理,好好做一个产品;但是,能让企业走得长远的,往往是“木桶理论”——最短的那块木板决定了木桶的容量。因此,在创业过程中,印奇从未放弃学习。

  创业之初,三位清华极客虽然精通云上核心算法,但机器识别包含云、端两部分,“端”这部分硬件技术,成了旷视科技的“短板”。“对图像识别而言,如果不能处理好前端的图像采集,即使核心算法再好,最终的效果也不会好。”为此,印奇前往哥伦比亚大学进修两年,师从Computational Camera的行业泰斗,专攻3D相机方向的博士学位。

  印奇执着地认为,一个最优质的创业团队,是保证创业成功最关键的因素。8成员工都以定向挖掘和内推的方式招募。这也是天使投资人看中旷视科技的原因之一,三位创始人的能力不言而喻。而整个Face++团队,有20名全职员工和20位来自清华的实习生相互协作,他们当中的6人斩获国际奥林匹克信息学金牌,1人获得过国际奥林匹克物理学金牌。

  让一群“聪明极了”的人一起工作,印奇自有管理的妙招——给员工更多自由的空间。只要目标明确,这群聪明人的自我驱动力都很强,何必管到头发丝呢?

加速产品化,实现滚雪球效应

  将人脸识别技术应用于更加广阔的领域,加快商业化步伐,是印奇最近思考的重点。目前,Face++的技术已经相对成熟,亟待进入商业化的阶段。

  目前,Megvii已经完成B轮4700万美金的融资后,旷视科技(Megvii)开始发力互联网市场以外的两个重要领域——“金融行业的人脸认证”与智能监控、智能家居应用。在金融领域,人脸识别核心问题是要解决线上面签,Face++与蚂蚁金服以及商业银行展开合作。印奇透露,Megvii的Face++平台单独为金融场景做出符合识别标准的Face++Financial解决方案。“这一动态人脸认证过程,可以规避来自图片或录像的攻击,在电脑或手机上的前置摄像头前,用户只要根据页面指令,做出一连串连续的简单动作,比如摇摇头、眨眨眼睛、动动嘴巴、微笑,数据被发送到云端后与公安部的备份照片进行匹配,匹配成功表示是本人开户,否则就拒绝开户。”

  智能迎宾系统是旷视科技系统集成的一套完整硬件产品,其核心逻辑是一套动态人脸识别系统。印奇说,“2015年,产品化进程我们已经走在前端。判断领域内能否发生本质性的变革和颠覆性的技术创新,也许像我们这样的初创公司更能实现弯道超车。”

 

2015年05月29日 14:28:19  清华新闻网

更多 ›图说清华

最新更新