首页> 媒体报道> 景驰CEO韩旭独家专访:2020年量产不是梦

景驰CEO韩旭独家专访:2020年量产不是梦

来源:本站 | 2018-03-20 10:51

韩旭,博士毕业于美国伊利诺伊大学香槟分校,师从美国和中国四院院士——计算机视觉权威Thomas Huang教授。博士毕业后加入美国密苏里大学任博士生导师、终身教授,并担任计算机视觉和机器学习实验室主任。

 

在校期间,韩旭领导的团队,参加了多项国际图像识别大赛,获得多次第一。他主持开发的DeepSpeech2 被MIT Tech Review评为2016十大技术突破之一,他曾担任百度自动驾驶首席科学家,现在是景驰科技的CEO和联合创始人。

 

景驰科技CEO、联合创始人 韩旭

 

古人常说,学而优则仕,从一个初出茅庐的青葱小子,到国际知名大学的终身教授,他已经完成了人生的蜕变。

 

但,缺乏挑战的人生,即使爬的再高也是无趣的。从博士毕业开始,韩旭就带领一个数人的小团队进行科研项目的研究,数年之后,他手下的人员规模,已经扩张到上百人。可是在他的内心里,装着更大的世界。

 

近日,韩旭接受了《高工智能汽车》的独家专访。

 

从视觉到语音,从学者到技术主管

 

韩旭的主要研究方向是计算机视觉与机器学习,在2013年的时候,他就带领团队在ImageNet物体检测大赛、人脸识别大赛中,取得了相当优异的成绩。

 

于他而言,参加世界级的大赛,不仅仅是证明实力的过程,同时作为世界范围内最早使用深度学习做视觉识别的那一批人,他以及他的团队成员,后来都成为了业内的佼佼者。

 

这番经历,带给韩旭的,既有对计算机视觉技术先进性和敏感性的理解,也有对该技术局限性的深层次认识。韩旭坦言,作为一名视觉识别领域的老兵,他深知视觉方案的优缺点。

 

计算机视觉有自己短时间内解决不了的难题:在一些场景下,物体识别与检测很不稳定,因此极大的限制了视觉方案的可靠性和使用场景的广度。现阶段无法解决这些难题,也因此,LIDAR+摄像头+毫米波雷达的自动驾驶方案,在公司创立伊始就定了下来。

 

2014年,韩旭从学者的身份转换到了高科技公司的项目带头人,他进入百度美研人工智能实验室,进行前端技术的探索研究。

 

由于初期没有视觉方面的项目,他就受命开发基于深度学习的端到端中文语音识别系统(DeepSpeech2)。对于韩旭而言,从视觉到语音识别,专业上是跨界,但越有挑战的事情越有魅力,他丝毫不担心。

 

语音识别跟图像识别,在技术原理上有相似之处,都是对参照物知识元素的提取,只是语音是连续的,它需要依托更多的语音模型和深度学习模型,比如语音的上下文环境。要让机器听懂人类的语言,首先是要能够清晰的识别语音,即语音转换成文字,其次是解析文字含义。

 

完成第一步需要的是多是技术上的处理,而完成后一步,则需要让机器理解语义:文字的意义不只是表面的意思。

 

诚如每一个汉字,在字典上的释义就有多种,不同的语境下,不同的说话语气,所表达的意思都千差万别。要让只识“0和1”的机器,明白同一个句子不同的意思,靠的就是上下文的环境,达到这一目标,背后所依赖的就是深度学习的力量。这个系统在单句上下文的情况下,实现了超过人类认知水平的识别率,并被MIT Tech Review评为2016十大技术突破之一。

 

没有GPS信号怎么办?

 

景驰的无人驾驶系统,是以LIDAR+视觉+毫米波的融合方案,系统在关键的地方有冗余的安全设置,比如供电、刹车、运算系统等等。常见的单颗64线LIDAR的方案,并不是唯一,还有其它的方案,只是出于商业机密的考虑,最新的技术方案不便示人。

 

  • 1
  • 2
  • 3
  • 北京联创永宣投资管理集团股份有限公司

    中国 北京 朝阳区宏泰东街绿地中心D座16层1601室 邮编:100102

    电话: 86-10-6528 8289 传真: 86-10-6528 0062 或扫描右侧二维码关注:联创资本 微信公众号