NewMargin-景驰CEO韩旭独家专访：2020年量产不是梦

韩旭，博士毕业于美国伊利诺伊大学香槟分校，师从美国和中国四院院士——计算机视觉权威Thomas Huang教授。博士毕业后加入美国密苏里大学任博士生导师、终身教授，并担任计算机视觉和机器学习实验室主任。

在校期间，韩旭领导的团队，参加了多项国际图像识别大赛，获得多次第一。他主持开发的DeepSpeech2 被MIT Tech Review评为2016十大技术突破之一，他曾担任百度自动驾驶首席科学家，现在是景驰科技的CEO和联合创始人。

景驰科技CEO、联合创始人韩旭

古人常说，学而优则仕，从一个初出茅庐的青葱小子，到国际知名大学的终身教授，他已经完成了人生的蜕变。

但，缺乏挑战的人生，即使爬的再高也是无趣的。从博士毕业开始，韩旭就带领一个数人的小团队进行科研项目的研究，数年之后，他手下的人员规模，已经扩张到上百人。可是在他的内心里，装着更大的世界。

近日，韩旭接受了《高工智能汽车》的独家专访。

从视觉到语音，从学者到技术主管

韩旭的主要研究方向是计算机视觉与机器学习，在2013年的时候，他就带领团队在ImageNet物体检测大赛、人脸识别大赛中，取得了相当优异的成绩。

于他而言，参加世界级的大赛，不仅仅是证明实力的过程，同时作为世界范围内最早使用深度学习做视觉识别的那一批人，他以及他的团队成员，后来都成为了业内的佼佼者。

这番经历，带给韩旭的，既有对计算机视觉技术先进性和敏感性的理解，也有对该技术局限性的深层次认识。韩旭坦言，作为一名视觉识别领域的老兵，他深知视觉方案的优缺点。

计算机视觉有自己短时间内解决不了的难题：在一些场景下，物体识别与检测很不稳定，因此极大的限制了视觉方案的可靠性和使用场景的广度。现阶段无法解决这些难题，也因此，LIDAR+摄像头+毫米波雷达的自动驾驶方案，在公司创立伊始就定了下来。

2014年，韩旭从学者的身份转换到了高科技公司的项目带头人，他进入百度美研人工智能实验室，进行前端技术的探索研究。

由于初期没有视觉方面的项目，他就受命开发基于深度学习的端到端中文语音识别系统（DeepSpeech2）。对于韩旭而言，从视觉到语音识别，专业上是跨界，但越有挑战的事情越有魅力，他丝毫不担心。

语音识别跟图像识别，在技术原理上有相似之处，都是对参照物知识元素的提取，只是语音是连续的，它需要依托更多的语音模型和深度学习模型，比如语音的上下文环境。要让机器听懂人类的语言，首先是要能够清晰的识别语音，即语音转换成文字，其次是解析文字含义。

完成第一步需要的是多是技术上的处理，而完成后一步，则需要让机器理解语义：文字的意义不只是表面的意思。

诚如每一个汉字，在字典上的释义就有多种，不同的语境下，不同的说话语气，所表达的意思都千差万别。要让只识“0和1”的机器，明白同一个句子不同的意思，靠的就是上下文的环境，达到这一目标，背后所依赖的就是深度学习的力量。这个系统在单句上下文的情况下，实现了超过人类认知水平的识别率，并被MIT Tech Review评为2016十大技术突破之一。

没有GPS信号怎么办？

景驰的无人驾驶系统，是以LIDAR+视觉+毫米波的融合方案，系统在关键的地方有冗余的安全设置，比如供电、刹车、运算系统等等。常见的单颗64线LIDAR的方案，并不是唯一，还有其它的方案，只是出于商业机密的考虑，最新的技术方案不便示人。

景驰CEO韩旭独家专访：2020年量产不是梦

相关链接