本文系网易智能工作室(公众号smartman163)出品,此篇为ai英雄人物第37期。
文 | 小羿
iphone x的推出,不仅引爆了手机行业全面屏 人脸解锁的革新浪潮,也加速了图像识别尤其是人脸识别技术在各行各业的应用落地。
而这些应用浪潮背后,隐藏着多家计算机视觉技术公司,旷视科技是其中最显眼的一家。
旷视科技成立于2011年,是国内最早一批成立的计算机视觉技术创业公司。支付宝刷脸登录以及刷脸取款而被大众熟知,而face 开放云平台成为其明星产品。
近日,网易智能采访了旷视科技首席科学家孙剑博士,与他聊了聊计算机视觉技术的发展以及给行业带来的不断的变革。
作为计算机视觉领域的年轻大牛,孙剑拥有40余项国际或美国专利,曾是微软亚研院首席研究员,主要研究方向是计算摄影学、人脸识别和基于深度学习的图像理解。
不断丰富开放平台,助推手机厂商普及人脸解锁
最初的face 云平台主要是给企业客户提供相应的人脸识别九游会官网登录入口网页的解决方案,但随着人脸识别等视觉技术的应用越来越多,场景越来越丰富,face 云平台升级为face 人工智能开放平台。升级后的开放平台以api或sdk的形式为开发者提供人脸识别、文字识别、图像识别、物体识别、场景识别及其他人工智能能力。
据孙剑介绍,face 人工智能开放平台提供的人脸识别应用技术已经趋于成熟,包括人脸检测、比对、搜索、属性、情绪识别、颜值评分、肤质检测等。除此之外,这个平台还上线了人体识别、文字识别以及通用图像识别,包括银行卡、驾照在内的图像都能得以实现。据悉,加入旷视一年多以来,孙剑领导旷视研究院主要研究图像分类、物体检测、语义分割和序列学习四个视觉理解核心问题。
除此之外,旷视科技针对多个热门行业推出了face id在线身份验证服务,包括金融、出行、直播,甚至是目前手机人脸识别的应用。
据悉,在三星和苹果手机引入人脸解锁之后,国内厂商也快速跟进,其中小米和vivo两家厂商在手机上使用的人脸识别技术就是由旷视科技提供的。
vivo最新手机x20支持人脸解锁技术
不过,与苹果iphone x使用3d传感器和红外传感器不同,小米和vivo用的是普通的rgb前置摄像头来进行解锁,用户甚至通过软件升级就可以使用。孙剑坦言,iphone x的人脸识别方案确实比rgb的方案要好,可以在黑暗中解锁,而且安全性更高,但缺点是iphone x的方案成本太高,产能上有很大的不确定性,目前还很难在手机中普及。
iphone x人脸解锁演示
据孙剑透露,截止目前,旷视的face 人工智能开放平台已经有大约10万注册开发者,被调用60多亿次。身份认证平台去年为2.1亿多人提供了刷脸服务。孙剑称,旷视科技的face 开放平台,更侧重于底层设计,运行速度快而且足够简洁,让开发者能够非常容易的修改或者添加定制化功能,帮助开发者节省时间,提高效率。
人脸识别不安全?取决于你的接纳程度
iphone x推出以后,大众一方面对于人脸识别的加速普及热情高涨,一方面又为这一技术的安全性感到担忧,认为人脸识别不够安全,很容易泄露隐私,一时间各种人脸识别被破解的段子散播网络。
孙剑认为,任何技术没有绝对地安全,就手机产品来说,指纹识别也有不安全的地方。“这个取决于安全和应用性之间的平衡,”孙剑说,我们目前的人脸识别,在一定的应用环境中时候安全的,而并不是说所有的情况。
“这其实也取决于人们的接纳程度,指纹识别刚出来的时候,很多人也担心其不安全性,但后来人们还是慢慢接纳了这个应用。”孙剑解释到,“像人脸取款,有些银行已经开展了这个业务,但是有些银行还没有开展,也就是说人脸识别在各行各业的应用是伴随着人们逐步接纳的一个过程,并不是一蹴而就的。”
其实,目前的人脸识别技术距离成熟还有一段距离,比如说在人脸感知方面还有待提升等等。在孙剑看来,接下来的人脸识别需要从以下两方面取得突破:
一方面是硬件上的突破,要努力研发人脸识别新的传感器,它们不仅能够在光下感知,而且还能用深度摄像头和红外感知,这就突破了光照的影响。
另一方面是软件的突破,当你有一个巨大的数据库的时候,就可以不断的把性能提高。比如在非正常光照、侧脸/局部脸的数据上多做数据训练等等。
打造自有ai引擎,研发自有ai芯片
除了软件方面的开放平台、验证服务、九游会官网登录入口网页的解决方案之外,旷视科技还在秘密的开发者自己的硬件产品。
针对于目前很多企业开始做ai芯片的事情,孙剑在采访中透露,旷视科技也正在开发自由的fpga芯片,它是一种可编程的芯片,可以将自家的神经网络算法放上去。“是否会做定制芯片,取决于这个应用的量是否能达到百万级。”孙剑补充到。
另外,旷视科技还开发了一款fpga智能相机,叫做megeye-c3s。据孙剑介绍,这是一款智能人像抓拍机,1080p全画幅,可以做到每秒30帧抓取。
据悉,旷视科技还自建了一个深度学习框架,孙剑称,这个框架内部叫brain ,除了深度学习核心训练引擎之外,还有数据流入、gpu管理、模型发布等整套流水线过程,“brain 是我们做计算机视觉的核心发动机。”孙剑说。
孙剑认为,对技术公司来说,行业的泡沫还没有来到。他的理由是,市场上80%的变革其实用的是现有的技术,一些新兴公司向利用ai等新技术会推翻传统公司,但是除了技术创新之外,还有很多其他方面需要跟进。