高通近日宣布与商汤科技达成合作,将加速终端侧人工智能的发展,并将于10月29日-11月1日在中国国际社会公共安全博览会进行双方合作首次展示。有媒体认为该合作是为加强AI算法以抗衡华为麒麟芯片,那么为高通加强AI算法的商汤科技又是一家怎样的公司呢?
曾被指神级创业包装
成立于2014年的商汤科技(Sense Time),在同年11月,便获得了IDG的数千万美元投资。商汤科技在官方微信上首度发言描述自己时,曾声称:
SenseTime,专注于计算机视觉和深度学习原创技术。SenseTime 通过研发多方面的顶尖视觉技术,富于计算机视觉感知和认知的能力,让计算机能像人与动物一样获取、分析、理解各种视觉信息,并与自然界进行交互。
2016年4月26日,商汤科技宣布获得了来自StarVC的数千万美元B轮融资。随后融资额更是一再水涨船高,今年七月,其更是宣布获得了4.1亿美元的人工智能领域最大额的融资。即便存在商业炒作过度包装的质疑,但很难想象倘若没有过硬的实力,资本仍旧源源不断地涌入。
以学术型为导向的公司?
此前对商汤科技的质疑,大多指向商汤科技的商业化不力,业界几乎无人质疑商汤科技的学术能力。商汤科技在接受采访时,也曾多次表示其采用“独立于现有平台,自主开发原创的深度学习框架”,这种独立开发的模式,也被认为是其核心竞争力。
商汤科技内部充斥着不少学术大牛。汤晓鸥、徐立、风辰(刘文志)等均有着不俗的实力。汤晓鸥是香港中文大学的信息工程系系主任,在2014年其团队发布GaussianFace人脸识别算法,在全球首次突破人脸识别能力。徐立更是师从Jiaya Jia,在毕设时便在做模糊图像恢复的研究。作为高性能计算领军人物的刘文志目前也服务于商汤科技。
检验其学术能力最好的方式莫过于在计算机视觉领域最高水平的国际学术会议ICCV大会发文的量和质。在本届ICCV大会中,商汤科技与香港中大-商汤科技联合实验室共发表了20篇论文,包括3篇Oral (录取率仅2.09%)和1篇Spotlight,领先于 Facebook(15篇)、Google Research(10篇)等科技巨头。
谈及商业化不力的问题,不得不提及时常被拿来作为比较的Face++(旷视)。在模板化的对比中,Face++商业化、商汤科技学术化的一面被展示出来。Face++此前因为在支付宝中落地人脸识别而广为人知,但商汤科技却总被认为在“刷分”,难以见到落地应用。
但现在,在官网展示的案例中,呈现了以京东钱包为代表的智慧金融、中国移动为代表的智慧商业、东方网力为代表的智慧安防、小米MIUI7相册分类为代表的互联网+,以及与英伟达、科大讯飞、有盾科技等实现的落地案例。商汤科技在与越来越多的厂商进行合作。可能会有人质疑商业合作背后的含金量,商汤科技盈利如何,但头部的示范性案例显然已经为其营造出了强大的商业吸引力。
秀肌肉的媒体见面会
即便商业化落地,仍旧会有人询问具体如何?在官网上,几乎所能想象到的一切跟计算机视觉相关的技术都被商汤科技罗列了出来。最引人注目的无疑是其深度学习框架,采用高性能异构式分布平台,支持深度学习模型与算法的定制扩展。但这些离普通人的生活尚远。
在7月份商汤科技完成4.1亿美金的融资后,8月份搜狐自媒体平台组织众多媒体参加了商汤科技的媒体开放日。在这次媒体见面会中或许可以了解这家公司究竟在做什么。
既然和计算机视觉打上交道,难免会牵涉到人脸识别。公司用人脸识别识别外来人员与员工,并进行考勤。
又或者展示用普通摄像头实现微软Kinect效果,让视频中的画像跟随视频前的人起舞。
但是更让人在意的或许是其视频结构化系统,分析路面人数、男女、美国车日本车等等。在这个离五道口地铁站500米的地方,其将摄像头对准那里,即便画面不是十分清晰,却仍然出现了大的结构化信息和比较精确的识别。
可以说与此前描述的不够商业化过于学术化形成了强烈的反差。这些DEMO每一项都已经是商业化的应用。商汤科技借这次机会成功地向媒体和大众展现了自身的实力。
写在最后
基于商汤科技在算法模型小型化上取得的技术进展,高通与商汤科技双方将致力于提升算法和芯片结合的速度和效能。此次合作不过是加速终端人工智能功能的发展。致于媒体联想而做出的抗衡华为AI芯片,时间将给出答案。