• 元宇宙:本站分享元宇宙相关资讯,资讯仅代表作者观点与平台立场无关,仅供参考。小黑屋  |   app下载
  • 注册
  • 查看作者
    • 商汤攻略:一场人脸识别的AI革命(附视频)

      商汤攻略:一场人脸识别的AI革命(附视频)

      编者按

      12月10日,据外媒报道,美国财政部宣布,将商汤科技列入所谓的“中国军工复合体企业”清单,实施投资限制,也就是说禁止美国公民投资商汤科技。值得注意的是,这是继2019年,美方第二次对商汤科技实施打压措施。

      针对这一事件,商汤科技公开发布声明“表示强烈反对”。商汤科技在声明中表示,“我们认为该决定与相关指控毫无根据,反映了对我公司根本性的误解。科技发展不应该受到地缘政治的影响。”

      本期为零壹财经推出的中国AI领军企业成长史系列节目的第二集——商汤科技,视频分为上下两集。
      来源 | 零壹财经
      作者| 视频组
      刷脸意味着什么?如果你二十年前就可以刷脸办事买东西,那就能证明你很有面子。

      而如果你现在可以刷脸,那么只能证明你……有张脸而已。因为如今的人脸识别早已成为一种成熟的身份识别和认证方式。但在二十年前,人脸识别技术要么就在科幻片里,要么就还在实验室里!

      二十年前,在实验室里研究人脸识别的学者们还在为每一种识别算法的发明,为每一个特征点位的发现,为每一次0.01%的识别准确率提升而兴奋不已。其中,就有一位来自中国的年轻人,汤晓鸥。

      汤晓鸥你可能不认识,但你很可能已经用过他创办的公司研发的技术和产品,只是,你未必能感知到它们的存在。

      汤晓鸥创办的这家公司,是被美国列入实体清单的中国科技领军企业,是资本市场认可的独角兽,也是AI人脸识别领域的中国代表,正在通过短视频、安防、智慧城市等等场景,悄然融入我们的生活。

      涨知识,就来零壹财经视频号

      大家好,我是零壹君,欢迎来到我的频道。这里是零壹财经推出的中国AI领军企业成长史系列节目的第二集。我们今天的主角是,商汤科技。

      1990年,汤晓鸥从中科大毕业后,选择到美国深造,1991年,汤晓鸥取得罗切斯特大学硕士学位,1992年,他又到了麻省理工学院(MIT),研究计算机视觉(CV),并在5年后取得了博士学位。

      博士毕业后,汤晓鸥被邀请到香港中文大学信息工程系任教。

      他于2001年7月牵头成立了香港中文大学多媒体实验室,培养了大量的计算机视觉顶尖人才,这所实验室后来被称为中国计算机视觉领域的黄埔军校。

      此后的十多年里,汤晓鸥都稳稳地走在在学术探索的道路上,不曾偏离。但人不可能总待在象牙塔里,总会有人情俗事的牵绊。学术研究也不可能永远待在实验室里,总归要有面向实际应用的时候。汤晓鸥当然也不能免俗,他的人生轨迹和学术生涯都在悄然发生着变化。

      由于家在北京又在香港工作,于是只能在京港两地间来回奔波,在一定程度上弥补了对家庭的亏欠,但不能陪伴儿子的成长,始终是汤晓鸥最大的遗憾。

      他开始频繁地给儿子拍摄照片,相册几乎涵盖了孩子成长的每个瞬间,在想念儿子时拿出来翻看。

      直到照片积攒到成千上万张时,他意识到分类成了难题,想要在海量照片里快速找到某张照片就变得很困难。

      照片分类,在今天也许根本不是什么问题,许多手机都自带自动分类功能,按拍摄地点分类,按拍摄时间分类,按拍摄对象分类,甚至根据人脸特征自动进行人像照片的进一步分类。但在图像识别技术还不够发达的20年前,识别都不够精准,更不要谈自动分类了。

      对普通人来说,遇到这样的问题,最多就是在电脑上多建几个文件夹,或者照片打印出来装进不同的相册。但汤晓鸥并不满足于这样的解决方案。

      他召集几位学生开始研究名为“照片标签”(Photo Tagging)的课题,尝试采用计算机视觉技术手段来给相册进行分类整理。

      很难说这项研究是汤晓鸥有意识地进行应用探索,还是无心插柳之举,但正是这项研究,开启了汤晓鸥将人脸识别技术应用到实际生活的大门。并且,研究成果在多年后得到了商用,还取得了不错的成绩。

      除了启发汤晓鸥的照片标签研究,两地奔波还给汤晓鸥带来了另一个意想不到的收获。汤晓鸥接触到了北京的微软亚洲研究院,并且还兼任了微软亚洲研究院的视觉计算组组长。

      在微软亚洲研究院的这段时间里,汤晓鸥结识了后来的合伙人,商汤科技联合创始人杨帆,还遇到了他未来的竞争对手——旷视科技的创始人印奇,一个大二时来到微软亚洲研究院实习的学生!

      这并不让人感到意外,那些年,微软亚洲研究院可以说是中国计算机领域学者的精英荟萃之地,被称为中国IT产业发展史上绕不开的一所机构。而那个年代,能有机会被这家机构看中的学者,哪怕是实习生,又岂会是泛泛之辈?

      但到了2009年,汤晓鸥婉拒了微软的挽留,选择依托中国科学院深圳先进技术研究院搭建联合实验室。

      这一年的汤晓鸥也正式迈入了他学术生涯的巅峰,被电子电气工程师学会(IEEE)推选为会士。

      要知道,每年国内只有不到三十人能获此殊荣,可谓凤毛麟角。

      与此同时,港中大多媒体实验室的科研也进入集中收获期,自2011年起开始研究深度学习以来,实验室在计算机视觉领域两大顶级会议ICCV和CVPR上已发表了14篇论文,占据这两个会议上深度学习论文总数的近一半。

      如果这些成果只能证明汤晓鸥团队的学术能力,那么他们为香港警方完成的一个项目,则在一定程度上给了他们将科研成果向应用场景转化,实现产业化的信心:

      当时的交通监控摄像机远不如现在的先进,一些高速行驶的逃逸车辆,在监控录像中过于模糊,为警方追逃执法带来了困难。警方希望他们应用计算机视觉技术,帮助对比识别逃逸车辆的信息,并且愿意为服务买单。

      这个项目让团队获得成就感的同时,也让创业的种子悄悄萌芽。随着市场环境的不断变化和自身技术的不断提升,这颗种子也在不断积蓄能量。到了2014年,这颗种子终于到了发芽的时候。

      2014年人工智能领域突然大热,不断有初创企业获得融资,国际科技巨头也纷纷加入战局,除了自主研发,还大肆收购相关企业或技术。

      比如,谷歌甚至耗资4亿英镑收购了一家并没有具体的产品的公司,DeepMind。当然,事实证明谷歌这笔投资并不亏,这家公司在后来开发出了打败围棋世界冠军李世石的AlphaGo,成为全球领先的人工智能企业。

      资本的热捧,产业生态的逐步成熟,催生了一大批人工智能的创业者,其中也包括汤晓鸥。

      2014年3月,脸书对外发布了一项名为Deepface的人脸识别技术,其人脸识别准确率达到惊人的97.25%,已接近人眼识别能力。据报道,脸书用了400万人的数据,来训练模型。

      拿到400万人的数据,对社交巨头脸书来说并不困难,但对于没有相关产业背景的学术研究团队来说,就不是困难或不困难了,而是根本不现实。汤晓鸥团队用尽了几乎所有的资金和资源,才建立起2万人的数据库。

      一边是富可敌国的超级网络巨头,一边是仅有一百来人的高校实验室,无论是经济实力的保障,还是数据规模的支撑,怎么看都算不上同水平的竞争,也很难让外界将两者相提并论。

      但汤晓鸥却已经将脸书设为了自己的假想敌。因为这个时候,汤晓鸥的团队已经启动了一款人脸识别产品的研发,并且将开展商业化应用,届时将不可避免地与脸书发生正面较量。

      要知道,脸书这项技术是开源的,对客户而言有巨大的成本优势,并且有巨头背书,客户没道理放弃脸书而选择一个成本更高的新产品。

      汤晓鸥的底气,来自技术,更确切地说,来自算法优势。

      就在一个月后的4月,汤晓鸥团队就发布了“高斯面部”(GaussianFace)人脸识别算法,使计算机的人脸识别准确率第一次超越了人类。更准确地说,使用了“高斯脸”算法的计算机以98.52%的识别率首次击败了人眼97.52%的识别率。

      2014年6月起,汤晓鸥团队开始发表DeepID系列算法,据报道,该系列算法将人脸识别准确率提升至99.55%,开启了整个人脸识别行业技术落地的时代。

      在当时,汤晓鸥团队所领衔的港中大多媒体实验室与麻省理工、斯坦福等著名大学的研究机构一道,入选世界十大人工智能先锋实验室。

      人脸识别的高准确率不光为汤晓鸥团队带来了荣誉,也带来了慕名而来的投资人。

      IDG资本合伙人牛奎光认为,计算机视觉准确率超过人眼,这意味着这项技术将很快就能迎来商业化落地。于是飞到香港,拜访汤教授。

      在港中大多媒体实验室里,牛奎光看到五六个计算机识别技术的小样,研究方向有意识地与实际应用结合。

      而更让牛奎光兴奋的是,汤晓鸥团队对于技术的野心。当时,大部分人工智能企业的目标是在现有技术水平下进行更好地应用,而汤晓鸥团队的目标是实实在在地继续提升技术水平。

      当时,汤晓鸥团队的核心成员,也是后来的商汤科技CEO徐立打了个比方,如果说当下人工智能技术水平处于“猫脑”阶段,大部分公司正在做的就是“如何运用猫脑更完美地抓老鼠”;而他们要做的是把“猫脑”训练成“猴脑”,从本质上提升“大脑”的能力。大脑升级后,机器可以更快学习掌握更复杂技能。

      在这次拜访之后,IDG资本在2014年8月掷出数千万美元,助推汤晓鸥研究团队走出实验室,2014年10月,商汤科技正式成立。关于商汤科技的创业起点,市面上有几种说法,其中有一种说法是汤晓鸥是在IDG的游说下,才决定下海创业;还有一种说法是,汤晓鸥团队早有创业的想法,但并不急切,并且已经在实验室内部开展了了内部创业孵化,而IDG的出现让他们加快了创业的步伐。但不管是哪种说法,都很难否认,IDG的这笔天使投资,对商汤科技来说是意义非凡的。

      IDG的投资,也在一定程度上坚定了商汤坚持技术立身的决心。以至于商汤赋予自己“坚持原创,让AI引领人类进步”的企业使命。

      商汤科技有这样的技术雄心,底气来自于核心团队的技术实力,可谓“全明星阵容”,除了作为创始人董事长的汤晓鸥本人,还有:

      徐立,香港中文大学博士,联合创始人兼CEO;

      徐冰,香港中文大学博士,联合创始人兼副总裁;

      杨帆,清华大学硕士,联合创始人兼副总裁;

      徐持衡,本科毕业于清华大学,联合创始人兼CTO;

      林达华,麻省理工学院博士,联合创始人兼港中大-商汤联合实验室主任。

      凭借过硬的技术实力,配合恰当的市场推广策略,商汤科技取得了不错的经营成绩。

      商汤科技成立伊始,就拿下了小米、华为、美图秀秀等客户。

      2015年8月小米推出操作系统MIUI7,其中发布的宝宝相册,正是联手商汤科技共同打造的新卖点。

      宝宝相册中采用的人脸识别技术,主要在于三个核心算法:一是检测图库中的同一张脸,二是识别这张脸的特征,三是聚集相同的脸孔。

      想当年,汤晓鸥还为儿子照片的分类整理而头痛,安排学生开展了照片标签的研究,而宝宝相册也实现了汤晓鸥在多年前的夙愿。

      2015年中国移动全面实行实名认证,主要通过身份证字符识别(OCR识别),以及人脸识别两大技术实现。

      在中国移动的两项公开招标中,商汤科技最终在数十家竞标公司中胜出。后来,商汤科技与中移在线开展战略合作,对外提供包括身份验证类服务、门禁系统、人脸比对抓逃等多款产品和解决方案。

      2014至2016年之间,商汤科技主要着手两件事情:

      一是“人才垄断”,徐立找来这个领域所有能找到的顶尖科学家,垄断了150多位深度学习方向的博士;

      二是搭建硬件计算平台,从英伟达买入6000多块GPU,自建超算中心。

      深度学习有三大核心要素:一是深度学习的算法设计;二是高性能的计算平台;三是大数据。

      其中,大数据对于这个时候已经服务人群达亿级以上的商汤来说,并不困难,商汤的原创算法也得到了国际上的认可,所以关键就在于计算平台。

      汤晓鸥认为,由于谷歌、脸书等巨头的开源,使得人工智能、深度学习的门槛变得很低。

      很多技术人员利用谷歌、脸书的开源系统来训练模型,做应用。

      但是,使用开源系统有许多的限制,还要受到开源系统的控制。

      所以商汤自建超算中心,研发深度学习平台,砸钱自己搭建底层框架。

      商汤科技官方资料显示,该算力中心占地面积近80亩,总投资金额超过50亿元人民币,一期将安置5000个等效8000W的机柜。算力中心建成并投入使用后,总算力规模将超过3700P FLOPS,可同时接入850万路视频,1天即可完成23600年时长的视频处理工作。

      2015年11月,商汤科技深度学习框架“感知鹦鹉”(SenseParrots)也已成功搭建,并且做出了当时谷歌技术团队无法实现的功能。

      依托于强大的深度学习平台和超算中心,商汤研发了一系列AI技术,包括人脸识别、图像识别、视频分析等。

      技术在智慧城市、智能手机、汽车、金融、教育、医疗等多个行业得到应用。

      在基础研究方面,商汤先后与香港中文大学、清华大学、北京大学、上海交通大学建立联合实验室或开展科研合作。

      此外,商汤还在继续拓展AI的边界。近期,在科技部第三批科技冬奥专项支持下,商汤科技的AI技术亮相冬奥测试赛,通过利用视觉AI感知、深度学习、三维建模和空间定位等技术,在比赛场内对运动的冰壶实现检测跟踪和轨迹捕捉,通过实时渲染、虚实同步技术将冰壶轨迹在大屏上进行精准还原,为体育赛事打造更佳的视觉体验。

      在行业落地方向上,商汤目前专注于安防监控、金融、手机、移动互联网和深度学习芯片五大垂直领域。

      商汤与各行业领军企业合作,共同推进人脸识别在各行业的应用和变现。

      商汤是目前国内最大的互联网视频及直播平台供应商,服务90%以上的直播和短视频分享平台。

      例如,商汤基于人脸关键点检测跟踪技术,为抖音、新浪微博等实现脸部特效、美颜、手势识别等功能。

      金融也是商汤最早涉足的领域,商汤科技以领先的证卡OCR识别、人证比对等技术,服务对象包括银联、京东金融、招商银行以及互联网金融平台等机构,服务人群超4亿。其中,互联网金融公司融360曾与商汤合作推出了名为天机的风控系统,从用户身份认证、还款意愿和还款能力三个大维度,进行信用评分,再根据分值向放贷机构提出放款建议。此外,商汤合作的互联网金融平台还包括借贷宝。

      几年来,商汤发布了多个产品:比如,智慧城市、平安城市解决方案“感知面部”(SenseFace3.0)和“感知车间”(SenseFoundry),以及智能汽车产品驾驶员监控系统“感知驾驶”(SenseDrive DMS)等。

      其中,感知面部SenseFace3.0平台支持千路以上的监控系统进行长达数月的热数据实时轨迹还原,感知车间SenseFoundry则是城市级超大规模分布式视频分析平台。

      感知驾驶SenseDrive DMS是商汤科技发布的首款智能汽车产品驾驶员监控系统。

      通过深度学习技术与芯片优化技术结合,实现对疲劳驾驶等驾驶员状态的实时智能检测与提醒。

      目前在上海各区的上百条“驿动班车”线路中,已有38条线路车辆完成了智能化改造,搭载商汤科技“智能车舱”后,即可实现对司机的“保驾护航”。

      商汤表示,依托智能安防、金融、手机移动互联网三大板块,公司已经实现全年整体盈利。

      尽管如此,诸如超算中心的运营,仍然是个烧钱的买卖。

      商汤的研究员曾做过估算,一次数据训练迭代整体花费至少50万元。

      2021年上半年,商汤科技的毛利率达到73%,但同时经调整后净亏损达到7.3亿。在三年半烧完200多亿人民币之后,亏损仍然是商汤科技的常态。

      进一步融资也不容懈怠。

      2016年,商汤开启B轮融资,IDG继续跟投,鼎晖和万达加入,融资总计1.2亿美元。

      2017年年末,商汤科技连续公布三笔战略融资,投资方包括高通、阿里巴巴等机构,其中阿里投资15亿人民币,并在第二年4月领投6亿美元的C轮融资,商汤科技估值达到30亿美元。

      2018年,商汤科技再获6.2亿美元C+轮融资,投资方超过10家机构。

      此时商汤科技的估值已经超过45亿美元,继续拉大与身后AI公司的差距。

      就在形势一片大好,商汤准备“出海”之际,创业至今最大的挑战也不期而至。

      2019年10月,美国商务部将8家中国科技企业列入制裁名单,未经美国政府许可,禁止与美国企业开展业务往来。

      这8家受制裁的公司就包括专注AI的商汤科技。

      木秀于林风必摧之,堆高于岸流必湍之。美国的所谓制裁,也从侧面印证了商汤等中国科技企业的技术实力。

      但技术不代表市场竞争力,商汤的商业化之路依然崎岖艰难。即便是商汤引以为傲的智能安防领域,相比竞争对手海康威视和旷视,商汤都并没有明显的市场优势。

      “将AI技术赋能百业”是商汤的发展理念。与同属于“AI四小龙”的其他几家公司相比,商汤确实没有特别鲜明的行业标签,从某个角度来看,这是平台化的特点。

      高通全球副总裁沈劲曾表示,像商汤这样的巨头,将会成为并且正在成为一个人工智能平台级的公司,成为行业“发电厂”一般的存在。

      但商汤已经是巨头了吗?并且正在成为平台级公司了吗?作为商汤的投资方,高通当然有理由为商汤摇旗呐喊。但外界仍有疑虑。

      有人说,商汤号称赋能百业,其实意思就是一个行业都切不进去,你都无法定义商汤属于哪个行业,这或许也是商汤至今没有实现盈利的一个重要原因。客观来看,目前的商汤还算不上成功,更谈不上平台级企业,但既然选择了赋能百业,就注定面广难精,这是平台型企业的必由之路。

      但要打造一个平台级企业,除了技术之外,更重要的是基础设施建设和生态建设。从公开信息来看,商汤已经具备了一定的技术积累,并且正在建设超算中心等基础设施,那么只要能有足够的资金支持来完善生态,那么打造一个真正的平台并非没有可能。

      就在前不久的12月7日,商汤科技在港交所正式启动招股,预计募资56.55亿港元(折合人民币约46.19亿元),并于17日正式挂牌上市。

      这对于商汤来说无疑是一个天大的好消息,这意味着,前期投资人有了退出渠道,而商汤也有了更加稳定的融资渠道。

      也许,有了钱的商汤,就能烧出一个平台,烧出一个未来。

      好了,今天就到这里,接下来,我们将继续盘点中国AI领军企业。关注我,了解数字科技,读懂数字经济。


      参考资料:
      《商汤科技的四年发展历程》 作者:创业家
      《多面商汤,双面徐立》 作者:蓝鲸财经
      《人工智能简史》 作者:汤晓鸥
      《商汤科技一路走来》 作者:电子发烧友

      End.
      商汤攻略:一场人脸识别的AI革命(附视频)

      来个“分享、点赞、在看”
    • 0
    • 0
    • 0
    • 35
    • 请登录之后再进行评论

      登录

      赞助商

      广告位
    • 招募优质内容创作者!

      创作者推荐

    • 漫云科技
    • Forever
      Forever
      元宇宙Pro官方人员
    • 元宇宙Pro小助手
      元宇宙Pro小助手
      官方小助手
    • 元宇宙Pro
      元宇宙Pro
      元宇宙Pro官方
    • 发布
    • 任务
    • 单栏布局 侧栏位置: