百度成绩单 “各项成绩均优”背后令人深思的一面
【报道】7月4日消息,百度创始人李彦宏此前曾说:“今天大家见到的一切新的人工智能系统应用都只是冰山一角”。今日一年一度的百度AI开发者大会正式在京拉开帷幕,会上百度带我们领略了这座冰山更多的细节之处。
说到本届大会内容之前,还是要先提一下陆奇卸任一事。自陆奇卸任后,李彦宏迅速对发出了内部信,对公司内部组织架构进行了调整。而百度王海峰晋升为百度公司高级副总裁并继续担任AI技术平台体系(AIG)总负责人、同时智能生活事业群组(SLG)总经理一职交由,被陆奇称为是最优秀的产品经理之一的景鲲担任。
在这一年中,百度组织架构有过大刀阔斧的改革(成立智能生活事业群组),人员方面也有着巨大变动,但在一年的风雨前行中,百度还是拿到了一份令人满意的成绩单。
1.“阿波龙”百辆正式下线
在去年百度世界大会上,李彦宏提过的“7月阿波龙量产计划”仍让人记忆犹新,转眼时间到了2018年7月,阿波龙自然是调不开的话题。
先来看一下这一年中“阿波龙”的几个重要时间节点,驶入五环这事就不多提了。今年3月‘阿波龙’在平潭测试基地考下了‘平潭0001试’牌照,意味着无人车已具备了开放路段行驶资格。
拿到牌照后的百度,在4月份时首次将搭载了Apollo自动驾驶解决方案的“阿波龙”商用L4级无人驾驶巴士面向向公众试乘,初期落地场景还是选择了最后一公里上的通勤,百度当时透露阿波龙今年将在景区、机场等场景下投入使用。
在大会现场,李彦宏上台后第一个提到的话题就是阿波龙,他表示:“在过去一年里,被问到最多的问题还是无人车量产一事,但我坚持这个说法,依然锁定在2018年的7月。”
在当时李彦宏提出这一目标被很多人认为是句“大话”,毕竟无人驾驶在当时对于市场亦或是百度而言,都是一个“新物种”。李彦宏也说,创新总是有很多风险与不确定性,犹如一个新系统上线,经常有延期现象发生。但当时的那句大话,今日得到了实现,全球首款L4级别自动驾驶汽车已经量产,阿波龙”百辆正式下线。
百辆下线,不仅是百度从0到1的一次华丽转身,更是自动驾驶行业一个里程碑式的节点。下一步,“阿波龙”即将发往北京、雄安、福建平潭、广州、深圳、碧桂园、日本东京等地开展商业化运营。
2.全功能的云端AI芯片“昆仑”
芯片对于想要实现AI时代弯道超车的百度而言,可谓颇具战略地位。无论是获取、计算亦或是存储海量数据都绕不开这个硬件载体。所以百度此次发布“昆仑”芯片,既是意料之外又在情理之中。
要知道此前百度就已成立了专门的部门加强芯片和传感器的研究,并在FPGA和GPU方面都进行了大规模部署,同时在3月底的时百度曾推出过一款智慧芯片,这个芯片和模组可放到任何硬件当中。
“昆仑”分为训练型“昆仑818-300”、推理型“昆仑818-100”两款,采用14nm三星工艺生产,内存带宽可达512GB/s,运算性能高达260Tops,跟原来用FPGA做的芯片相比,计算能力提升了30倍左右,而功耗仅有100+瓦特。
与此前发布的智慧芯片不同之处在于,“昆仑”覆盖了数据中心、公有云和无人车测试研发等全场景,包括了对于常见的开源深度学习算法之外的,大规模语音识别、搜索排序、自然语言处理、自动驾驶、大规模推荐等具体场景的通用性适配。
3.百度大脑3.0——多模态深度语义理解新特性
再看一下百度大脑方面,2016年9月这颗“大脑”正式推出,这颗大脑中包含基础层、感知层、认知层、平台层等在内的完整技术布局,并以开放平台的形式对外输出AI核心能力,此前数据显示百度大脑日调用次数达到了2188亿次,而现今这一数量达到了4000亿次,开放能力多达110余个。
百度高级副总裁、AI平台体系(AIG)总负责人王海峰博士在现场介绍了百度大脑3.0版本中的多模态深度语义理解新特性。基于这一新特性,百度大脑能够对文字、声音、图片、视频等多模态的数据和信息进行深层次多维度的语义理解。
举例来说当用户说出“听XXX的歌,声音小一点”时,百度大脑能够同时对不同纬度的语义进行处理与理解。亦或是在视频方面的应用,通过结构化语义知识的提炼,百度大脑既能够识别无人超市中的消费者行为,又能够找到你想要看到的视频画面,同时形成精彩片段集锦及各种数据统计分析。
此次随着“昆仑”芯片的发布,百度大脑也将芯片纳入技术体系,配合PaddlePaddle、AI Studio、AutoDL、EasyDL等平台能力,提供软硬一体化的开发能力,降低企业接入AI方面的门槛。
4.DuerOS 3.0新一代操作系统成型
另一方面要做AI时代Android的DuerOS,在去年几乎同一时间发布了DuerOS 1.0版本,短短4个月后DuerOS 2.0面世。而这一次DuerOS 3.0的升级耗时了8个月之久,但却给开发者带来了很多意想不到的惊喜。
核心能力方面,DuerOS 3.0在自然语言交互技术上进行了全面升级,提供语音播报、声纹识别、儿童模式、极客模式、智能引导与纠错、视觉搜索能力、视频理解能力。这其中儿童模式与极客模式在不久前小度智能音箱发布时就备受关注,现今这两种模式也将面向业界进行开放。
此次DuerOS 3.0还推出了更多场景下的解决方案,如有屏设备解决方案、蓝牙设备解决方案和行业解决方案。智能生活事业群组(SLG)总经理景鲲在现场展示了一块只有名片大小的模组方案,通过这个模组方案就可以将合作伙伴的屏幕设备打造成一个可以对话的有屏设备。
另一方面,为了提升开发者在自家平台上的粘性,DuerOS 3.0率先打通了商业模式闭环生态,百度AI平台也成为了诸多开放平台当中首个“有收益”的平台。未来开发者可通过技能内付费、付费技能、亿元开发者支持计划、DuerOS对话技能大赛四种方式从DuerOS获取收益。现场景鲲宣布,在前6个月将会把技能收入毫无保留的回馈给开发者。
5.Apollo 3.0 一切只为量产
阿波龙落地,离不开背后Apollo平台给到的支持,回看上一次的百度对外分享的数据,Apollo在今年4月19日过完了“一周岁”生日,当天百度正式对外推出了解锁高速场景的Apollo 2.5版本(长沙智能驾驶研究院已实现场景下的应用)。
今日Apollo再一次迎来了自己的又一次版本迭代,智能驾驶事业群组总经理李震宇表示,Apollo在开放的第一天就确定了发展的理念,用16个字来形容就是开放能力、共享资源、加速创新、持续共赢。
(李彦宏、张亚勤、李震宇与合作伙伴共同见证Apollo3.0发布)
Apollo 3.0的关键词是面向量产,更加开放。在Apollo3.0中,百度升级了两大平台,发布四大量产方案。其一是Apollo 3.0将原来的车辆参考平台升级为车辆认证平台。同时自家过去踩过的坑,总结为17类指标,并通过Apollo车辆验证平台的方式开放出来,车企以及开发者都可以参考这些指标选择适合自己的自动驾驶车辆。
其二是原有的硬件参考平台升级为硬件开发平台,同时发布传感器单元,这个传感器单元能够支持更多数量及不同类型的接口,目前已经接入了15家合作伙伴的硬件,给予开发者更多解决方案的选择。
目前,Apollo生态体系的最新“成绩单”显示,生态中已汇聚了全球116个合作伙伴,GitHub上的开放代码数量达到220000+行。
成绩单背后值得深思的一面
今日在百度对外展示“各项成绩均优”的成绩单背后,现场出现了这样一个插曲。一个来自西藏林芝的团队,利用百度EasyDL图像定制化识别技术开发出了一套可识别寄生虫虫卵的系统。
众所周知当地的医疗条件并不比内陆,团队通过指导,利用百度开放的AI技术训练出了这套系统。现今该系统已能识别出十余种寄生虫卵,准确度稳定在97%以上,其中几种已经在小范围临床应用当中。
其实这种带有公益性质的案例在国外很常见,谷歌的框架也好,英特尔的GPU也罢,一些国外公益组织常会利用这些巨头提供的开放技术或硬件,来进行公益事业的开展,如利用AI实现濒危动物的追踪、违法砍伐的监测、甚至是闻声识鸟进而提供保护等,而在国内,这种案例却少之又少。
回到人工智能这个赛道来看,此次国内想要实现的是全面反超,这里不仅包括了技术上的反超,更是一次社会责任的反超。而这时就需要百度这类的巨头挺身而出,在将技术打磨至业界领先的同时,一方面实现商业化落地,一方面将目光锁定到公益事业当中。而这一次随着芯片硬件的发布,百度完成了软硬一体的布局,至于未来会给公益提供怎样的一份助力,还是值得我们期许的。