原标题:国际首款云端人工智能芯片发布
云端智能芯片是面向人工智能范畴大规模数据中心和效劳器提供的中心芯片。5月3日,中国迷信院发布国际首款云端人工智能芯片,实际峰值速度达每秒128万亿次定点运算,到达世界先进程度,将普遍使用于智能手机、智能音箱、智能摄像头、智能驾驶等不同范畴
智能芯片是前沿科技和社会关注的热点,也是人工智能技术开展进程中不可跨越的关键环节。可以说,不管有怎样抢先的算法,要想最终使用,都必需经过芯片完成。
5月3日,全球新一代人工智能芯片发布会在上海召开,中科院旗下的寒武纪科技公司发布了我国自主研发的Cambricon MLU100云端智能芯片和板卡产品、寒武纪1M终端智能处置器IP产品。这款国际首个云端人工智能芯片,实际峰值速度达每秒128万亿次定点运算,到达世界先进程度。
智能芯片完成新打破
作为此次发布会焦点,初次正式亮相的Cambricon MLU100云端智能芯片,是我国首款云端AI芯片。
据中科院计算所研讨员、寒武纪公司开创人兼CEO陈天石引见,云端智能芯片是面向人工智能范畴大规模数据中心和效劳器提供的中心芯片。云端的智能芯片规模更大,构造愈加复杂,它和终端芯片的最大区别就在于其运算才能更强。
MLU100云端智能芯片采用寒武纪最新的MLUv01架构和TSMC 16nm的先进工艺,可任务在均衡形式(1GHz主频)和高功能形式(1.3GHz主频)下,均衡形式下的等效实际峰值速度达每秒128万亿次定点运算,高功能形式下的等效实际峰值速度更可达每秒166.4万亿次定点运算,但典型板级功耗仅为80瓦,峰值功耗不超越110瓦。
“3年来,我们从研发两颗测试芯片,不断到如今云端智能芯片的最终亮相,我们时辰预备着‘由端入云’。”陈天石说,MLU100基于软硬件协同提升内存带宽应用率,不论是从功能比,还是功耗比来说,寒武纪都将树立智能芯片范畴的新标杆。
与寒武纪系列终端处置器一样,MLU100云端芯片依然延续了寒武纪产品一向出色的通用性,可支持千万量级用户的大规模商用检验,搭载各类深度学习和经典机器学习算法,充沛满足视觉、语音、自然言语处置、经典数据发掘等范畴复杂场景下(如大数据量、多义务、多模态、低延时、高通量)的云端智能处置需求。
此外,这次最新发布的寒武纪1M处置器是公司的第三代IP产品,它延续了前两代产品(寒武纪1H/1A)杰出的齐备性,单个处置器核即可支持多样化深度学习模型,并更进一步支持经典机器学习算法和本地训练,为视觉、语音、自然言语处置以及各类经典的机器学习义务提供了灵敏高效的计算平台,将普遍使用于智能手机、智能音箱、智能摄像头、智能驾驶等不同范畴。
“由端入云”协同开展
寒武纪科技公司脱胎于中科院计算所,于2016年发布了全球首款商用深度学习公用处置器寒武纪1A处置器。它的横空出生打破了多项纪录,并当选了第三届世界互联网大会评选的十五项“世界互联网抢先科技效果”。目前,寒武纪处置器也已使用于某知名国产手机早先发布的旗舰机型,完成了集成使用。
近年来,人工智能产业迅猛开展,推进了芯片市场规模的疾速增长,也推进了人工智能计算从终端向云端的延伸。陈天石表示,寒武纪在技术上贯彻“端云协作”的理念,这次发布的MLU100云端芯片,不只可独立完成各种复杂的云端智能义务,更可以与寒武纪1A/1H/1M系列终端处置器完满适配,让终端和云端在一致的智能生态根底上协同完成复杂的智能处置义务。
陈天石指出,端侧智能处置可以最疾速呼应用户需求,以十分低小的功耗、本钱和延迟,协助用户了解图像、视频、语音和文本。同时,云侧的智能处置则可以把多个端的信息会聚在一同。由于终端的数据量无限,只能依据单个用户的数据对机器学习模型停止微调。因而,端云协同的智能处置形式将在数据方面发扬宏大优势,应用海量数据,训练出弱小的人工智能模型。
“过来大局部芯片厂商都主攻端,例如芯片巨头ARM公司,或是主攻云,例如英特尔公司。两者统筹的却很少,由于端云的义务生态区别较大。但是智能时代这个场面会被片面打破。由于端和云的义务是一体的,编程和运用的生态也是分歧的。作为一个通用机器学习芯片厂商,寒武纪就是要端云结合,共同推进智能芯片生态的开展。”陈天石说。
#p#分页标题#e#中科院上海分院副院长、中科院院士张旭表示,从过来在手机等终端上使用的智能芯片,到明天更高一层的云端人工智能芯片,它可以使人们在手机等终端的使用上升为将来在云端等范畴愈加宽广的使用,所以这是一个开辟性的打破。
以后,众多科技公司纷繁加大对人工智能芯片的研发,包括智能手机、无人驾驶、云计算等各范畴巨头。依据相关机构预测,到2021年,人工智能芯片市场规模将超越110亿美元,而2016年这一数字仅为36亿美元。
“寒武纪创建的初衷就是要让全世界都能用上智能处置器。”陈天石通知记者,寒武纪将秉承学术界开放、协作的肉体,以处置器IP受权的方式与全世界同行共享寒武纪最新的技术效果,使全球客户可以疾速设计和消费具有人工智能处置才能的芯片产品。
共建人工智能生态链
发布会上,寒武纪局部产业同伴地下展现了基于寒武纪芯片的使用方案。联想集团初级副总裁童夫尧在发布会上推出了基于寒武纪MLU100智能处置卡的ThinkSystem SR650,打破了37项效劳器基准测试的世界纪录。
“在新产品上,我们搭载了寒武纪的芯片,有助于各行各业在人工智能、VR、高功能计算等方面的研发和行业处理方案的落地。”童夫尧说。
不只如此,芯片效果还将运用于智能语音范畴。“一小时的语音数据在一个传统处置器上停止智能使用处置,需求一万小时才干完成,科大讯飞不断在跟踪人工高端智能装备、新一代信对于互联网金融P2P企业来说,支付市场完善的标准和管理系统将彻底改变互联网金融行业的格局,不仅给从业者提供了的巨大的发展机遇,也带来了全新的挑战。息技术、新能源、新材料、新制造、新零售、新技术、生物制药等新的产业集群正在迸发活力;创新驱动、科技支撑、知识产权转化、技术转移等新的动能正在超越旧的动力,新经济成为支撑经济发展的重要力量。智能公用芯片的前沿停顿。”上海讯飞总裁程引见,寒武纪的智能处置器在语音智能处置上交出了优良的答卷,能耗效带领先竞争对手的云端GPU方案达5倍以上。它的弱小处置才能使得手机本地端可以处置愈加复杂的机器学习算法,使得语音本地辨认精确率绝对于传统处置器抢先了9.8%,明显进步了用户体验。
中科曙光初级副总裁任京在发布会上同步推出了基于Cambricon MLU100智能处置卡的效劳器产品系列“PHANERON”,它的功能更为微弱,可以支持210块寒武纪MLU处置卡,灵敏应对不同的智能使用负载。以晋级版的PHANERON-10为例,单台效劳器可集成10片寒武纪人工智能处置单元,为人工智能训练使用提供832T半精度浮点运算才能,为推理使用提供1.66P整数运算才能,典型场景下的能效提升30倍以上。
“下一步,曙光与寒武纪之间的协作将不只仅局限于零件范畴,会从顶端科研不断延伸到低端使用,合力打造下游使用产业,共建人工智能生态链。”任京泄漏,中科曙光还将发布人工智能管理平台SothisAI,与寒武纪的芯片及开发环境完成无缝对接和深度交融。
(责编:赵超、毕磊)