英特尔4亿美元收购深度学习公司,英伟达GPU遇最强挑战

时间:2016-08-15 15:20 | 来源:网络整理 | 点击:

核心提示:重磅 | 英特尔4亿美元收购深度学习公司,英伟达GPU遇最强挑战,英伟达,英特尔,英特尔深度学习,Nervana,Systems,4亿美元,,前天英特尔宣布收购深度学习初创公司,Ner

英特尔深度学习 Nervana Systems 4亿美元 前天英特尔宣布收购深度学习初创公司 Nervana Systems,交易金额据传约为 4.08 亿美元,Nervana 由原高通神经网络研发负责人于 2014 年创建,拥有目前最快的深度学习框架,并且预计于明年推出深度学习专用芯片,号称速度比 GPU 快10倍。

001.webp.jpg

本周二,英特尔宣布收购深度学习初创企业 Nervana Systems,标志着英特尔豪赌人工智能将成为企业数据中心的关键。

英特尔方面并没有公布此次收购的具体金额,但据消息人士透露应该在 4.08 亿美元左右(实际上,在10号上午外媒接到初次爆料时,金额为“至少 3.5 亿美元”,后来再次证实,成交价格应在 4 亿美元以上)。考虑到 Nervana Systems 只有 48 名员工,这一价格的确不菲。

英特尔副总裁 Jason Waxman 在接受 Recode 采访时表示,向人工智能转型可能会有损英特尔向云计算进军的努力。但 Waxman 也强调了机器学习的重要性,他表示在英特尔从一个用户控制大量连网设备到世界向一个数十亿件设备都相互连并相互对话的世界转型之际,机器学习非常重要。

Nervana Systems 一直在努力将机器学习功能全力引入到芯片之中,而不是简单地打造能够在GPU上运行的软件。

目前,Nervana 已经获得了 2500 万美元的融资,还在与美国情报界的风投部门有合作。公司 CEO 表示,本次收购并不代表 Nervana 公司在获取更多资本以维持独立方面面临障碍。“融资并不是问题,那是一个相对容易的事情。但是,通过将公司出售给英特尔,我们将能够利用到我们梦寐以求的技术。”

在数据中心业务方面,英特尔的运营也越来越为强劲。在错过了智能手机变革的市场机遇之后,英特尔开始大力投资物联网。

Waxman 说,“总会有下一个浪潮。我深信这不仅是下一个浪潮,而且还将是让上一波浪潮相形见绌的浪潮。”他还表示,企业计算已经从主架构向客户服务器转型,如今又在向云计算转型。

也就是说,Waxman 非常清楚,用户的注意力也开始捕捉下一波浪潮而变化。Waxman 承认,英特尔在人工智能和深度学习等业务方面仍表现不足,但目前这些业务正在改进。

Nervana 此番进行出售,也代表着这是第一家 Andy Rubin 旗下的硬件孵化器 Playground Global 的重要公司,这个硬件孵化器是 Nervana 的重要投资方。Nervana 的其他投资方还包括 Data Collective、DFJ、Lux Capital 和 Allen & Co.。

Nervana预计明年初推出深度学习专用芯片,速度比GPU快10倍

Nervana Systems 是 VentureBeat 2015 年评选出的“值得关注的 5 家深度学习初创公司”,其他 4 家分别是 Enlitic、Ersatz Labs、MetaMind、Skymind。

从 Nervana System 的Twitter,可以看出这家公司的定位:

002.webp.jpg

人工智能初创企业,拥有最快的深度学习框架 neon,提供首个结合机器智能软硬件云服务的 nervana Cloud。

Nervana 的 neon 采用 Python(部分 C++ 混编),Maxwell GPU 框架,卷积运算速度大约是 Caffe 等传统框架的两倍。Lisence 是 Apache 2.0。

003.webp.jpg

004.webp.jpg

005.webp.jpg

006.webp.jpg


从上图中可以看出,neon 单从速度上说,确实可以算“最快的深度学习框架”。

另外,Nervana Systems 也开放了它的深度学习云,使任何企业都可以建立一个可以学习的计算机模型,用户可以用它来创造智能机器人。

007.webp.jpg

至于 Nervana 的芯片,目前还没有详细的信息,大致框架如上图,基于张量的非常专用的处理器,没有其他处理器的繁复性能,非常专一。

根据 The Next Platform 报道,Rao 表示 Nervana Engine TSMC 28 纳米芯片,大约每秒 55 Tp——Maxwell Titan X 是每秒 6 Tp,Pacal 每秒 11 Tp。

此外,Nervana Engine 不做浮点运算,而是叫做“flexpoint”。Rao 表示,这是由于团队利用了神经网络的特点,不需要进行完整的浮点运算。简单说,这是一个基于张量的架构,不适合进行普通的乘法,但却能配合普通浮点运算芯片,让电路搭建得非常密集。

008.webp.jpg

Nervana 芯片的真正技术核心在于电路连接,当然这方面公司不愿透露。Rao 本人为 Sun 设计过 6 块芯片,这也是他和 Nervana 公司其他资深技术人员的实力所在。

Rao 将电路连接描述为模块化架构,从编程的角度而言,在两块芯片间对话和在同一个芯片里的不同单元对话是一样的。这个架构本身并不具有那么大的颠覆性,但Rao 表示这个架构能让团队搭建跟GPU完全不一样的软件堆栈。Rao 表示,“GPU在芯片上和芯片外的交流是完全不一样的,你必须记住存储接口,根据存储层级将东西,移来移去,这就使步骤变得复杂,增加延时,无法实现模块并行。”

Nervana 架构也是完全 non-coherent 的。没有缓存,所有的东西都由软件管理。从物理角度看,形成了告诉并联网络。传递信息时,能从一块芯片的SRAM直接到另一块芯片的SRAM。

发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
用户名: 验证码:点击我更换图片