网络巨擘们在近日于美国硅谷举行的年度开放运算高峰会(Open Compute Summit 2018)上呼吁在连网、储存与软件等技术领域的大幅改革,才能让他们不被大数据潮流所淹没。

Facebook表示,该公司在三年内就需要配备光学接口的交换器ASIC,以支持下一次网络大升级;微软(Microsoft)则宣布为NAND闪存硬盘开发了一种低阶接口,以更妥善利用储存。此外开放运算计划(Open Compute Project,OCP)与Linux基金会建立了策略联盟,目标是解决整合方面的问题,并让系统与软件能一起测试。

有趣的是,很少有人谈到关于机器学习的采用,这是让资料量大爆发的最新推力;而安全性则是日益受到关注的话题,去年发表的信任根(root-of-trust)模块有越来越多支持者,同时有更广泛的安全技术开发项目刚刚起步。

OCP赞助、在2011年由Facebook发起的Open Compute Summit今年是第九届,有超过3,000人报名参加;现在OCP拥有175家厂商会员,订定了375项与数据中心开放性硬件相关的规格。近几年OCP吸引了Google,还有中国的阿里巴巴、腾讯,以及电信业者如AT&T、Verizon加入,但供货商们却表示,那些网络巨擘对技术之需求并不一致。

确实,就算是OCP最具影响力的成员──如Facebook与微软──在高峰会上也表达了在服务器与交换器设计方面的不同偏好;而全球最大数据中心营运商亚马逊(Amazon),则继续默默地走自己的路。

Facebook呼吁将光学接口导入交换器ASIC

有一位Facebook工程师表示,因为网络流量需求淹没了来自第三方供货商的设备,他们去年不得不以缆线把机架等级(rack-scale)交换器绑在一起。

为了跟上流量,Facebook将部份数据中心的范围从一栋或两栋建筑,扩展到六栋建筑物;要把数据中心连结在一起,需要的交换器数量,会是高阶产品512个100-Gbit/second端口的三倍。Facebook项目经理Sree Sankar表示:“我们已经采用市面上最大的交换器,但没有其他我们可以买得到的方案。”

Sankar的团队将几十台Wedge 100交换器堆栈在一个机架里,用一个背板的缆线以及配线板(patch panels)把它们绑在一起;最后成果是名为Fabric Aggregator的100 Tbit/s交换器(参考文章上方大图),在5个月内从概念到实现量产,有四种配置,都执行该公司的FBOSS连网软件。

而为了要在约两年后迈进下一代400G接口,Facebook呼吁直接在商用交换器ASIC上导入光学接口;这会是非常大幅度且在技术上有困难的跃进,芯片供货商认为还需要几年时间。在最近举行的年度光纤通讯大会(OFC 2018)上,由Microsoft数据中心专家率领的一个产业团体COBO发表了朝该方向跨出半步的第一版规格,也就是将光学接口导入主板模块。

但Sankar表示,上述的COBO提案恐怕不适合Facebook所有机顶式交换器对400G连结的需求;她担心采用400G技术时,工程师们无法为个别ASIC与光学模块散热。

在这方面,网通技术专家Andy Bechtolsheim (编按:Sun Microsystems共同创办人)也呼应了Facebook的看法,认为需要为400G网络开发将ASIC与光学组件以封装技术整合在一起的方案;他认为这种设计能将功耗降低30%。

Bechtolsheim的提案是利用2.5D芯片堆栈,让交换器ASIC以及光学模块在硅中介层上并排;他指出,打造一种接口的技术与商业挑战,就在于低功耗,以及够可靠、能在繁重的处理任务中存活。此外这种新设计也会重新定义网通供应链的各厂商角色。

Bechtolsheim建议以2.5D芯片堆栈结合交换器ASIC芯片与光学组件,图为美国业者Luxtera的研发(来源:OCP)

“这会是一个需要多年时间的计划,别期望很快发生,但让我们现在就着手进行;”Bechtolsheim也呼吁工程师们在400G的多来源协议(multi-source agreements,MSA)上团结一致,以催生新一代的可插拔光学模块。

英特尔(Intel)曾表示将于今年稍晚开始提供基于CWDM8 MSA的400G模块,传输距离可达10公里;有数家供货商预期会推出400G可插拔模块,估计至2019年会有50万埠的出货量。

SSD接口新规格与硬件信任根

微软在大会上宣布Denali项目(Project Denali),旨在打造一种pBLK接口规格;这种接口让网络业者能控制固态硬盘(SSD)上的CPU、SoC与FPGA功能,包括垃圾收集(garbage collection)、耗损平均(wear leveling),还有应用程序在何处执行、如何加速等等。

该项目基本上是一种妥协,不那么极端要求开发无韧体SSD;在Denali项目下,SSD供货商可以使用控制器来验证与管理多媒体及电源故障。包括博通(Broadcom)、英特尔、Marvell、美光(Micron)、三星(Samsung)与海力士(SK Hynix)都对这种新接口表达支持,美国硅谷业者Cnex Labs开发的一款TB等级M.2固态硬盘就采用了该种接口。

虽然网络巨擘们采用的闪存芯片量、仅占整体出货的六分之一,这些公司仍在SSD的采购上花费了数十亿美元,所以微软云端硬件部门总经理Kushagra Vaid表示:“我们要推动效率,不过我们不会透露利用闪存可达到的性能表现;”他指出该接口也可以用于新兴的储存级内存。

Vaid表示,采用新接口的硬盘将会在今年投入量产,而他也欢迎来自各方对新规格的回馈意见;Facebook、Google与东芝(Toshiba)预期也终会支持该项目。对此担任OCP董事会成员的Bechtolsheim表示,传统标准组织可能会需要几年的时间才能达成共识,但他希望可以在几个月内让Denali规格定案。

Denali项目能让网络营运商透过嵌入加速器的方法来加快固态硬盘的运作速度(来源:OCP)

此外Vaid还提供了Cerberus项目(Project Cerberus)的新进展,即一种以MCU为基础的信任根;该非关CPU与操作系统的方案,获得了博通、Cavum、英特尔、恩智浦(NXP)、Mellanox与高通(Qualcomm)的支持。

在大约三个星期前,OCP展开了一项范围更广的安全计划,由Google与微软共同主导,但相关细节公布不多;该计划的目标是因应整个供应链以及所有数据中心产品在生命周期中面临的所有安全威胁。

开放软件重量级结盟

着眼于暴增的开放源码软件开发案,Linux基金会与OCP建立了伙伴关系,将在自动化与测试开放性系统加载的软件,以及探索新项目方面进行合作。

Linux基金会连网部门总经理Arpit Joshipura 表示:“我们必须要提供涵盖硬件与软件的测试,像是OPNFV;”该基金会正在开发网络虚拟化的开放源码,而因为在开放性连网软件领域有越来越多竞争项目,使得互操作性议题备受关注。举例来说,AT&T提供的dNOS程序代码、Google为最近宣布的Stratum项目提供的程序代码,还有Facebook自家的FBOSS等等。

Linux基金会与OCP将在连网软件的测试上进行合作(来源:OCP)

在Linux基金会也有超过20个与连网相关的开放源码开发案正进行中,该基金会最近将触角伸向物联网装置、储存与区块链(blockchain)应用的软件领域。与OCP的合作是否能透过认证程序强化软件互操作性,还有待观察;此合作的动机目前看来是基于营运商在提供服务之前,对满载网络系统之测试需求。

Open Compute Summit 2018上的其他重要讯息,还包括Facebook展示了采用8颗Nvidia Volta芯片的Big Basin GPU服务器,耗电量为2.5kW;该公司的一位工程师表示,他们尝试在系统相对闲置时,利用庞大的CPU资源来训练其众多神经网络模型。

编译:Judith Cheng

本文授权编译自EE Times,版权所有,谢绝转载

相关文章