检测到您的浏览器版本过低,可能导致某些功能无法正常使用,建议升级您的浏览器,或使用推荐浏览器 Google Chrome 、Edge、Firefox 。 X
近期,英特尔公司在高速数据传输集成光子学技术领域取得了革命性的里程碑式成就。在2024年光纤通信大会(OFC)上,英特尔集成光子学解决方案(IPS)小组展示了业内最先进的、首个与英特尔CPU共同封装并运行实时数据的完全集成光学计算互连(OCI)芯粒。英特尔的OCI芯片组在新兴的人工智能基础设施中实现了光输入/输出(I/O)的协同封装,为数据中心和高性能计算(HPC)应用带来了高带宽互连的飞跃。
英特尔集成光学解决方案团队产品管理与战略高级总监托马斯·利尔杰伯格表示,“服务器之间的数据传输不断增加,这正在消耗当今数据中心的基础设施能力,目前的解决方案正迅速接近电子输入/输出性能的实际极限。然而,英特尔的开创性成就使客户能够将共同封装的硅光子互连解决方案无缝集成到下一代计算系统中。OCI芯片可提高带宽、降低功耗并扩大覆盖范围,从而加速机器学习工作负载,有望彻底改变高性能AI基础设施”。
功能:首款OCI芯粒旨在支持64个通道,每个通道的数据传输速度为32Gbps,最长可达100米,有望满足人工智能基础设施对更高带宽、更低功耗和更远传输距离的日益增长的需求。它支持CPU/GPU集群连接和新型计算架构的未来可扩展性,包括相干存储器扩展和资源分解。
重要性:基于人工智能的应用在全球范围内得到越来越多的部署,大型语言模型(LLM)和生成式人工智能的最新发展正在加速这一趋势。更大、更高效的机器学习(ML)模型将在满足人工智能加速工作负载的新需求方面发挥关键作用。未来人工智能计算平台需要扩展,这推动I/O带宽呈指数级增长,并需要更长的传输距离,以支持更大的处理单元(CPU/GPU/IPU)集群和架构,并提高资源利用率,例如xPU分解和内存池。
电气I/O(即铜线连接)支持高带宽密度和低功耗,但只能提供约一米或更短的传输距离。数据中心和早期人工智能集群中使用的可插拔光收发器模块可以增加传输距离,但成本过高且功耗过大,无法满足人工智能工作负载的扩展需求。共同封装的xPU光学I/O解决方案能够支持更高的带宽,同时提高能效、降低延迟并延长传输距离——这正是AI/ML基础设施扩展所需要的。
例如,在CPU和GPU中用光I/O取代电I/O来传输数据,就像从使用运货能力有限、运货距离有限的马车,转变为使用运货能力更强、运货距离更远的汽车和卡车。英特尔OCI芯片等光学I/O解决方案为AI扩展带来的性能提升和能源成本降低正是如此。
英特尔OCI(光学计算互连)芯粒
图片来源:英特尔官网
工作原理:完全集成的OCI芯片利用英特尔经过现场验证的硅光子技术,将硅光子集成电路(PIC)与电子集成电路集成在一起,其中包括片上激光器(on-chip lasers)和光放大器(optical amplifiers)。在OFC上展示的OCI芯片与英特尔CPU共同封装,但也可以与下一代CPU、GPU、IPU和其他片上系统(SoCs)集成。
首次实现的OCI支持高达每秒4Tbps的双向数据传输,与外设组件互连高速(PCIe)Gen5兼容。现场光链路演示展示了两个CPU平台之间通过单模光纤(SMF)跳线连接的发射器(Tx)和接收器(Rx)。CPU生成并测量光比特误码率(BER),演示展示了单根光纤上8个波长、200千兆赫(GHz)间隔的Tx光谱,以及32Gbps Tx眼图,表明信号质量良好。
目前的小芯片支持每个方向64个32Gbps数据通道,传输距离可达100米(但由于飞行时间延迟,实际应用可能仅限于几十米),使用八对光纤,每对光纤承载八个密集波分复用(DWDM)波长。这种共同封装的解决方案还非常节能,每比特仅消耗5皮焦耳(pJ),而可插拔光收发器模块的功耗约为每比特15皮焦耳。这种超高的能效对于数据中心和高性能计算环境至关重要,有助于解决人工智能不可持续的电力需求。
英特尔在硅光子学领域的领导地位:作为硅光子学的市场领导者,英特尔利用了英特尔实验室超过25年的内部研究,该实验室率先开创了集成光子学。英特尔是第一家开发和向主要云服务提供商批量交付具有行业领先可靠性的硅光子学连接产品的公司。
英特尔的主要优势在于其无与伦比的集成度,它利用混合激光晶圆技术和直接集成技术,从而实现更高的可靠性和更低的成本。这种独特的方法使英特尔能够提供卓越的性能,同时保持效率。英特尔强大的高容量平台已出货超过800万片PIC,其中集成的片上激光器超过3200万,激光器及时故障率(FIT)低于0.1,这是衡量可靠性的常用指标,代表故障率和故障发生次数。
这些PIC被封装在可插拔收发器模块中,部署在大型数据中心网络中,用于100、200和400Gbps应用。单通道200G的下一代PIC正在开发中,将支持新兴的800Gbps和1.6Tbps应用。
英特尔还在实施新的硅光子晶圆厂工艺节点,该工艺节点具有最先进的器件性能、更高的密度、更好的耦合以及大幅提高的经济性。英特尔继续在片上激光器和半导体光放大器(SOA)性能、成本(晶圆面积减少40%以上)和功率(减少15%以上)方面取得进步。
下一步计划:英特尔的OCI芯片代表了高速数据传输领域的重大突破。当前的OCI芯片是原型。英特尔正在与部分客户合作,将OCI与他们的SoCs共同封装,作为光学I/O解决方案。
参考文献:
[1]Intel Demonstrates First Fully Integrated Optical I/O Chiplet[EB/OL].(2024-06-26)[2024-08-05]. https://www.intel.com/content/www/us/en/newsroom/news/intel-unveils-first-integrated-optical-io-chiplet.html#gs.bl
[2]Intel: First Fully Integrated Optical I/O Chiplet[EB/OL].(2024-07-26)[2024-08-05]. https://www.elektroniknet.de/international/intel-first-fully-integrated-optical-i-o-chiplet.219237.html
[3]英特尔推出光学计算互连芯粒,提高带宽降低功耗[EB/OL].(2024-06-27)[2024-08-05]. https://news.sciencenet.cn/htmlnews/2024/6/525326.shtm