新闻资讯

行状器CPU领域握续多年的中枢数目大战,被一举驱逐了!
英特尔最新发布的至强® 6 性能核处理器(P-core系列),超过了当年单一维度的竞争,通过“升维”界说了新的游戏章程:
在当年,CPU升级换代时时要在单个芯片上集成更多的中枢,但这未免会受到工艺和芯片尺寸的截止,更别提与IO和内存的匹配封闭。
这一次,至强® 6 性能核处理器袭取了诡计芯片单位与I/O芯片单位解耦的分袂式模块化假想,不错天真组合不同数目的诡计单位,收尾中枢数目的扩张及内存和IO的同步强化,保证更优的举座性能和能效。
用最直不雅的样式感受一下:
2023年12月15日,英特尔数据中心与东谈主工智能集团副总裁陈葆立从裤兜里掏出第五代至强® 可扩张处理器,还唯有64个中枢。
2024年9月26日,如故陈葆立,相似从裤兜里掏出至强® 6 性能核处理器,却凯旋翻倍到128中枢。
两款处理器外形大小相似,都能松驰放进口袋,但性能却发生了质的飞跃。
具体来说,刚刚登场的是至强® 6性能核处理器大眷属中的时尚+顶级战力——英特尔® 至强® 6900P系列。
领有多达128个性能核和504MB的超大L3缓存,更大、更宽的内存撑握,更多、更快的IO本事。相配适用于各样数据和诡计密集型应用任务,比如科学诡计、海量数据处理,还有AI。
看到这里,可能许多东谈主会有疑问:你们又要说用CPU跑AI?是GPU它不香了么?
NoNoNo,咱们是思说:有了这款CPU,你的GPU或其他的AI加快器,会更香!
谈到这个话题,就要先说说AI行状器。
在生成式AI应用百花皆放确当下,AI行状器的进击性可谓是了然于目,不论是关于大界限的检修、推理,亦或是RAG等任务,都对其淡薄了更高的要求。
也正如概括阛阓瞻望数据从侧面反映出来的那般:
咱们都知谈AI行状器里GPU或AI加快器很进击,却很容易忽视其中CPU的作用。一个信得过为AI行状器或AI数据中心基础轨范假想的出色的CPU,应该是什么样的?
英特尔® 至强® 6 性能核处理器,不错说是给出了一个正解。
外媒甚而评测事后,对英特尔这次的新CPU赐与了极高的评价:
嗯,用中语来说的话,就是英特尔至强,这次是果然至强(达到最强)了。
那么英特尔® 至强® 6 性能核处理器是若何解锁这种招供的呢?
至强,缘何至强
开首要说的是算力。
英特尔® 至强® 6900P系列居品这次最亮眼的128核(三个诡计芯片单位),这就是它看似恰当此前游戏章程的一大本事亮点。
通过中枢数目的不同成列组合样式,至强® 6 性能核处理器不错卤莽不同的场景来提供不同中枢的型号,除了最高128核的居品系列(6900P)外,还有最高86核(2个诡计芯片单位),最高48核(1个诡计芯片单位)和16核(1个诡计芯片单位)的居品系列。
用来作念这种成列组合的模块中,诡计芯片单位袭取的是Intel 3制程,包含一形式网格、中枢、缓存、内存适度器等,不错保证数据传输的一致性。
I/O芯片单位则是袭取Intel 7制程,包含UPI、PCIe、CXL和加快器引擎等。
不同于第五代英特尔® 至强® 居品,至强® 6是将I/O和诡计两个单位进行了解耦,不仅易于作念核数的扩张,还成心于考据、重叠和天真使用。
除此除外,英特尔® 至强® 6 性能核处理器的亮点还包括:
6400 MT/s DDR5
8800 MT/s MRDIMM内存
6条UPI 2.0链路;速率高达24 GT/s
96条PCIe 5.0/ 64条 CXL 2.0通谈
L3缓存高达504MB
撑握FP16数据形式的英特尔® AMX
接下来要说的是存力。
至强® 6 性能核处理器洒脱此前游戏章程的亮点就藏在其中。
它同期撑握了更快的DDR5内存(6400MT/s)和更“宽”的MRDIMM内存(8800MT/s)。
仅把前者替换成后者,就依然能让科学诡计和AI场景的多项任务普及7%-33%不等了。而且比较此前至强® CPU Max袭取的HBM,MRDIMM内存的引入,不仅带宽和速率上风更昭彰,它与CPU解耦的型态,也更利于用户的天真采购、成立与升级。
存力除了内存自己的性能,还包含CPU与内存之间的互连本事,至强® 6导入了最新的Compute Express Link 2.0 (CXL 2.0) 。
CXL 2.0撑握多种确立类型,且可向后兼容,收尾对内存和存储确立的天真扩张。
撑握链路分叉、更强的CXL内存分层撑握,以及以受控热插拔的样式添加/移除确立,为畴昔的数据中心架构带来了更多可能性。
更值得一提的是至强® 6独占的“Flat”内存模式,CXL内存和DRAM内存被视为单一的内存层,让操作系统不错凯旋造访这一长入的内存地址空间。
这样的分层料理不错确保最大法例地普及内存使用效用,何况收尾哄骗好CXL内存扩张而无需修改软件。
如斯这般能对内存速率、带宽、容量和可扩张性全面兼顾,依然变成了至强® 6 性能核处理器独树一帜的竞争力。
具体到行状器假想上,CLX2.0不错撑握每机提供8TB内存容量扩张,同期提供384GB/s的内存带宽扩张。
天然,当作CPU的至强® 6 性能核处理器并莫得健无私方的本份,把存力与算力的硬方向上风聚合起来,滚动成信得过的上风,才是它被看好的底气。
在算力方面,除了更多内核,它还有内置加快器与领导集更新带来的加成。
主攻AI加快的英特尔® 高档矩阵扩张(Intel® AMX)新增对FP16数据类型的撑握,现已全面隐敝 int8、BF16和FP16数据类型。
其在每个内核中的矩阵乘加(MAC)运算速率可达 2048 FLOPS(int8)和1024 FLOPS(BF16/FP16),能大幅普及 AI 推理和检修性能。
英特尔® 高档矢量扩张 512(AVX-512)虽然是员宿将了,但在获得如斯丰沛的内核资源撑握后,也依然是科学诡计、数据库和 AI 任务中的矢量诡计担当。
这些加快器的升级与焕新带来的效果就是下图这种多负载性能剖析无边倍增的时事,在AI领域,尤其是在Llama2-7B上的普及凯旋达到了前一代居品的3.08倍。
终末在硬件增强的安全特点方面,英特尔早期的决议为SGX,但从第五代至强® 开动新增了TDX决议。这些看似难以通过Benchmark数值来剖析自身价值的本事,实则不可或缺,是确保要津数据和应用更为安全可靠的压舱石。
而安全,恰正是现在AI数据中心或智算中心这种触及海量数据、联系万千奥密和秘籍的环境中较少说起,却最应补足和沉稳的一环。
说了这样多,如若要用一句话回来至强® 6 性能核处理器,尤其是6900P系列居品的定位,那就是“更强通用诡计,兼顾AI加快”了。
那么新处理工具体都有哪些用法,剖析又若何呢?
还请连接往下看。
万能型CPU:加快AI推理,管辖异构诡计
开首,至强® 6 性能核处理器不错作念“独行侠”,凯旋加快AI推理,助力AI应用普及。
用CPU作念AI推理加快,其道理并非在于与GPU或其他专用加快器竞争极致的速率或效用,而是要在一些资本、采购、环境等条目受限的情况下,借助CPU部署更粗拙、东谈主才储备更塌实和应用更方便的上风,让AI大致更快、更有用地落地。
带着这样的举座方向,英特尔在软件生态和责任负载优化方面参加了无边元气心灵,以确保用户大致充分剖析至强® 6 性能核处理器的后劲。
举例,英特尔与TensorFlow和PyTorch等主流深度学习框架进行深度合作,将针对英特尔CPU的优化集成到官方刊行版中,从而使得在英特尔CPU上运行深度学习模子时,性能获得显耀普及。上文提到的Llama2-7B得益即是这些极力的效果之一。
另外,至强® 6 性能核处理器还不错作念“引导官”,强化AI系统举座实力。
这其实是许多用户更为熟谙,亦然至强® 6性能核处理器更主打的应用样式,所谓“引导官”,另一个称呼就是机头(head-node)CPU或主控CPU。
如若将至强® 6 性能核处理器用作AI行状器的机头CPU,那么其在算力(更强的单线程性能)、存力(对MRDIMM内存和CXL内存扩张本事的撑握)以及 I/O(更多的PCIe 5.0通谈)等方面的上风和潜能就能愈加充分地剖析和开释出来。
使其大致与GPU或专用的AI加快器高效相助,出色地处理数据预处理、数据传输共享和搀杂责任负载。
咱们率先的设问,至此终于免强出了一个更为完满的谜底,即为何至强® 6 性能核处理器大致被称作AI行状器或AI数据中心的“严选”,甚而是优选CPU ?
这正是由于它既大致一手一脚地加快AI推理,又不错居中调和以普及异构系统的举座性能输出。
更毋庸说,它还大致兼顾盛大传统但相似不可或缺的应用负载,举例前文说起的科学诡计和数据库,以及高性能云基础轨范构建等任务。
以Flatiron Institute的案例来说,当作一家科研机构,他们对科学诡计有着激烈的需求。通过测试得知,至强® 6 性能核处理器在常见科学诡计负载上剖析优异。
他们还以为对MRDIMM内存的撑握将进一步冲破传统DDR内存的性能瓶颈,激动数据密集型科学发现。
在本次至强® 6 性能核处理器的发布会上,英特尔也展示了腹地数据库软件合作伙伴——科蓝软件的效果。
英特尔阛阓营销集团副总裁、中国区&行业惩办决议和数据中心销售部总司理梁雅莉在先容生态系统撑握现象时默示:
值得一提的是,在她共享中出现的中国合作伙伴数目盛大且都是各领域的中枢力量,英特尔虽然在居品研发上有了更多改进,但在生意模式上仍然相配依赖通达架构平台之上的产业协力。
十数家OEM、ODM、OSV和ISV在至强® 6 性能核处理器发布时同步推出新址品,以及多家云行状提供商的撑握,在英特尔看来,才是新品信得过走近用户和价值放大的基础。
从前边列举的盛大数据和用例不错看出,在现时AI应用加快落地、新推理诡计范式和合成数据等趋势的激动下,AI算力需求越来越驻扎推理和复合责任负载。
在这之中GPU或专用加快器天然进击,但CPU当作总计系统的“引导官”,毫不成成为短板。
寰宇需要信得过兼顾通用诡计,以及AI行状器及AI数据中心场景的CPU居品。它不仅能撑握粗拙的第三方GPU及AI加快器,与它们组合变成广大的异构诡计平台,还能在其中补足GPU或专用加快器隐敝不到或不及的地点,为更各样和复杂的场景提供天果然算力采选,并增强总计AI平台的褂讪性、安全性和扩张性。
英特尔® 至强® 6 性能核处理器的出现,就为AI诡计带来了这样一个全新的支点。
(梦晨 金磊)
下一篇:没有了

