当前位置:首页 >> 中医新闻 >> 可省近90%服务器,PayPal打破「AI内存墙」的提案为何如此划算?

可省近90%服务器,PayPal打破「AI内存墙」的提案为何如此划算?

发布时间:2024-10-30

必须要把安放有目标历史书籍的整个书架上的书都背回家再来作9号,而缓存按个位寻址则大约并不并不需要得心应手定位目标历史书籍的左边并仅将其借出。

傲腾™ 长久缓存在打印一般来说中的的左边及发挥作用。

读物的暂存和搜索来作例证,来解读并不相同打印一般来说的特点。

资料长久性则补全了 DRAM 缓存的先天不足,只需在系统故障后即使如此能保留资料,这竟然基本上量的缓存资料源在推算数种系统再次出现计划内或计划皆系统故障时,恢复原资料及服务于的加速大大加快,毕竟中的间更少了从石墨盘或硬盘上将数百 GB,甚至是 TB 级资料读回缓存的耗时。

PayPal 的有系统,推论长久缓存很划算数!

光练不说傻把的设计,光说不练假把的设计,傲腾™ 长久缓存能无法鼓励用户创下 AI 缓存墙皆,我们还是要眼见为实。

以全球知名的网络支付服务于商 PayPal 为例。和其他金融类服务于行业一样,PayPal 也惨遭虚假的再一——即便在这方面的补救素质要高于业界的人均,每年巨大损失仍亦会大约 10 亿美元。因此 PayPal 对排皆虚假格皆上情,不但为此早早构建了不具备强大排皆虚假预防基本概念的高分辨率权衡种系统,为了高分辨率识别新再次出现的虚假模的设计,PayPal 还在不断强化这个种系统在处理事件和分析相关资料时的生产开销。

图源:PayPal Newsroom

对于本就履行着上百 PB 资料处理事件任务的 PayPal IT 基建来说,排皆虚假权衡游戏平台资料量的增加和资料处理事件和分析生产开销的大大更高可是一个雪上加霜的再一。虽然它从 2015 年就导入了 Aerospike 的资料源技术,将都由检索资料上交缓存来发挥发挥作用更为好的高分辨率性,但随着都由检索资料规模的不断扩大,路由中的的缓存发电量很较难耗尽,进而就亦会直接影响资料读写和处理事件的高分辨率性。此时,若要采购新路由又将节省高昂的开销。注意,这里的开销好比涵盖接口开销,还有随之而来的管理人员开销和浮点运算开销。

所以 PayPal 更为倾向于并不并不需要更高单位路由打印密度的提案。

中心等这些社亦会大众,PayPal 考虑了导入英特尔公司的傲腾™ 长久缓存,而这里也有另一个必需,就是 Aerospike 正好是这款创新接口发表后第一波支持它的资料源厂商之一。

借助 Aerospike 资料源的混合缓存虚拟化( HMA),PayPal 可将都由检索转存到傲腾™ 长久缓存中的,而非过去的 DRAM 中的。这么来作的好处非常轻微,因为傲腾™ 长久缓存的单条发电量远高于 DRAM,且每 GB 开销也不大略高于 DRAM,这就可以鼓励 PayPal 将每路由的总打印空间更高为原先的 4 倍(从 3.2 TB 到 12 TB),因此 PayPal 只需用到更为小的空降兵就可以考虑到经营范围所需的高效能,从而让服务于器存量下降将据统计 50%,每空降兵的开销增加将据统计 30% 。

将都由检索打印在傲腾™ 长久缓存中的还有一个额皆的好处,也就是我们前面提到的资料长久性。这使得 Aerospike 进行时检索修葺的短时间从 59 分钟缩短至 4 分钟,考虑到了 PayPal 对较长运行短时间和更为高准确性的允许。据悉,英特尔公司和 Aerospike 两者之间多年的合作还功绩了一系列更为深层次的建模,最都由要在傲腾™ 长久缓存中的打印更为多资料(不仅仅是检索)。

在引入傲腾™ 长久缓存加持的 Aerospike 高分辨率资料游戏平台后,PayPal 以其 2015 年的虚假资料量和年末用到的游戏平台为基准来作了一个评估,它断定新提案可以将其虚假推算数的服务于级别贸易协定 (SLA) 遵守部将从 98.5% 大大更高到 99.95%,漏查的虚假交易量降到将据统计为原先的 1/30。同时,与先前的基建相相比较,用到的服务于器总存量可以下降据统计 90%(从 1024 台下降到 120 台),相关的接口占用空间可减到将据统计为原先的 1/8,吞吐量可增至原先的 5 倍(峰值程序在量从 20 万大大更高到 100 万),接口开销下降为原先的将据统计 1/3( 预计接口开销从 1250 万美元省至 350 万美元)。

并不需要指出的是,实际上在 PayPal 的 IT 基建中的,傲腾™ 长久缓存并不是一个紧张状态的配件,与它紧密配合且内置了 AI 较快能力也(英特尔公司® 深度学习较快技术)的第二代英特尔公司® 至强® 可扩充处理事件器也是这一补救提案的灵魂所在。相信如果把它换成 AI 较快能力也以及缓存子种系统带窄和效能表现更为优的第三代英特尔公司® 至强® 可扩充处理事件器,这种创下缓存墙皆的优点将更为加轻微。

AlphaFold2 下端到下端生物信息学建模

值得一提的是,在 AI for Science 课题,至强® 可扩充处理事件器 + 傲腾™ 长久缓存的复合所造成了的突破缓存墙皆有系统也开始大放异彩。

以这几年大火的 AlphaFold2 为例。作为 AI for Science 课题的著名大基本概念,AlphaFold2 的落地重新部署在算数力和打印方面都陷入着雪上加霜的再一,这也给内置高位窄优势(AVX-512 等技术)的第三代英特尔公司® 至强® 可扩充处理事件器和大肚量的傲腾™ 长久缓存提供了尽情发挥的空间。

图源:www.exxactcorp.com

据英特尔公司相关技术医学专家透露的信息,他们准备英特尔公司这套推算数 + 打印的创新产品复合上建模 AlphaFold2。一方面,在基本概念解答阶段,他们通过对注意力模块化(attention unit)进行时大张量切分(tensor slicing),以及用到英特尔公司® oneAPI 进行时算数子融合等建模方法,大大更高了算数法的推算数生产开销和 CPU 透过部将,加快了适配解答加速,并缓解了算数法继续执行中的各个环节陷入的缓存瓶颈等疑虑。

另一方面,他们通过用到傲腾™ 长久缓存,为 AlphaFold 2 发挥发挥作用了 TB 级缓存的战略性级支持,轻松补救了多示例适配继续执行时缓存峰值叠加的缓存瓶颈。这个瓶颈有多大?据英特尔公司医学专家介绍:在输入总长度为 765aa 的条件下,64 个示例适配继续执行时,缓存发电量的需求就亦会突破 2TB。在这种情形下,对广大用户来说,用到傲腾™ 长久缓存是一个可行且可开销的提案。

除了傲腾™ 长久缓存,还有哪些提案可以创下缓存墙皆?

虽然傲腾™ 长久缓存的再次出现为一些应用场景提供了创下缓存墙皆的可行切线,但截至迄今,接口课题还不亦会再次出现一个「一招鲜吃遍天」的缓存墙皆补救提案,不过其他一些技术切线齐头并进的势头,还是让我们看到了补救这一疑虑的借此。讨论热度极低的补救提案最都由要在即将呈爆发的设计成长的共轭种系统中的发挥发挥作用统一和池化的缓存人力资源(把并不相同演算数单元比如说的 HBM、RAM和种系统缓存集中的管理和均等),以及创新性的存算数合一虚拟化等。

在共轭种系统中的制作池化的缓存人力资源是据统计年来针对算数力和打印间瓶颈疑虑的相比较热的一个创新顺时针。为了发挥发挥作用 CPU 与 GPU、FPGA 等各种专用较快芯片的高速互联,英特尔公司早在 2019 年就牵头成立了名为 CXL(Compute Express Link)的标准民间组织。对于打印来说,CXL 将提供新缓存应用程序,与原先的 DDR 相相比较,它具有更为高的可扩充性,更为高的带窄,支持最都由要傲腾™ 产品在内的各种打印提案,而且它的虚拟化设计不局限于单个种系统,而是可以在多机两者之间进行时连接,发挥发挥作用多机包涵。大缓存技术提案的据统计现代行业 MemVerge 的创始人兼 CEO 范承工称赞说,CXL 是一个偏离游戏规则的新技术,它可以发挥发挥作用缓存和推算数的相比较独立,有望发挥发挥作用多机两者之间的缓存池化包涵以及真正的可复合基建,可以动态地为种系统添加推算数、缓存、打印人力资源[2]。

存算数合一则是让打印不具备推算数的能力也,从而补救资料排皆复迁址造成的生产开销低下疑虑。如今国内皆众多行业都已经筹划了存算数合一技术的研发,最都由要英特尔公司、SK 海力士、IBM、美光、三星、台积电、阿里等传统意义芯片生产商以及众多新兴 AI 和打印行业[3]。

不过,这些提案在开销、技术成熟度等方面还并不需要更为多验证。

所以,尽管我们都借此看到更为多创新性补救提案并不并不需要早日落地,但是短期来看,英特尔公司®傲腾™ 长久缓存无论如何是意味著相比较较难发挥发挥作用而且价格比极低的一种缓存墙皆补救提案。况且,傲腾™ 长久缓存的发电量还在接下来升级,不久不久就不太可能看到单条 1TB 发电量的产品再次出现,想必到了那时,其创下缓存墙皆的优点将更为加引人注意。

弼考链接:

[1]

[2]

[3]

艾得辛治疗风湿效果好吗
视疲劳怎么恢复得快
整形
骨关节炎如何缓解疼痛
干眼症是什么原因引起的
血糖仪哪个牌子准确度高
艾拉莫德片的作用和功效说明书
非酒精性脂肪肝怎么治疗
什么药止鼾效果好
再林阿莫西林胶囊能用于什么感冒
标签:
友情链接: