台海新闻网

英特尔依然是那个英特尔,且看英特尔的城防体系

?

[PConline会谈]数字时代带来的变化是深远的。在这个概念的推动下,我们不仅发明了新的应用程序表单,还在这个新的应用程序和业务需求下规划了整个企业IT架构。在这种新的IT架构中,传统的计算,存储,网络和其他资源不再是用户关注的焦点,而是被各种功能所取代,包括人工智能,大数据,云计算,物联网等。

在IT行业的整体转型中,无数新公司迅速崛起。因此,在短短几年内,我们可以看到几乎所有IT领域中新概念的兴起和普及。

当一个新人笑的时候,有老人在哭。

一方面,新兴的IT公司正在开拓新的市场和需求。另一方面,他们也在积极测试所有旧IT公司的生活。应用软件,数据库,中间件,管理软件和基础设施等各种领域的传统标签在这一巨大变化中或多或少受到影响。

正如星星的火焰可能被破坏一样,应用层面发生的变化永远不会停留在应用层面,而是会扩散到更上游的半导体领域。那么,在应用领域引发无数“血与飓风”的这场革命是否也会在上游半导体领域引发同样的浪潮?传统的半导体产业能否凭借自身的力量适应和管理变革?

没错,我们在这里谈论英特尔。

变革的曙光,英特尔面临着许多挑战

作为业界当之无愧的领导者,英特尔凭借其强大的产品和技术能力多年来一直引领着行业的辉煌。但在新时代,英特尔面临着许多挑战:

挑战1:AMD?

img_pic_1561450060_0.jpeg

在良好的建筑性能的前提下,引入了EPYC系列处理器;以相同的价格提供了内存通道的数量和更多的内核,这成功地提升了其产品在数据中心市场的市场份额。

挑战2:ARM?

img_pic_1561450061_1.gif

优点是它提供了更好的集成,可扩展性和能效。目前,一些冷存储,原生Android服务或无服务器计算已经开始尝试使用ARM处理器。

挑战3:NVIDIA?

img_pic_1561450061_2.jpeg

在AI的祝福下,GPGPU所代表的多元化计算能力正在迅速崛起。作为该领域的代表,NVIDIA正在迅速扩大其在数据中心市场的地位,并通过收购和合作扩大其领域。

此外,包括Gen-Z和RISC-V在内的新架构和新指令集已开始以其自身优势挑战英特尔的传统计算机架构。似乎英特尔的前进道路确实充满了荆棘。但英特尔十多年来一直平息了歌手的地位,真是如此无知和毫无准备?

在这里,我们不要谈论剑,只谈谈城墙。

英特尔的城市防御

虽然近年来在工艺技术领域一直很慢的英特尔经常受到消费者市场用户“挤牙膏”的诱惑,事实上,英特尔并不是真的闲着。对于英特尔获得优势后,除了不断尝试新领域之外,当然还有一项重要的努力是继续巩固其已经获得优势的领域的优势。这符合业务逻辑。

img_pic_1561450061_3.jpeg

经过十多年的不懈努力,英特尔成功打造了由六大技术支柱组成的坚实城市防御。

1,加工和包装

对工艺和封装技术的追求仍然是整个半导体行业的永久核心目标。

就目前的产品线而言,英特尔的14nm工艺并不是业界最先进的工艺;这是一个不争的事实。但就掌握现有流程而言,英特尔仍然是该行业的领导者。

img_pic_1561450061_4.jpeg

凭借英特尔最新的第二代Xeon可扩展处理器,顶级Xeon Platinum 9282处理器能够在单个处理器上实现56个物理内核和3.8GB Turbo频率,总TDP为400W。处理器由两个模具组成,每个模具具有大约694平方毫米的单独模具。在商业产品(如核心区域)和此类功耗密度中实现此类频率的能力足以证明英特尔在14nm工艺和相关封装技术方面的熟练程度。即使三星和台积电在量产方面迈出了半步,也无法在7纳米技术下生产这类产品。

这种可怕的流程成熟度意味着使用Intel Xeon Platinum 9282处理器(目前只有原始系统)的系统可以在双向情况下提供112个物理内核,在同一机架空间内实现两倍的计算密度。

5月底,使用10nm工艺的Ice Lake处理器终于问世,最终产品将于2019年底在笔记本电脑平台上推出。届时,英特尔将至少达到行业顶级工艺技术水平在晶体管密度和成品性能方面,甚至将再次引领行业发展。当然,根据过去的经验,新技术下的数据中心产品将在消费产品推出一年后上市。

对于英特尔来说,回归行业高峰需要时间,但这个目标已经提上日程。

img_pic_1561450062_5.jpeg

在这里,我再说一句话。最新的英特尔AgilexFPGA采用10纳米工艺实现,并采用3D封装。通过堆叠多个不同的功能,不同的IP和不同的工艺模块,Agilex能够实现更完整的功能,更好的集成和更小的片上尺寸。这与手机领域常见的“第一个包装然后堆叠”的原理相同,但效率却不一样。

2,XPU架构

件下,计算能力的多样化已成为公认的趋势。

虽然竞争对手将使用他们自己的GPU,ASIC,MIPS和其他处理器或芯片来瞄准英特尔在应用领域的通用处理器,并声称具有xx倍优势;但坦率地说,对于某种类型的计算,某些算法制造的处理器(芯片)可以在单一应用场景中与通用处理器进行基准测试,这本身就是不充分的。

面对计算能力多元化的趋势,英特尔拥有自己的解决方案 XPU系统。

尽管CISC指令体系结构强调在单个处理器中针对多种计算类型进行特殊优化以实现更好的应用程序编程和操作,但通用处理器的核心目标仍然是支持所有计算类型。不限于特定类型的计算。

考虑到这一点,我们可以轻松了解英特尔的XPU架构。

img_pic_1561450062_6.jpeg

在CPU领域,第二代Xeon可扩展处理器集成了VNNI深度学习加速指令集,可以为当前主流的深度学习框架(如TensorFlow,Caffe和mxnet)提供加速。借助专用的OpenVINO工具包,开发人员可以深入优化程序,算法和模型,从而在同行中实现更高的性能。与上一代Solitaire Platinum 8100系列处理器相比,带有VNNI指令集的Platinum 8200系列处理器在Caffe Resnet-50测试中可以实现近2.5倍的性能,而更强大的铂9200系列可以达到5.2倍。性能。

这种性能提升水平在基于AI的推理应用程序中非常重要,允许用户无需使用额外的协处理器或计算卡即可实现显着的推理性能提升,从而使AI应用程序部署阈值更低,系统配置更简单。

在实际应用中,VNNI指令集使京东云在文本检测应用中实现2.4倍的性能,使腾讯云在视频分析应用中实现3.26倍的性能,使微软在图像识别应用中实现3.4倍的性能。性能,使阿里巴巴在8种不同的工作负载中实现2-4倍的性能。同时,百度自主开发的PaddlePaddle框架在VNNI指令集的支持下也可以获得2到3倍的推理应用性能。

img_pic_1561450063_7.jpeg

最右边的列是负载优化和强大的

当然,除了指令集的演变之外,英特尔还在Xeon产品的框架内为不同的应用类型引入了更多负载优化的产品。例如,NFV系列后缀N,用于大规模云基础设施的V后缀系列处理器,用于搜索应用的S后缀系列,用于物联网应用的T后缀系列,以及具有Speed Select技术的后缀。 Y系列处理器(适用于多个配置文件,在BIOS中切换以优化相应的负载)。此外,英特尔还推出了用于网络应用和网络边缘解决方案的X射线D-1600处理器。基于此处理器,英特尔还为CDN和其他领域引入了数据加密和压缩加速卡 QAT。

img_pic_1561450063_8.jpeg

除了CPU领域的这些应用分段产品外,英特尔还拥有用于大规模数据吞吐量设备的FPGA,用于能量敏感应用的ATOM系列,专业神经网络加速芯片NERVANA以及用于AI编程的用户。学生组的Movidius神经网络计算加速器(U盘设计,无风扇)和一系列产品适用于不同的负载类型和应用场景。

这些产品共同构成了英特尔的XPU系统。

虽然这些产品无法完全覆盖所有计算领域和场景,但这些产品中的每一个都包含有针对性和有针对性的设计,可以满足不同类型用户的需求。

3,记忆和存储

除了以处理器为中心外,冯诺依曼计算机体系结构的最大特点是多级存储。

根据性能,计算机的内部存储组件大致可分为三层:性能最佳的CPU内置缓存,第二性能系统内存,性能最差但容量更大的磁记录存储。

在正常认知下,存储粒度越小,性能越平滑,计算机系统的整体运行效率越高。因此,从目前的角度来看传统计算机体系结构内部的三级存储分区,我们可以很容易地找到不合理的一种:内存与磁介质存储之间的性能差距过大。闪存介质的出现可以在一定程度上通过在两者之间添加热数据层来解决这个问题。

使用“某种程度”一词的原因在于,即使在具有更高带宽和更低延迟的NVMe协议下,当前的SSD产品通常也只能达到3xxx MB/s和ms级响应的性能水平。 10,000 MB/s的带宽与DDR4内存和CPU缓存之间的ns延迟之间仍存在巨大的性能差距。

img_pic_1561450063_9.jpeg

如果添加另一层,操作系统和应用程序的挑战太大,很难在短时间内推广它。因此,英特尔给出的解决方案是傲慢的数据中心级持久性内存。

简而言之,AoTeng内存中使用的3D Xpoint介质是一种在延迟响应,传输速率和使用寿命方面远远超过当前NAND闪存的产品。与DRAM粒子相比,3D Xpoint媒体在性别和容量方面具有非易失性优势。将其与DIMM上的DRAM混合可以显着提高计算机性能,而不会对现有计算机系统产生重大挑战(在此阶段,性能提升的幅度与使用场景密切相关)。

img_pic_1561450063_10.jpeg

第二代Xeon-Scalable处理器完全增加了对AoTeng数据中心级持久内存的支持。目前,AoTeng持久性存储器有两种应用模式,一种是APP Direct Mode,另一种是Memory Mode。

在APP直接模式下,DRAM和AoTeng持久存储器在操作系统和应用程序前面显示为系统内存。应用程序需要使用两种介质来表示两种内存的性能特征; DRAM负责IO性能,傲慢的持久性内存通过容量和非易失性功能提供容量和可靠性。当然,这需要应用程序对存储器操作机制进行调整和有针对性的调整。

目前,支持该模型的主要应用程序是SAP的HANA内存数据库和开源Redis内存数据库。在SAP HANA应用程序中,AoTeng的持久存储器和DRAM的组合创造了9.1B IO性能的世界纪录。在Redis中,使用AoTeng的持久内存也可以带来高达8倍的性能提升。

在存储器模式中,傲慢的持久存储器成为系统主存储器,而DRAM从系统接口“消失”,并且仅在傲慢存储器的高速缓存模式下工作。在内存模式下,不需要自定义操作系统和应用程序。两种媒体的具体操作完全由驱动程序实现。

可以说APP Direct Mode可以提供更好的性能,但应用程序需要进行更改;虽然内存模式可以提供更多的系统内存容量,但性能的提升因人而异,但在不改变操作系统和应用程序的情况下获胜。两者都有其优点和缺点,用户和软件开发人员可以自由选择。

另一方面,3D Xpoint的非易失性也可以以引以为豪的SSD的形式转换为SSD介质上的另一个存储层。

img_pic_1561450064_11.jpeg

当然,英特尔本身也生产各种SSD产品,除了提供多种容量外,PCI-E,SAS,U.2等接口形式也随手可得。此外,英特尔还创建了一款新的“小型”PCI-E x4 SSD,可在1U空间内实现576TB容量和1000万IOPS。

4.互连

云基础架构的日益普及使得集群和集群之间的连接效率比以往更加重要。同时,随着网络复杂度的增加和用户需要升级网络管理,网络设备不仅需要提供更高的带宽和更低的延迟,还提供更多的操作模式,以提高网络的可靠性和可管理性。性和传播效率。

在这方面,英特尔的产品线包括两个主要序列,一个是500,700,800系列以太网卡,另一个是Omni-Path高速网络解决方案。

img_pic_1561450064_12.jpeg

以2019年最近发布的800系列以太网卡为例,除了提供100Gb带宽外,该网卡还支持英特尔应用队列(ADQ)技术,增强型动态设备个性化(DDP)技术和RDMA。

ADQ允许用户根据不同应用程序的关键性定义数据包收发的优先级顺序,实现面向应用程序和数据的网络可管理性。 DDP允许应用程序或系统为不同的数据包添加额外的,可定制的头,允许不同的包使用不同的传输协议,最大化网络传输效率并减少延迟。 RDMA允许直接读取和写入远程存储器而无需额外的CPU干预,这可以极大地提高大型集群和高负载应用中的系统互连效率。

这三种技术的结合为800系列以太网卡带来了更低的延迟和更高的吞吐量。在支持这些技术的高级内存数据库应用程序环境(如Radis)中,800系列NIC可提供高达45%的延迟降低和30%的吞吐量提升。

英特尔的Omni-Path高速互联网是一个完整的解决方案,包括光纤接口适配器和交换机。 Omni-Path目前提供58Gb和100Gb产品。除了支持RDMA之外,Omni-Path还使用更轻,更简单的消息传递库,并且在建立连接时不必在系统和进程中维护连接地址。信息,因此Omni-Path是Infiniband的高性能,低延迟网络架构,面向HPC,AI和其他应用。

5,软件

硬件设计变得越来越复杂,指令集和功能越来越多,这对编程和应用程序效率来说是一个挑战。另一方面,编程语言的翻新还要求在设计中充分考虑和支持硬件产品。

对于像英特尔这样的公司,作为许多产品的行业领导者,更新不同操作系统和安全威胁的设备驱动程序和固件可以创造大量的工作。同时,这些软件产品也根据新应用程序的特性和硬件本身进行定位和优化。这就是英特尔拥有超过15,000名软件工程师团队作为半导体/硬件公司的原因。

6,安全性

与软件一样,从硬件,固件和驱动程序级别保护系统是一项非常重要且艰巨的任务。新安全威胁和漏洞的不断出现,以及应用程序和系统日益复杂,使得这项任务变得非常困难。当硬件级别出现某些漏洞或错误时,英特尔还需要规划新步骤以在硬件级别修复它。当然,在开放的思想中,对于所有已知的错误,英特尔将在官方网站上发布相关信息以及修复的时间和形式,以便合作伙伴和最终用户都能够意识到这一点。

在我的BGM中击败我?这是一个小概率事件

img_pic_1561450065_13.jpeg

围绕处理器及其背后的x86架构,英特尔已经构建了一个大型系统,涉及计算,存储,网络连接,软件驱动的固件,优化和硬件设计和制造标准,以及该系统的开发和运行。这个过程积累了大量的经验,资源和生态伙伴。

英特尔将这种城市防御系统称为“以数据为中心”的产品架构。实际上,在数字时代,数据将成为用户业务发展的新燃料,IT架构是使用这种燃料的引擎。理解并掌握这一趋势,英特尔的愿景无疑是准确的。当一个巨人找到正确的方向并全速拉动它时,它的动能和势能不容小觑。

从整体产品生态学的角度来看,英特尔目前的问题是该流程的六大支柱略微落后于行业的顶级水平。显然,这种情况将在一定程度上动摇英特尔在业界的领先地位,但这种动摇是微不可知的。随着新流程的宣布,英特尔在该领域的“落后”流程即将完成。那时候,你会冷静下来;英特尔仍然是我们熟悉的英特尔。

当然,半导体工艺作为整个英特尔建筑的基础,超越了代工厂本身就是一个相当明确的信号。他表明,英特尔在行业中的领先地位正在拉近,人们将在某个领域意外失去冠军。但是,我们仍然需要清醒地意识到,业内没有人能够在各个方面挑战或超越英特尔;这个人不会在短时间内出现。

我的观点是:我想在英特尔现有的计算机架构中实现英特尔的超越,并且发生这种情况的可能性非常低。真正威胁英特尔的正是今天似乎很弱的外部力量。因为他们正在建立一个新的系统,一个新的生态系统。当然,至于两个系统和两个生态系统之间的对抗,当它发生时和以什么形式出现时,我们仍然需要观察很长时间。