万博手机版|水晶宫球衣赞助商|NBA火箭队官方赞助商

021-52230045

H3C

万博手机版intel2019最新cpu 英特尔揭开未来cpu显卡

作者: admin 来源: 未知 发布时间:2018-12-15 12:25

  Intel列出的其他更新包括分支预测器的改进,以及由TLB和L1-D带来的有效负载延迟降低。不过雷锋网获悉,有人指出这些改进无法帮助到所有用户,可能只有全新的算法才能使用这些特定部分的核心能力。

  除了架构上的差异,Sunny Cove还增加了新的指令以帮助加快专业计算任务。随着AVX-512单元的出现,新架构将支持用于大算术计算的IFMA(带符号熔加运算)指令,这些指令在密码学中非常有用。Sunny Cove还支持Vector-AES、Vector Carryless Multiply、SHA、SHA-NI以及Galois Field指令,这些指令也是密码学的一些元素中的基本构建块。

  根据路线nm处理器一同面世,配备64个EUs(增强型执行单元),运算规模是此前Gen 9核心显卡的2倍,浮点运算性能超过1TFlops。这64个EUs被分成4个切片,每个切片由2个8EUs的子切片组成,每个子切片均拥有指令缓存和3D采样器,而较大的4个切片则拥有2个媒体采样器、1个PixelFE以及额外的加载/存储硬件。

  Intel并没有透露太多关于如何提高EU性能的详情,但表示EU内部的浮点运算单元接口是重新设计,支持快速(2x)FP16性能。每个EU均像以前一样支持7个线程,这意味着整个GPU有512个并发管道,Intel表示已经重新设计了内存接口,并将GPU的L3缓存增加到3MB,相比Gen9.5增加了4倍。

  Gen11核心显卡还支持Intel全新的多速率着色技术Coarse Pixel Shading(粗像素着色),这与NVIDIA的可变像素着色很相似,能让GPU减少阴影部分像素所需的渲染操作量。Intel为CPS展示了两个演示,其中像素阴影分别作为与相机距离和屏幕中心相关的一个函数,当物体离相机或屏幕中心较远时渲染量减少,其设计目的是帮助VR实现注视点渲染等功能,Intel表示游戏在支持这一技术后可提高约30%的帧率。

  Raja Koduri宣布了Intel独立显卡业务的新产品品牌:Xe,目前仍被非正式的称为“Gen12”系列,将从2020年开始覆盖从客户端到数据中心的所有领域,也涵盖了未来的核心显卡解决方案,Intel希望Xe从入门到中档,再到发烧友以及AI,都能向竞争对手最好的产品发起竞争。

  126x和127x是Intel进程节点技术的内部编号系统,不过图上并没有区分出带“+”后缀的节点变体。Raja展示了现有的2019年工艺技术,计算核心方面有10nm的1274工艺,IO方面有14nm的1273工艺,而本次介绍的Foveros 3D堆叠技术工艺代号是P1222。展望未来,Intel将扩大其节点基础,以便它可以覆盖更多的功率和性能点。

  这正是Foveros的用武之地。Foveros是英特尔新推出的有源载板技术,其设计相比2018年推出EMIB(嵌入式多芯片互连桥接)2D封装技术,更适用于小尺寸产品或对内存带宽要求极高的产品。在这些设计中,每比特传输的数据的功率非常低,而封装技术要处理的是凹凸间距减小、凹凸密度增大以及芯片堆叠技术。Intel表示Foveros已经准备就绪,可以大规模生产。

  Intel在架构日现场展示了Foveros芯片,其采用22FFL IO芯片作为有源载板,万博手机版。并用TSV(硅通孔技术)连接了一颗10nm芯片,其中包含1个Sunny Cove内核和4个Atom内核(可能是Tremont)。这款微型芯片尺寸为12*12,待机功率仅为2mW,看起来似乎是面向移动设备。

  在本次架构日活动中,最“没激情”的部分应该是有关数据中心产品的讨论。Intel之前已经公布了企业市场接下来的两款产品是Cascade Lake和Cooper Lake,均以14nm为基础,专注于增强安全性以及帮助加速的AI指令,随后还会有10nm的Ice Lake Scalable,但也仅此而已。

  :Intel傲腾数据中心级持久内存作为一款新产品,集成了内存般的性能以及数据的持久性和存储的大容量。这项技术通过将更多数据放到更接近CPU的位置,使应用在人工智能和大型数据库中的更大量的数据集能够获得更快的处理速度。其大容量和数据的持久性减少了对存储进行访问时的时延损失,从而提高工作负载的性能。

  Intel傲腾数据中心级持久内存为CPU提供缓存行(64B)读取。一般来说,当应用把读取操作定向到傲腾持久内存或请求的数据不在DRAM中缓存时,傲腾持久内存的平均空闲读取延迟大约为350ns。如果实现规模化,傲腾数据中心级固态盘的平均空闲读取延迟约为10000ns(10s),这将是显著的改进。在某些情况下,当请求的数据在DRAM中时,不管是通过CPU的内存控制器进行缓存还是由应用所引导,内存子系统的响应速度预计与DRAM相同(小于100 ns)。

  :这是一个集成、高性能的开源堆栈,基于Intel至强可扩展平台进行了优化。该开源社区版本旨在确保人工智能开发者可以轻松访问Intel平台的所有特性和功能。深度学习参考堆栈经过高度调优,专为云原生环境而构建。该版本可以降低集成多个软件组件所带来的复杂性,帮助开发人员快速进行原型开发,同时让用户有足够的灵活度打造定制化的解决方案。

  操作系统:Clear Linux 操作系统可根据个人开发需求进行定制,针对Intel平台以及深度学习等特定用例进行了调优;