发新话题
打印

英特尔图形处理器曝光 或将超越NVIDIA?

英特尔图形处理器曝光 或将超越NVIDIA?

 

  Intel低调的开始利用它的Larrabee进入图形芯片市场。对此,NVIDIA并没有大肆批评虚无的Larrabee,也只是偶尔低调地回应。不过,随着这几个月来我们所看到的回回的互讽。Intel Larrabee GPU的核心架构终于第一次出现在了大众眼前。

 


 

  当然很重要的一点就是要谨记,这不是一个GPU但又确确实实是GPU。此时读者肯定会想,它和一个数据平行处理优化的多核CPU有什么区别呢?有一个微妙的固定功能硬件来尽可能简单地运转一般的编码。Intel可以制造这个应用广泛的多核CPU,使它看起来像通过执行软件程序库来处理DirectX和OpenGL的GPU。

 

  这不是一个仿真GPU,因为它直接在数据平行的CPU上执行函数性,而这种CPU一般在专门的硬件上操作。开发者们也都不会仅仅局限于DirectX和OpenGL,这类硬件可以操作纯粹的渲染程序并运作,如同量身定做一般。

 

  英特尔可以建立一个图形处理器吗?

 

  Larrabee以现存的Intel x86的核心技术为基础制作出来的,这不仅意味着Intel对芯片设计熟之又熟,而且对以后的桌面微处理器会采取更认真的方式。但是Larrabee并不是在酷睿架构---Intel现有的所需----基础上制造出来的,而是基于最初的Pentium。

 

  最初的Pentium是在0.80μm的处理器上制作而成的,之后提升为0.60μm. Intel的问题就是:拥有现代处理以及广泛的向量组装备的Pentium酷睿的更新版,可以成为终极GPU吗?

 

  首先来检测一下Intel理论的标准Core 2 Duo,4MB L2缓存频率(可能有些地方在1.8-2.9GHz之间).然后,在同一制作过程当中,大致相同的死机区域,以及动量消耗,Intel试图找到有多少这种修正过的Pentium cores它可以适合。

 

  因此,在空间的双核心Core 2 Duo处理器,英特尔可以兴建这个假设性的10核心芯片。下面我们先来看看这些数据:

 

  Intel Core 2 Duo Hypothetical Larrabee
# of CPU Cores 2 out of order 10 in-order
Instructions per Issue 4 per clock 2 per clock
VPU Lanes per Core 4-wide SSE 16-wide
L2 Cache Size 4MB 4MB
Single-Stream Throughput 4 per clock 2 per clock
Vector Throughput 8 per clock 160 per clock

 

 

  larrabee核心:不完全是Pentium,也不完全是Atom

TOP

 


 

架构简图

 

  Intel Larrabee Core Intel Pentium Core (P54C) Intel Atom Core
Manufacturing Process 45nm 0.60μm 45nm
Simultaneous Multi-Threading 4-way 1-way 2-way
Issue Width dual-issue dual-issue dual-issue
Pipeline Depth 5-stages (?) 5-stages 16-stages
Scalar Execution Resources 2 x Integer ALUs (?)

 

1 x FPU (?)

2 x Integer ALUs

 

1 x FPU

2 x Integer ALUs

 

1 x FPU

Vector Execution Resources 16-wide Vector ALU None 1 x SIMD SSE
L1 Cache (I/D) 32KB/32KB 8KB/8KB 32KB/24KB
L2 Cache 256KB None (External) 512KB
ISA 64-bit x86

 

SSEn support?

Parallel/Graphics?

32-bit x86 64-bit x86

 

Full Merom ISA compatibility

 

Larrabee与不同的核心架构对比数据

 

  Larrabee同AMD/NVIDIA的比较:

 


 

左边是larrabee核心

 


 


 

  Putting it all Together - Return of the Ring Bus:

 


 

  一个Larrabee有多少个内核?

 

TOP

 

  设计为低延迟运作:

 

  AMD RV770 NVIDIA GT200 Intel Larrabee
Scalar ops per L1 Cache 80 24 16
L1 Cache Size 16KB unknown 32KB
Scalar ops per L2 Cache 100 30 16
L2 Cache Size unknown unknown 256KB

 

  线程及数据管理:

 


 

  larrabee的shader:

 


 

  多核是larrabee的发展之路:

 


 

TOP

发新话题