Intel Core i7是一款45nm原生四核处理器,处理器拥有8MB三级快取,支持三通道 DDR3记忆体。处理器採用LGA 1366针脚设计,支持第二代超执行绪技术,也就是处理器能以八执行绪运行。根据网上流传的测试,同频Core i7比Core 2 Quad性能要高出很多。
注标题上的inter(R)应该是intel(R)
基本介绍
- 中文名IntelCorei7处理器
- 外文名intel core i7 processor
- 简介一款45nm原生四核处理器
- 拥有8MB三级快取
- 设计採用LGA 1366针脚设计
- 至尊版的名称是“Intel Core i7 Extreme
- 主频为3.2GHz
基本介绍
基于Nehalem架构的下一代桌面处理器沿用“Core”(酷睿)名称,命名为“Intel Core i7”系列,至尊版的名称是“Intel Core i7 Extreme”系列。而同架构伺服器处理器将继续延用“Xeon”名称。至于为什幺是“i7”,而不是大多数人认为的“Core 3 ”,Intel还没给出详细的解释,估计意思是Intel的第七代处理器,但2000年推出NetBrust架构的Pentium 4处理器应该是属于第七代产品的综合之前的资料来看,英特尔会发布三款Intel Core i7处理器,频率分别为3.2GHz、2.93GHz和2.66GHz,主频为3.2GHz的属于Intel Core i7 Extreme,处理器售价为999美元,这款顶级处理器面向的是发烧级用户。而频率较低的2.66GHz的定价为284美元,约合1940元人民币,面向的是普通消费者。全新一代Core i7处理器将于2008第四季度推出。
Intel于2008年11月18日发布了三款Core i7处理器,分别为Core i7 920、Core i7 940和Core i7 Extreme Edition 965。而从英特尔技术峰会2008(IDF2008)上英特尔展示的情况来看,core i7的能力在core2 extreme qx9770(3.2GHz)的三倍左右。
IDF上,intel工作人员使用一颗core i7 3.2GHz处理器演示了CineBench R10多执行绪渲染,结果很惊人。渲染开始后,四颗核心的八个执行绪开始工作,仅仅19秒钟后完整的画面就呈现在了萤幕上,得分超过45800。相比之下,core2 extreme qx9770 3.2GHz只能得到12000分左右,超频到4.0GHz才勉强超过15000分,不到core i7的3分之一。core i7的超强实力由此可窥见一斑。
1. 基于Nehalem微架构
2. 2-8颗核心。
3. 内置三通道DDR3记忆体控制器。
4. 每颗核心独享256KB二级快取。
5. 8 MB共享三级快取。
6. SSE 4.2指令集(七条新指令)。
7. 超执行绪技术。
8. Turbo mode(自动超频)。
9. 微架构最佳化(支持64-bit模式的宏融合,提高环形数据流监测器性能,六个数据发射连线埠等等)
10. 提升预判单元性能,增加第二组分支照準快取。
11. 第二组512路的TLB。
12. 对于非整的SSE指令提升性能。
13. 提升虚拟机性能(根据Intel官方数据显示,Nehalem相对65nm Core 2在双程虚拟潜伏上有60%的提升,而相对45nm Core 2产品提升了20%)
14. 新的QPI汇流排。
15. 新的能源管理单元。
16. 45nm製程,32nm製程产品随后上线,代号Westmere。
17. 新的1366针脚接口。
Nehalem相当于65nm产品有着如下几个最重要的新增功能。
1. SSE4.1指令集(47个新SSE指令)。
2. 深层休眠技术(C6级休眠,只在移动晶片上使用)。
3. 加强型Intel动态加速技术(只在移动晶片上使用)。
4. 快速Radix-16分频器和Super Shuffle engine,加强FPU性能
5. 加强型虚拟技术,虚拟机之间互动性能提升25%-75%。
Nehalem的核心部分比Core微架构改进了以下部分
Cache设计採用三级全内含式Cache设计,L1的设计与Core微架构一样;L2採用超低延迟的设计,每个核心各拥有256KB的L2 Cache;L3则是採用共享式设计,被片上所有核心共享使用。
集成了记忆体控制器(IMC)记忆体控制器从北桥晶片组上转移到CPU片上,支持三通道DDR3记忆体,记忆体读取延迟大幅减少,记忆体频宽则大幅提升,最多可达三倍。
快速通道互联(QPI)取代前端汇流排(FSB)的一种点到点连线技术,20位宽的QPI连线其频宽可达惊人的每秒25.6GB,远超过原来的FSB。QPI最初能够发放异彩的是支持多个处理器的伺服器平台,QPI可以用于多处理器之间的互联。
Nehalem的核心部分比Core微架构新增加的功能主要有以下几方面
New SSE4.2 Instructions (新增加SSE4.2指令)
Turbo Mode (核心加速模式)
Improved Lock Support (改进的锁定支持)
Additional Caching Hierarchy (新的快取层次体系)
Deeper Buffers (更深的缓冲)
Improved Loop Streaming (改进的循环流)
Simultaneous Multi-Threading (同步多执行绪)
Faster Virtualization (更快的虚拟化)
Better Branch Prediction (更好的分支预测)
改进
原生四核+全新快取设计
我们知道,Core 2 Quad系列四核处理器其实是把两个Core 2 Duo处理器封装在一起,并非原生的四核设计,通过狭窄的前端汇流排FSB来通信,这样的缺点是数据延迟问题比较严重,性能并不尽如人意。Core i7则採用了原生四核设计,採用先进的QPI(QuickPath Interconnect,下面将进行介绍)汇流排进行通讯,传输速度是FSB的5倍。
快取方面也採用了三级内含式Cache设计,L1的设计和Core微架构一样;L2採用超低延迟的设计,每个核心256KB(256x4 KB);L3採用共享式设计,被片上所有核心共享,容量为8MB。
採用全新QPI汇流排
Core i7的Nehalem架构最大的改进在前端汇流排(FSB)上,传统的并行传输方式被彻底废弃,转而採用基于PCI Express串列点对点传输技术的通用系统接口(CSI),被Intel称为QuickPath。QuickPath的传输速率为6.4Gbps,这样一条32bit的QuickPath频宽就能达到25.6GB/sec。QuickPath的传输速率是FSB 1333MHz的5倍,前者虽然数据位宽较窄,但传输频宽仍然是后者的2.5倍。由于分别用于双处理器和单处理平台,Gainestown有两条QuickPath,而Bloomfield仅有一条。不难看出,在AMD推出HyperTransport高速串列汇流排,并逐渐在高性能运算领域建立优势之后,Intel也迎头赶上。若干年前,关于串列传输将一统天下的预言已经变成了现实,我们所要等待的是串列记忆体何时重返市场。
集成记忆体控制器
记忆体控制器相信大家不会感到陌生,竞争对手AMD早在K8时代CPU已经集成了记忆体控制器,能大幅提升记忆体性能,而Intel方面则表示由于时机还不合适,没有在Core2中使用,现在最新的Core i7终于拥有集成记忆体控制器IMC(Integrated Memory Controller),可以支持三通道的DDR3记忆体,运行在DDR3-1333,记忆体位宽从128位提升到192位,这样总共的峰值频宽就可以达到32GB/s,达到了Core 2的2-4倍。处理器採用了集成记忆体控制器后,它就能直接与物理存储器阵列相连线,从而极大程度上减少了记忆体延迟的现象。
同步多执行绪技术
原生四核Core i7有八个逻辑核心
超执行绪技术(Hyper-Threading),最早出现在130nm的Pentium 4上,超执行绪技术就是利用特殊的硬体指令,把两个逻辑核心模拟成两个物理晶片,让单个处理器都能使用执行绪级并行计算,进而兼容多执行绪作业系统和软体,减少了CPU的闲置时间,提高的CPU的运行效率。超执行绪技术使得Pentium 4单核CPU也拥有较出色的多任务性能,现在通过改进后的超执行绪技术回归到Core i7处理器上,新命名为同步多执行绪技术(Simultaneous Multi-Threading,SMT)。
同步多执行绪(Simultaneous Multi-Threading,SMT)是2-way的,每核心可以执行2个执行绪。对于执行引擎来说,在多执行绪任务的情况下,就可以掩盖单个执行绪的延迟。SMT功能的好处是只需要消耗很小的核心面积代价,就可以在多任务的情况下提供显着的性能提升,比起完全再添加一个物理核心来说要划算得多。比起Pentium 4的超执行绪技术(Hyper-Threading),Core i7的优势是有更大的快取和更大的记忆体频宽,这样就更能够有效的发挥多执行绪的作用。按照INTEL的说法,Nehalem的SMT可以在增加很少能耗的情况下,让性能提升20-30%。
为什幺Core 2没有使用SMT?很显然,它是可以做到的。SMT是在节省电力的基础上增加了性能,而且软体支持的基础建设也早就有了。有2个可能的原因一是Core 2可能没有足够的记忆体频宽和CPU内部频宽来利用SMT获得优势。通常,SMT能够提升记忆体级并行(memory level parallelism,MLP),对于记忆体频宽已经成为瓶颈的系统则是个麻烦。而更有可能的原因则是SMT的设计、生效等是很麻烦的,而当初设计SMT是由INTEL的Hillsboro小组主持,而并非是Haifa小组(Core 2是由这个小组负责的)。这样Core 2不使用SMT就避免了冒险。
自动超频,核心加速
Turbo Mode,顾名思义,就是加速模式,它是基于Nehalem架构的电源管理技术,通过分析当前CPU的负载情况,智慧型地完全关闭一些用不上的核心,把能源留给正在使用的核心,并使它们运行在更高的频率,进一步提升性能;相反,需要多个核心时,动态开启相应的核心,智慧型调整频率。这样,在不影响CPU的TDP情况下,能把核心工作频率调得更高。
举个简单的例子,如果游戏只用到一个核心,Turbo Mode就会把其他三个核心自动关闭,把正在运行游戏的那个核心的频率提高,也就是自动超频,在不浪费能源的情况下获得更好的性能。Core 2时代,即使是运行只支持单核的程式,其他核心仍会全速运行,得不到性能提升的,也造成了能源的浪费。
Turbo Boost默认是开启的,通过自动调高CPU的倍频提高性能。在Intel原厂X58主机板上,低负载时默认调高1-2个倍频。例如Core i7 920默认频率为2.66G,在Turbo Boost默认是开启的情况下,运行Super PI是以单核2.8G来跑,这样单执行绪性能也就得到提升。
超频爱好者也许会想到,Turbo Mode自动提升的那个频率可以手动调整吗?如果可以,不就能利用它进行超频吗?答案是可以的,只要是Exterme Edition CPU,就可以手动调整,好好利用,新的超频方式从此诞生。
文本处理再提速!完整SSE4指令支持
完整的SSE 4(Streaming SIMD Extensions 4,流式单指令多数据流扩张)指令集共包含54条指令,其中的47条指令已在45nm的Core 2上实现,称为SSE 4.1。SSE 4.1指令的引入,进一步增强了CPU在视频编码/解码、图形处理以及游戏等多媒体套用上的性能。其余的7条指令在Core i7中也得以实现了,称为SSE 4.2。SSE 4.2是对SSE 4.1的补充,主要针对的是对XML文本的字元串操作、存储校验CRC32的处理等。