|
第一款P4处理器是2000年11月下旬发布的,从此引入了Netburst架构,这款处理器的主频受到0.18微米工艺制程的限制而在达到2GHZ的时候就已经接近极限了,这一代P4处理器也就是使用了willamette核心的第一代P4处理器.
随着主流CPU主频和性能的不断提升,英特尔于2001年8月28日又正式推出了使用Northwood核心的第二代奔腾四代处理器,最引人注目的是INTEL在这款处理器的身上使用了先进的0.13微米生产工艺的全新制程,这将意味着这款CPU的起始频率给可以达到2GHZ,而最高的理论设计频率则可以高达6GHz,除此以外INTEL还将处理器的二级缓存(cache)扩充到512KB(依然是全速运行),这样做的好处不言而喻:从当年INTEL没有二级缓存的赛扬300处理器和后来的带有128K二级缓存的新赛扬300A之间性能的巨大差异就不难看出来了,当然,在下面的测试中我们也可以更实际的体会一下512K全速二级缓存的优势.这款CPU一问世就受到了众多的好评,甚至有人戏言之,这才是真正的P4
CPU!
P4处理器处理器的主要技术特点:
P4处理器是基于新的IA-32
NetBurst微型架构的新型处理器,除了主频和工艺上的提高以外,和IA-32架构的处理器相比还有更多的优势.
超标量流水线:
INTEL P5系列CPU流水线长度为5段,P6架构
CPU为10段流水线长度,而P4架构则采用了20段超长流水线,并且集成了多流水线并行计算。这样做使得每个时钟频率周期内的运算量减少,也就是每段分配的运算减少,每个时钟周期内获得的指令也减少,每一段流水线越短,需要的晶体管就越少,而执行就越快。这样就可以大幅提高处理器的主频,这是以单位时间内的运算效率降低为代价的。其次,20段的流水线作业,如果第一段预测错误后,后面的19段作业将会白白浪费,重新开始,这对预测技术的要求又高了许多。对于这个问题,Intel也在P4处理器架构中加入了“高级分支预测运算单元”,在理论上分支预测的能力可以提升到93-94%正确率,并且P4处理器内部集成了4096bytes大小的预测目标缓存来存储分支预测运算单元前几次所做的分支预测的操作结果。在PENTIUM4中加入了执行追踪缓存,它作为解码器下的L1
指令缓存,可以大幅度提升效能。PENTIUM4中还包括SSE2指令集来提高多媒体以及网络运算速度,P4共有144
个全新的指令,加入了2个双精度浮点数的运算功能,希望它可以代替X87协处理器的工作。
SSE2 - 双精度流 SIMD 扩展指令集
在不提高运行频率的前提下而提高计算速度的一个最好方法就是让每条指令执行更多的工作。在P4设计中,Intel
增加了一套包括144条新建指令的SSE2指令集,还将整数MMX寄存器扩展为128bit,并且提供了128bit的双精度浮点运算,这些指令在诸如3D游戏、数字视频制作、MP3编码和流媒体方面可以起到很大的作用。和早期的只有4
个单精度浮点数的SSE指令集相比,SSE2有了很大的性能提升.
QDR(Quad Date Rate)技术四倍速前端总线
该技术可以同时传输4条不同的64位数据流,因此数据带宽可以达到3.2GB/s。为了配合高达400MHz系统总线,英特尔的850芯片组设计了双通道RDRAM,双通道的RDRAM不仅解决了400MHz系统总线的问题,而且在配合两条PC800的RDRAM之后,内存带宽可以达到3.2GB/s,这样就匹配了数据带宽,也就避免了系统瓶颈的出现。不过我们知道内存不可能只为CPU提供数据通道,当其他设备也占用内存时,这时3.2GB/s的数据通道就不够用了,这也是Pentium
4不能全力以赴大幅度提高系统性能的原因之一。
4路联合方式(4-way set associative)
Pentium 4 的 L1 数据缓存为 4路联合方式(4-way set associative),使用
64字节的缓存管道。双端口结构,能在一个时钟周期内同时完成读取和回写。Pentium 4 内置的 L2 缓存也作出了相应改进,Intel
称之为高级传输缓存,其大小与Pentium III L2缓存 256KB 相同(针对原来的willamette处理器而言),缓存通路8路。但是Pentium 4 的L2 缓存每条为 128字节,并分成
2个64字节分别管理。所有数据进入L2
CACHE时都是以64字节为单位,这样可以使数据突发存储时的性能得到提升。但如果实际数据量非常小的时候,就会浪费掉空间而增加读写次数。Pentium 4 L2
缓存的时钟频率与核心相同,与核心带宽为256字节。
【作者:小熊在线-Sky 北京】 版权作品
未经许可 请勿转载
|