【IT168評測中心】寶通公司隨著Xeon E5450處理器還送來了一款Xeon E5410,從數字上可以看出它是比較低端的型號,實際上它幾乎是5400系列當中頻率最低的處理器,只比5405要高一些。

Intel 45nm Xeon:5400系列
顯然,寶通公司的意思是兩款處理器高低搭配,不像E5450,只差一個數字的E5410價格低多了,很適合入門級服務器以及低端服務器選擇,下面我們來看看E5410的性能測試報告,我們將會同多款處理器一起比較。測試方法和Xeon E5450處理器一樣。
測試平台、測試對象介紹
DELL PowerEdge 2900 III測試平台 | |
| 主板 | DELL PE2900 BIOS:2.3.1 |
| 處理器 | Xeon E5410 x 2 |
| 主頻 | 2.33GHz |
| FSB | 1333MHz |
| L1容量 | 64K(Data容量為32K) |
| L2容量 | 12MB(共享) |
| 芯片組 | Intel 5000X |
| 內存 | 2GB FBD DDR2 667 SDRAM x 4 |
| 磁槃控制器 | DELL Perc 5/i RAID Controller |
| 系統硬槃 | Seagate Cheetah 15K.5 ST314655SS 146GB 16MB SAS x 3 |
| 陣列卡設置 | WriteBack, Cached I/O, Adapative Read Ahead |
| 硬槃設置 | RAID 5,條帶大小64KB 主分區20GB,測試分區50GB |
| 網卡 | Broadcom BCM5708C千兆網卡 X 2 |
| 操作系統 | Windows Server 2003 R2 Enterprise Edition SP2 |
我們使用了一台安裝了Windows Server 2003 R2操作系統的DELL PowerEdge 2900 III服務器作為測試平台,只是把處理器更換為我們的測試對象:E5410處理器。PowerEdge 2900 III服務器採用的主板基于Intel 5000X芯片組,帶有12MB Snoop Filter緩存,它可以提升重負荷下緩存同步、進程調度方面的性能。5000X芯片組比較少見。前段時間推出的5400 Seburg芯片組帶有24MB的Snoop Filter緩存。
對比平台包括我們PowerEdge 2900 III服務器原配的CPU:Xeon E5430以及Xeon E5450,除了它們的頻率之外,其它和E5410沒什麼區別。此外還有一款AMD的Opteron 2356處理器。
Intel Xeon E5410處理器:
| 代號 | 型號 | SMP | 主頻 | L2 | TDP | 制程 |
| Harpertown | Xeon E5405 | DP | 2.00 | 12MB | 80W | 45nm |
| Xeon E5410 | DP | 2.33 | 12MB | 80W | 45nm | |
| Xeon E5420 | DP | 2.50 | 12MB | 80W | 45nm | |
| Xeon E5430 | DP | 2.66 | 12MB | 80W | 45nm | |
| Xeon E5440 | DP | 2.83 | 12MB | 80W | 45nm | |
| Xeon E5450 | DP | 3.00 | 12MB | 80W | 45nm | |
| Xeon E5460 | DP | 3.16 | 12MB | 120W | 45nm |
可以看出,45nm Xeon E5410的頻率為2.33GHz,更低一個檔次的E5405則為2.00GHz,相比之下E5410頻率要高出16.7%,我們認為E5405的頻率有些過低了。基本上,當前處理器都是同一系列當中頻率最低的性價比最高,不過在服務器當中,處理器的重要性比在桌面PC中的要高一些。
AMD 2356處理器:

AMD Opteron 2356處理器

AMD Opteron 2356 CPU-Z信息
就是一台送測樣機中配備的四核心巴塞羅那處理器,其型號為AMD Opeteron 2356。這款處理器主頻為2.3GHz,L2為512K,應用65nm工藝制造,也是最新的B3步進版本,功耗為75W。價格和頻率都和Xeon E5410相似。

Intel E5410 ScienceMark 2.0測試界面
ScienceMark Membench | ||||
| 廠商 | DELL PE2900 III | DELL PE2900 III | DELL PE2900 III | Tyan GT24 (B2912) |
| 產品型號 | 雙路 E5410 | 雙路 E5430 | 雙路 E5450 | 雙路 Opteron 2356 |
| 內存技術參數 | 2GB FBD ECC DDR2 667 SDRAM x 4 | 2GB FBD ECC DDR2 667 SDRAM x 4 | 2GB FBD ECC DDR2 667 SDRAM x 4 | 1GB ECC DDR2 667 SDRAM x 4 |
| 內存帶寬(MB/s) | 4485.77 | 4478.35 | 4505.59 | 5212.79 |
| L1 Cache Latency(ns) | ||||
| 32 Bytes Stride | 1.29 | 1.13 | 1.00 | 1.30 |
| L2 Cache Latency(ns) | ||||
| 4 Bytes Stride | 1.29 | 1.13 | 1.00 | 1.30 |
| 16 Bytes Stride | 1.72 | 1.50 | 1.34 | 1.30 |
| 64 Bytes Stride | 5.16 | 4.51 | 4.01 | 3.91 |
| 256 Bytes Stride | 5.16 | 4.51 | 4.01 | 6.52 |
| 512 Bytes Stride | 5.59 | 4.89 | 4.34 | 6.52 |
| Algorithm Bandwidth(MB/s) | ||||
| Compiler | 2949.75 | 2320.00 | 3177.97 | 1845.51 |
| REP MOVSD | 2983.45 | 2324.80 | 3223.82 | 1844.30 |
| ALU Reg Copy | 2551.17 | 1879.52 | 2818.10 | 1534.26 |
| MMX Reg Copy | 2782.87 | 1896.39 | 2992.21 | 1820.91 |
| MMX Reg 3dNow | --- | --- | --- | 5112.84 |
| MMX Reg SSE | 3876.27 | 2688.02 | 3962.02 | 5148.49 |
| SSE PAlign | 4265.40 | 2687.01 | 4297.17 | 4940.53 |
| SSE PAlign SSE | 4052.10 | 2690.93 | 4124.61 | 5212.79 |
| SSE2 PAlign | 4263.45 | 2688.09 | 4293.79 | 4940.73 |
| SSE2 PAlign SSE | 4054.97 | 2691.79 | 4126.98 | 5211.16 |
| MMX Block 4kb | 4139.45 | 2583.20 | 4167.14 | 3215.32 |
| MMX Block 16kb | 4475.10 | 2310.93 | 4480.38 | 3354.92 |
| SSE Block 4kb | 4080.12 | 2599.01 | 4172.21 | 3166.65 |
| SSE Block 16kb | 4485.77 | 2313.20 | 4505.59 | 3339.01 |
首先我們進行的是ScienceMark的測試,主要考察系統的處理器和內存情況。L1/L2 Cache的成勣主要是跟處理器頻率相關,因為目前的處理器當中L1 Cache都是和處理器核心同頻率的,而L2 Cache基本上也是〞〞當前的處理器L2都是全速的(放置在處理器內但不在同一個芯片上的Pentium II為半速L2,而Pentium之前的處理器L2則和處理器分離,速度更低)。越快的頻率,L1/L2性能就越好。而內存帶寬主要由兩部分相關:比較大的部分是內存架構,小部分是內存操作指令(集),例如使用最新的SSE指令集比通常的ALU指令集會得到更大的吞吐量,而不同的SSE版本性能也有不同。
在架構的Xeon對比上,性能上的排序就跟價格上的排序一樣。而由于架構上的不同,Xeon E5410和Opteron 2356各有所長,總體上靠著更為昂貴些的內存子系統,E5410具有較高的優勢。
| SiSoftware Sandra Pro Home 2008 | ||||
| E5410 | E5450 | E5450 | OP2356 | |
| Processor Arithmetic Benchmark | ||||
| Dhrystone ALU | 86496 MIPS | 98883 MIPS | 110320 MIPS | 69732 MIPS |
| Whetstone iSSE3 | 68156 MFLOPS | 78073 MFLOPS | 87861 MFLOPS | 59229 MFLOPS |
| Processor Multi-Media Benchmark | ||||
| Multi-Media Int x8 iSSSE3 | 515552 iit/s | 589298 iit/s | 655876 iit/s | 174694 iit/s |
| Multi-Media Float x4 iSSE2 | 279994 fit/s | 320917 fit/s | 358011 fit/s | 230000 fit/s |
| Memory Bandwidth Benchmark | ||||
| Int Buff'd iSSE2 Memory Bandwidth | 6239 MB/s | 6259 MB/s | 6264 MB/s | 6569 MB/s |
| Float Buff'd iSSE2 Memory Bandwidth | 6233 MB/s | 6259 MB/s | 6262 MB/s | 6494 MB/s |
| Cache and Memory Benchmark | ||||
| Cache/Memory Bandwidth | 64579 MB/s | 69276 MB/s | 75623 MB/s | 65611 MB/s |
| .NET Arithmetic | ||||
| Dhrystone .NET | 11156 .netMIPS | 12098 .netMIPS | 12358 .netMIPS | 12583 .netMIPS |
| Whetstone .NET | 39208 .netMFLOPS | 45386 .netMFLOPS | 52176 .netMFLOPS | 37039 .netMFLOPS |
| .NET Multi-Media | ||||
| Multi-Media Int x1 .NET | 91402 .netiit/s | 104727 .netiit/s | 120421 .netiit/s | 79258 .netiit/s |
| Multi-Media Float x1 .NET | 20800 .netfit/s | 23881 .netfit/s | 27648 .netfit/s | 16251 .netfit/s |
SiSoftware Sandra主要用于測試理論計算成勣,雖然通常和實際成勣有些差異,不過從這些成勣當中可以看出硬件/軟件架構上的不同。從計算能力上看,E5410比OP2356要高出不少,特別是多媒體相關的計算。
NetBench測試的Ent_dm.tst測試腳本模擬的是企業級文件服務器應用,它不但要求被測服務器的處理器和內存子系統可以提供足夠的運算能力和吞吐量,還需要磁槃子系統具有較高的IO處理能力。
由于磁槃子系統根本就不同,因此這里沒有加入OP2356的成勣。

E5410 NetBench吞吐量
處理器的不同帶來了測試結果的不同,大致上E5450的成勣的提升不及頻率上的差異,也就是說E5410和E5450的成勣比較接近。

E5410靜態頁面性能
靜態測試其實考量的是服務器的網絡帶寬〞〞用來傳輸靜態的頁面並不太消耗其它資源,因此不同的處理器性能大都一樣,在單千兆網卡的情況下,這個極限數值是18000請求每秒,OP2356平台略低一些,這跟其架構有關。

E5410動態頁面性能
動態性能和CPU、內存有較大的關系,和磁槃也有一些關系,三款Xeon的成勣都很相似,表明其對頻率不是非常敏感,相反對內存子系統的性能比較敏感,Opteron的內存架構更為優秀一些〞〞處理器內置內存控制器。Intel最新的Nehalem平台也採用了這樣的做法。
我們在被測的服務器上安裝了Microsoft SQL 2005,按炤測試要求建立了數據庫,包括9個表,其中有4個500萬行的表格,每行包括100字節的數據,因此每個表格容量大約是476MB,整個數據庫容量為1.86GB。我們用60個客戶端模擬1600個用戶,在1-500的區間內以50個為一組依次增加,在這個數據庫中進行查詢、添加、刪除、修改等操作。

SQL 2005性能
影響數據庫性能的因素有很多,特別是在平台架構不相同的情況下。E5410的成勣和其他頻率更高的Xeon處理器在重負荷下保持了相當的差距,相比之下,OP2356的平台隨著負載的提升性能下降很快(數據比較多,需要仔細看才行)。
我們利用UNI-T UT71E智能數字萬用表和相配套的軟件對于對于被測服務器在幾種不同的狀態下的功耗進行了監測,主要包括如下項目:
P1:連接電源但不開機狀態
P2:系統啟動完畢,5分鍾內無動作,但不休眠
P3:系統啟動完畢,處理器滿載(CPU占用率100%)工作

E5410功耗測試
Xeon平台只有處理器不同,因此功耗排序和處理器頻率排序大致上相同,除了P1階段絕對值較小而誤差較大之外。Op2356平台的硬件差異較大(1U服務器,兩顆巴塞羅那皓龍處理器2356、4GB DDR2 667MHz內存、1塊3.5英寸SATA硬槃、5個系統風扇),而Xeon平台是一個較大的塔式服務器(8GB FBDDDR2 667、3塊15000RPM SAS硬槃、多個大尺寸風扇),因此OP平台功耗很低,沒有直接對比的價值。
【IT168評測中心】從性能上看,處理器在服務器的性能因素當中占據了比較重要的地位,只有少數如靜態Web服務才不太依賴于處理器。其他的應用中,根據負載的不同,對處理器的依賴性也各有不同。
| 代號 | 型號 | SMP | 主頻 | L2 | TDP | 制程 |
| Harpertown | Xeon E5405 | DP | 2.00 | 12MB | 80W | 45nm |
| Xeon E5410 | DP | 2.33 | 12MB | 80W | 45nm | |
| Xeon E5420 | DP | 2.50 | 12MB | 80W | 45nm | |
| Xeon E5430 | DP | 2.66 | 12MB | 80W | 45nm | |
| Xeon E5440 | DP | 2.83 | 12MB | 80W | 45nm | |
| Xeon E5450 | DP | 3.00 | 12MB | 80W | 45nm | |
| Xeon E5460 | DP | 3.16 | 12MB | 120W | 45nm |
我們測試了Intel 45nm Xeon E5410,主頻為2.33GHz,L2 Cache為12MB,FSB為1333MHz,集成了8.2億晶體管,TDP為80W,除了頻率,它和E5430、E5450等處理器沒有什麼差別。

從Intel的策略來看就是處理器價格提升的幅度要比頻率提升幅度要高不少,E5410的價格不到2000元(單個處理器),性能上比E5450差20%~30%左右,對于不需要太高性能的用戶來說,自然是價格越低越好,入門級別的低端服務器或者筆者這樣的個人工作站使用是非常好的選擇,特別是和桌面平台的Core 2處理器相比甚至還具有一些價格/性能優勢,只是在主板、內存上會增加一定的成本。而對于“產出”的用戶來說,硬件設備是為了更好地得到其他方面的價值(商業服務或者高附加值的創作等),對硬件的成本方面不太敏感,因此採用高頻率的E5450(或者更高)會比較合適。