日夜自學課堂一:為何p4被稱為“不死鳥”?

來源: 日夜 2005-08-05 06:49:10 [] [舊帖] [給我悄悄話] 本文已被閱讀: 次 (12204 bytes)
本文詳細披露了P4燒不死的秘密
剖析CPU溫度監控技術

微型計算機
2005-2-24 14:19:00 文/微型計算機 陳忠民 (日夜 刪節)

微處理器功耗和溫度隨運行速度的加快而不斷增大,現已成為一個不折不扣的“燙手山芋”。如何使處理器安全運行,提高係統的可靠性,防止因過熱而產生的死機、藍屏、反複重啟動甚至處理器燒毀,不僅是處理器所麵臨的困境,也是留給主板設計者的一個重要課題。為此,Intel率先提出了溫度監控器(Thermal Monitor,以下簡稱TM)的概念,通過對處理器進行溫度控製和過熱保護,使穩定性和安全性大大增加。

但是,由於電腦愛好者和普通用戶對處理器溫度監控係統了解不多,而且介紹這方麵知識的中文資料也難以獲得,遇到相關問題時會感到不知所措,所以有必要將處理器溫度監控技術係統地介紹給大家。

一、溫度測量:從表麵深入到核心

建立微處理器溫度監控係統,首先要選擇一種合適的溫度測量器件。能夠測量溫度的器件有很多種,如熱敏電阻、熱電偶和半導體溫度傳感器等。電腦中最早使用熱敏電阻作為測溫元件,微處理器插座下豎立的球狀或帶狀的小元件,就是熱敏電阻。

熱敏電阻(Thermal Resistor ,簡稱Thermistor)體積小、價格低,使用方便,但用於檢測微處理器溫度時存在著先天不足:

1.熱敏電阻是接觸式測溫元件,如果熱敏電阻與微處理器接觸不夠緊密,微處理器的熱量不能有效地傳送到,所測量溫度會有很大誤差。有些主板上采用SMD貼片熱敏電阻去測量微處理器溫度,其測量誤差比直立式熱敏電阻誤差更大,因為這種貼片元件很難緊密接觸到微處理器。

2.微處理器的核心(die)發出熱量由芯片封裝向外部散熱,微處理器的表麵溫度和核心溫度之間約有15℃~30℃的溫差,同時因芯片封裝形式不同,及環境溫度的不同而難以確定。至今還沒有一種技術能夠把熱敏電阻埋進芯片內部去,導致現在熱敏電阻隻能測量微處理器的表麵溫度,而無法測量核心溫度。

總之,熱敏電阻不僅測量精度難以保證,更重要的是無法檢測到熱源的真實溫度。

由於熱敏電阻先天不足帶來了一個十分嚴重的問題∶表麵溫度不能及時反映微處理器核心溫度變化,用專業術語說就是存在一個時間滯後的問題。因為核心溫度變化之後要經過一段時間才能傳送到微處理器表麵。相比之下,表麵溫度反應十分遲鈍,其升溫速度遠不及核心溫度,當核心溫度發生急劇變化時,表麵溫度隻有“小幅上揚”。Pentium 4和Athlon XP等最新的微處理器,其核心溫度變化速度達30~50℃/s,核心溫度的變化速度越快,測量溫度的延遲誤差也越大。在這種背景之下,如果再以表麵溫度作為控製目標,保護電路尚未做出反應,微處理器可能已經命歸黃泉了。

為了解決熱敏電阻無法測量微處理器核心真實溫度的問題,Intel在Pentium Ⅱ和Celeron處理器中植入了熱敏二極管(Thermal Diode,或簡稱作Thermodiode)直接測量處理器核心溫度,開創了半導體測溫技術的先河。此後的Pentium Ⅲ和Pentium 4芯片中都植入了熱敏二極管,AMD在Athlon和Duron處理器中也植入了熱敏二極管。現在許多主板都在監控芯片內設置有熱敏二極管,用於檢測芯片所在位置的環境溫度。

小知識∶如何知道BIOS或測試軟件顯示的微處理器溫度是表麵溫度還是核心溫度?
就目前來看,無論使用Intel還是AMD的微處理器,已很少使用熱敏電阻測量微處理器表麵溫度了,所以BIOS與檢測軟件所顯示的微處理器溫度都是指微處理器的核心溫度。而在Pentium Ⅱ以前,微處理器溫度通常是指表麵溫度;Pentium Ⅱ及以後的微處理器內都集成有熱敏二極管,所測量溫度就是核心溫度。不過,在過渡期內許多主板上仍在微處理器插座下麵保留了熱敏電阻,這樣就同時能檢測到兩個不同的微處理器溫度值,通常BIOS中顯示的是微處理器的外部溫度,而檢測軟件所測試的是核心溫度。

熱敏二極管又叫熱敏PN結(Thermal PN junction),基於矽基PN結正向電壓和溫度的關係,其測溫範圍在-55℃~+150℃之間。與熱敏電阻一樣,熱敏二極管屬於變阻器件,其等效電阻值是由其工作溫度所決定。

二、第一代溫度監控係統,並不可靠

微處理器溫度監控係統根據控製電路所處的位置,可分為外部控製型和內部控製型兩種基本結構。外部控製型監控係統,現在被稱為第一代溫度監控技術,它有三種基本存在形式∶一種是采用獨立的控製芯片,如WINBOND的W83627HF、ITE的IT8705、IT8712等,這些芯片除了處理溫度信號,同時還能處理電壓和轉速信號;第二種形式是在BIOS芯片中集成了溫度控製功能;第三種形式是南橋芯片中集成溫度控製功能。在現行的主板中,三種形式同時存在,如果主板說明書中沒有特別說明,我們一時難以判斷監控硬件的準確位置。

監控芯片通常是可編程的ASIC微控製器,應用軟件經BIOS將控製命令和數據經接口電路發送給監控芯片,修改其控製參數,一些監控軟件正是通過這種途徑來顯示和調整微處理器電壓和風扇轉速的。

監控芯片是溫度監控係統的核心,其質量優劣對控製性能有很大的影響。但由於監控芯片種類繁多,在功能和性能上有很大差異,給使用和鑒別帶來一定困難。

首先,各種監控芯片在控製功能上有很大差異(譬如某個芯片可以控製兩個風扇,多數則隻能控製一個風扇),通常引腳數越多,功能越強。

其次,即便功能相同的芯片,性能上也會有差別,其中一個重要的區別在數據位的不同(譬如MAX6682的分辨率是10位,TC1024為9位,FMS2701為8位),位數少的芯片輸出的數據精度自然也就降低了(8位芯片溫度轉換誤差為±3℃)。另一個性能差別在采樣速率上,如果采樣速率低(例如FMS2701的采樣速率為1s),必然增加信號延遲,無法及時跟蹤微處理器溫度的變化。

第一代微處理器溫度監控技術建立在依靠外援的基礎上,當微處理器過熱而超過極限溫度時,由係統向微處理器發出HLT命令,讓係統暫停。因為熱量可能導致係統不穩定,如果電腦死機或程序進入死循環,就會失去監控作用,也就無法保護微處理器了。同時,由於構成監控係統的元器件較多,戰線拉得很長,導致反應速度慢,無法及時跟蹤微處理器溫度變化。而現在的微處理器不僅核心溫度高,而且升溫速度快(最高可達50℃/s),一旦災難來臨必有“遠水不解近渴”之憂患。


三、第二代溫度監控技術,Pentium 4燒不死的秘密

為彌補了第一代溫度監控技術的缺陷,提高監控能力,Intel開發了第2代溫度監控技術。

第二代溫度監控係統的一個突出特點是在微處理器內部集成了溫度控製電路(Thermal Control Circuit,TCC),由微處理器自身執行溫度控製功能,同時,微處理器內設置了兩個相互獨立的熱敏二極管,D1是本地熱敏二極管,所測信號提供給TCC,D2則為遠端熱敏二極管,其測量結果用於實現主板控製功能及顯示核心溫度 8。

我們先看看TCC是如何發揮作用的。TCC定義了兩種工作狀態:激活態和非激活態。TCC的狀態與PROCHOT#信號的電平高低相對應,PROCHOT#為低電平時,TCC為激活態,否則處於非激活態。當微處理器核心溫度達到警戒溫度(Warning Temperature)時,溫度檢測電路將PROCHOT#信號置為低電平,從而激活TCC。TCC激活後,采取“抑製任務周期”(Throttle duty Cycle)的方式(如圖9),使微處理器有效頻率下降,從而達到降低功耗的目的。當微處理器的溫度降低後(低於警戒溫度1℃以上),TCC回到非激活態,微處理器恢複到“標稱頻率”。可見,TCC實質上是一個由微處理器溫度控製的頻率調節器。

如果發生災難性冷卻失敗的情況,使微處理器溫度超出極限溫度(thermal Trip),TCC將設THERMTRIP#信號為低電平,BIOS芯片檢測到這一變化後,直接關閉微處理器時鍾信號,並通過PWM控製器封鎖VRM向微處理器供電,直到溫度降到極限溫度以下,RESET#信號有效,THERMTRIP#才會重新變為高電平,係統才能繼續工作。否則THERMTRIP#總為低電平,係統就停留在暫停狀態。“當微處理器離開風扇的時候”,Pentium 4微處理器之所以能夠安然無恙,答案就在這裏。

各款微處理器的警戒溫度和極限溫度值是製造商根據微處理器的製造工藝和封裝形式及封裝材料確定的,並在技術白皮書中給出。為防止用戶自行設定而帶來危險,Intel已將Pentium 4微處理器的警戒溫度和極限溫度寫入TCC內的ROM單元中,用戶無法修改它們。

兼顧性能和可靠性是第2代溫度監控技術的優秀之處。由公式P = CV2f(其中C是等效電容容量;V是工作電壓)可知,頻率f與能耗P之間是一種線性關係,降低頻率是減少發熱量的有效途徑。這種通過降低有效頻率實現降溫的措施,比之以前那種關斷時鍾信號的做法顯然要聰明一些,避免了因強行關閉微處理器,而導致數據丟失的情況。

Pentium 4處理器中的PROCHOT#引腳還有另外兩個實用的功能。其中的一個功能是向主板發出報警信號——PROCHOT#引腳為低電平時,說明微處理器核心溫度超過了警戒溫度,此時微處理器工作在較低的頻率上。如果超出警戒溫度(電腦用戶利用工具軟件可以獲得這個信息),應及時檢查散熱器安裝是否妥當,風扇轉速是否正常。

PROCHOT#引腳的另一個功能是可以保護主板上的其他元件。PROCHOT#引腳采用雙工設計——信號既可以從這根信號線出去,也能進得來。主板設計者可利用這一特性為供電模塊提供保護,當供電模塊的溫度超出警戒溫度時,監控電路輸出一個低電平到PROCHOT#引腳以激活TCC,通過降低微處理器功耗來達到保護供電模塊的目的。

可見,Pentium 4處理器不僅能自保平安,還能對供電電路提供保護,細微之處體現出設計者的良苦用心。同時,將TCC集成到微處理器內不僅對自身更加安全,也簡化了主板設計,降低了主板製造成本。可以說,第2代溫度監控技術是一個給微處理器製造商與下遊主板廠商帶來雙贏的技術。

小知識∶如何設置BIOS中的“Processor speed throttling”?
Pentium 4主板的BIOS中通常有“Processor speed throttling ”之類的選擇項,用於選擇超警戒溫度後處理器任務周期(duty cycle)占全部周期的比例,在處理器頻率不變的情況下,這個比例越大說明處理器的工作效率越高。其中有“Automatic”和“On demand” 兩種選擇,“Automatic(自動)”表示任務周期的占空比為50%,也就是說比正常頻率低一半;“On demand(按要求)”下麵有12.5%、25%、…、87.5%等多種選擇,選擇的數值越小,則任務周期的比例越小,降頻幅度也越大。

四、溫度控製,僅靠降頻是不夠的

以降低頻率為手段來保障微處理器安全,是第2代溫度監控技術的主要思想。但是這種技術也存在明顯的缺陷:當溫度超過警戒溫度時,雖然可以勉強運行,但係統整體性能卻隨著微處理器頻率的下調而降低到一個很低的水平。假如一個3.8GHz的處理器隻能長期工作在2GHz的速度上,這等於讓用戶花錢買了奔馳,卻隻能當奧拓使用。如果真是這樣的話,第二代溫度監控技術就算不上成熟的技術,而隻不過是個苟且小計。

在係統性能不受損失的前提下保證微處理器安全穩定運行,這才是我們希望看到的結果。事實上,影響微處理器溫度的因素,除了頻率外,還有微處理器供電質量和散熱效率。所以,Pentium 4溫度監控係統采取了全麵的監控措施,把頻率、電壓和散熱三個控製參數視為保障微處理器安全運行的三駕馬車。


在供電方麵,單純采用多相供電結合大電容濾波的傳統方法已難以滿足Pentium 4(Prescott)處理器的要求,為此,Intel製定了新的電壓調節標準VRD10,將VID(電壓識別碼)從VRM9的5位升級到6位,使電壓調整精度更高。VRD10還首次公開了Dynamic VID(動態電壓識別碼)技術,可根據微處理器負荷變化隨時調節供電電壓,見縫插針地降低功耗。此外,Dynamic VID技術還能限製電流突變,避免微處理器偶然燒毀的可能。

在散熱方麵,Intel在Pentium 4 processor Thermal and Mechanical Design Guidelines(Pentium 4處理器熱量和構造設計指南)中要求,微處理器的散熱器必須具有足夠強的散熱能力,以便及時將微處理器所產生的熱量帶走。同時要求風扇能夠輸出轉速信號,以實現對風扇的監控,防止因風扇停轉而導致微處理器過熱的情況發生。由於微處理器所產生的熱量因工作負荷變化而有很大變化,因此也要求風扇轉速按需要自動調節,以降低不必要的能源消耗和噪音汙染。

小知識∶如何判斷風扇是否具有測速功能?
有些電腦BIOS中顯示風扇轉速為0,而實際上風扇卻在正常旋轉,通常是因為風扇沒有測速功能。風扇是否具有測速功能,可以從風扇連線的數目來區別,具有測速功能的風扇至少有三根線,通常紅色線為+12V,黑色線為地線,黃色線或白色線就是測速信號線。如果還有第四根線——一根藍色的信號線,那是用於變頻調速的脈寬調製信號PWM。



北橋芯片是微處理器與BIOS芯片進行數據交換的橋梁,監控芯片與北橋芯片三個信號中,SDA是SMBus雙向數據線,它既可以將電源電壓、微處理器核心溫度、風扇轉速和環境溫度等全部監控信息發送給BIOS實現進行顯示,也可以由BIOS將來自係統的命令發送給監控芯片(前麵已經介紹過,監控芯片是可編程的ASIC,所以完全有能力處理這些來自係統的命令),實現控製參數的修改或調節功能;SCL是來自係統的時鍾信號,這是監控芯片與北橋芯片以及監控芯片與微處理器之間進行同步通信的必要條件;SMBALART#在此定義為監控芯片通過SMBus接口發往BIOS芯片的報警(ALART)信號。

監控芯片與微處理器之間通過4個引腳進行聯絡:微處理器將電壓識別碼VID發送給監控芯片,由它可算出微處理器理論電壓值(來自電源模塊的Vcore才是微處理器的實際電壓值);D2+和D2-是微處理器核心溫度信號(“D”在此表示Diode,而不是Data),當微處理器溫度超過警戒溫度時,微處理器通過PROCHOT#信號通知監控芯片,而當電源模塊電流超標時,監控芯片將PROCHOT#信號置為低電平,激活微處理器內的TCC,對微處理器和供電模塊進行降溫。這些控製功能完全體現了第2代溫度監控技術的特點。

五、現有技術並不完善

微處理器溫度監控係統在電腦中雖然毫不起眼,人們很少去注意它,但它對整個係統來卻起著十分重要的作用,像一位藏在後麵的天使,默默地守護著我們的電腦。從1993年Intel推出第一款奔騰微處理器以來,十年之間主頻提升了數十倍,期間微處理器技術的發展已不再是簡單的頻率提升,係統設計者必須在性能、耗電量、噪音和熱量四個因素之間進行綜合平衡。正因為如此,溫度監控技術經曆了從無到有、逐漸成熟的發展過程,從一個側麵見證了微處理器的發展史。據說即將推出的Pentium 4 6XX係列處理器將集成Enhanced SpeedStep技術,微處理器自身溫度監控功能得到強化。

我們也應看到,現有的監控技術水平還遠沒有達到理想的狀態,在溫度測量精度、監控係統的及時性和降溫技術的有效性等方麵還有待提高,電壓、頻率和散熱三個子係統目前處於各自為戰的狀態。未來的溫度監控技術必然朝著更精確、更有效、更智能的方向發展。



請您先登陸,再發跟帖!

發現Adblock插件

如要繼續瀏覽
請支持本站 請務必在本站關閉/移除任何Adblock

關閉Adblock後 請點擊

請參考如何關閉Adblock/Adblock plus

安裝Adblock plus用戶請點擊瀏覽器圖標
選擇“Disable on www.wenxuecity.com”

安裝Adblock用戶請點擊圖標
選擇“don't run on pages on this domain”