- 易迪拓培训,专注于微波、射频、天线设计工程师的培养
重装CPU、GPU时代下的机内散热设计(6)实现智能性热量管理的下一步
在电脑系统的散热设计中,有三大领域的工程师必须坐下来一起谈,他们是机构工程师、电子系统工程师及韧体工程师。机构工程师的任务最重,从机壳的造型、内部主机板上各元件的配置、出风口的规划,到散热效益的模拟验证等,都得有完整的考量,他们的专长是在机械与流体力学方面;电子系统工程师则要负责与电子系统相关的散热设计,主要工作在于对热源的温度量测,以及对风扇的控制规划;韧体工程师则要编写与韧体相关的散热执行指令。本文将从电子系统的面向来探讨散热管理的前瞻性技术。
■电子系统散热管理架构
在散热管理上,电子系统负责的工作虽然只有对温度的量测及对风扇的控制,但这却是整个散热系统中最核心的部分。温度感测与风扇控制的规划架构可以有很多种作法,好的规划对于整体的散热效益影响甚鉅;加上目前电脑系统中需侦测和控制温度的元件很多,在规划上必须考量如何进行最佳化的感测及控制电路?控制的模式为何?如何做到最精确的温度感测,以及对风扇做到智能性的控制?这些都是设计上很大的挑战。此外,今日Intel已推出不少散热管理的新技术,包括SST、DTS、PECI等,这些新技术都具有改善散热效益的优势,但工程师必须懂得如何运用这些技术,才能让它们的功能获得完善的表现。
■风扇控制
风扇是将热量从电源供应器、CPU和硬碟处移除的最基本方法。目前每个电脑用的风扇都使用一个无刷式(brushless)的DC马达,这种风扇的效率与马达控制的状况密切相关。无刷式DC风扇马达控制器提供更高等级的系统控制,它整合了一个马达控制驱动器,此驱动器能接收数字及模拟PWM信号,进而提供准确的空气流动和噪音控制。
传统的风扇马达只有两线的输出入控制,只具有接地(GND)和电压(12V)两个接脚,因此若不是将风扇一直打开,就只能基于恆温器(thermostat)型式的输入值,在超过某一特定温度时来打开风扇。进一步的作法是三线风扇,也就是多了一个接脚来传输转速计(tachometer;tach)信号。而Intel最新的作法是再多一个PWM输入接脚的四线风扇,此风扇把PWM的输入视为一个信号值,能在极高的PWM频率下运作,同时还会用到一个更高(kHz范围)PWM频率值。在这个设计中,马达的速度可以降低20%,但仍能可靠地启动。请参考(图一)。
▲图一:风扇的功能从二线进展到三线及四线功能。
■温度感测
所有的热量管理都是从温度的量测开始的。要做到温度量测,方式有很多,包括热电偶(thermocouple)、热敏电阻(thermistor)、温度阻抗型装置(resistance temperature device;RTD)和半导体感测器等。半导体感测器的温度系数较其他方案稍微高一些,在不同的温度时会有不同的偏置值(offset),不过,半导体接合面电压(junction voltage)对应于温度的情况又比其他方案更具有线性化的特征。
另一种更先进的方法是使用二组电流再减去其电压差异来得出更为线性的ΔVbe。在今日的PC中,几乎所有的量测都使用ΔVbe技术,其中的一个二极管是处理器基板二极管(substrate diode)。当制程从90nm微缩到65nm或更小时,这个二极管变得愈来愈不是个理想的二极管,反而是一个可能造成准确性议题的不良电晶体,其增益beta值甚至会小于1。除了beta值的变异外,漏电也是问题的一部分。
为了改善这种问题,Intel推出低电压的两线数位式温度感测器(digital temperature sensor;DTS),这颗DTS的温度感测电路会持续地监控内部温度二极管的基极-射极电压,以及连结到D+和D-接脚的远端二极管。这个晶片将两个模拟电压转换为数字值,并将此资料放到温度暂存器。使用与SMBus相容的序列式介面,用户就可以取得温度暂存器中的资料。请参考(图二)。
▲图二:包含内部ADC、SMBus输出和温度警示的DTS晶片区块图。
温度量测的精确度和范围是温度感测器性能评监的关键,这会影响到风扇控制的效益。除了感测器本身的灵敏性外,感测器所在的位置也是一大关键,当感测器离热源愈近,就愈来显示出实际的温度状况,但以CPU来说,感测器的位置与实际热点会有一段差距,很容易就会产生约10℃的温度差异,这要视两者相隔的距离而定。此外,热点并不是一直都在相同的区域,它会经常的改变。对于单核心来说,这是事实;当走向多核心时,情况只会更糟,即使采用了多个感测器也不能完全解决这个问题。
■智能性热量管理方案
在今日愈来愈复杂的电脑系统中,热量管理方案也得变得更聪明才行。要将热量管理提升到系统等级的智慧性,必须从高度精确的温度感测做起,也就是要能做到±1℃的准确性,并且涵盖了极大的产业应用温度范围。要达成此目标,背后的核心技术可能包括先进能隙(bandgap)、高效能模拟转换流动(analog conversion flow)、内部模拟数字转换器(ADC)和sigma-delta,以及ΔVbe的建置方式等。而温度感测的准确性可以精确的控制风扇并降低耗电,透过智能性冷却还能将噪音降到最低。
有了精确的温度感测,就能为系统控制中的保护频带(Guardband)进行最佳化设计,进而能降低风扇运作时间以及电流洩漏,而精确的控制加上一个封闭迴路的风扇就能提供即时的运作管理。如果温度感测不够准确,很容易导致风扇过早打开,这会造成过度的耗电及风扇噪音;相较之下,精确的感测能够降低70%的风扇运作需求,进而减少约2W的耗电以及约15dBA的风扇噪音。请参考(图三)。
▲图三:温度量测的确确性对CPU温度及风扇速度的Guardband冲击。
除了功耗与噪音议题外,错误的温度感测也会导致系统的严重问题,尤其是无法恰当的保护CPU,进而让处理器愈来愈热、消耗愈多的能量,也缩减了使用寿命;此外,过热的系统会产生当机现象或损毁资料及其他元件。为了提升对系统的管理,具有风扇控制的数位远矩温度感测器还能将感测功能与可调变风扇速度控制整合在一起,进而改善系统效能和增加可靠性。
自动风扇控制让系统设计师能充分利用减少保护频带的好处来为风扇开关的时间做到最佳化的设计。这个封闭迴路系统利用流入或周围温度及有效率的PWM控制来减少升温或降温模式时的风扇启用时间,这类感测器具有最小及最大速度、迟滞(hysteresis)和警示的组态暂存器(configuration register),进而让风扇能基于准确的温度量测来做线性的速度控制。降低启用时间能增加风扇及整个系统在失误(MTBF)和稳定性之间的中间时间(mean time)。请参考(图四)。
▲图四:可变速风扇控制系统建置(以Andigilog aSC7512为例)。
■智能性热量管理的下一步
在Intel推出的散热管理技术中,DTS是针对CPU核心的数字温度感测,PECI则是用来传输DTS所侦测到的温度,而新的SST汇流排具有最大的发展潜力,能够实现真正的智能型风扇或智能型电源供应系统。在今日的系统中,如果风扇没有和主机板相连,就无法对风扇资源进行管理。但透过SST就能够传输从CPU风扇和其他风扇而来的电压与温度资讯,对过去无法控制的热源进行散热管理,同时对噪音控制做进一步的改善。
举例来说,过去电源供应器上的风扇并不会被主机板控制,而不受控制的风扇容易干扰整体机壳中的空气对流,进而阻碍散热的效率。采用单线SST汇流排,只需以最少的变化就能连接上未受控制的风扇,以三线及四线的风扇来说,感测的第三接脚可以用SST来取代,这样就能将指令传给风扇。这种新增的控制有很多好处,例如不只一个风扇在运作的状况下,当两个风扇以很接近的速度在运转时,就会产生更大声的拍击频率(beat frequency)。採用单点的控制,这种情况就可以被避免掉。
至于设备端也要连上SST,这样系统就能同时侦测到设备的温度,并对设备端的风扇进行控制,例如在Intel的主机板中,标准的电源供应连接器 -5V 的供电脚位可以让SST连上这个电源供应器,因为这个电压现在已不使用了。当从主机板到电源供应器或任何热源及风扇都与单线SST进行了连结,散热的控制就建立一条整合性的沟通路径,包括电源供应器、硬碟、存储器、高速视频显示卡等热源的温度、电压参数和风扇的控制指令都可以被传输。请参考(图五)。
▲图五:SST可以让系统中的热源及风扇得到统一的控制。
在了解了热源的位置和机构中风扇的能力后,设计者就能决定那一个风扇具有得到从外而来的冷空气的优先权。在具有额外的SST主通讯能力下,透过与所有散热资源及热源的介面连结,以及经由温度或其他量测来了解特定热源与其他热源的关系,传统的硬件控制器就可以被用来管理这个系统。
更进一步来看,SST能够实现分散式的散热管理系统。也就是依机构中各个设备的实际耗热状况,由控制中心以智能性的演算去配置内部各个风扇的运转状况,以达到最佳的空气流动。此外,在下一代的电脑机壳上可以规划多个通风孔,透过分散式的智能风扇管理策略来更有效率的规划冷、热空气的流进、流出。在此同时,噪音的程度可以透过降低风扇速度来加以控制,并且可避免在机壳内的特定位置产生热空气的累积。
■结论
目前电脑的效能及功能不断提升,但相对的内部核心元件及设备的耗热状况也愈来愈严重,例如CPU的温度可以达到40C,而硬碟甚至可以达到50C。此外,今日的电脑已逐步从书房移到客厅及办公室,因此虽然可以透过风扇来进行散热,但高速的风扇所产生的噪音,却不是市场上所乐见的。
为了因应这些窘况,迫使Intel提供新的BTX架构,如(图六),及低功耗的核心微架构(Core Microarchitecture)处理器,以及先进速度控制(Advanced Speed Control;ASC)的机构设计新概念。在ACS中,机壳内会有一个智慧性的中心来监控所有的温度、检验它的风扇来源、评估该以何种速度来执行风扇的运转,以及如何依多组输入值来进行决定。
▲图六:BTX在许多重要的区域提供平行的空气流动。
这个智能性的控制中心要知道系统中每一个晶片、处理器、存储器控制器和I/O控制器的温度,因为它们都会产生高热。这个系统也需要透过机壳建置时操作的特性化程序来知道,当每个风扇以全速运转、CPU在闲置与全速运作时的状况,以及此时对于每个风扇的冲击影响,进而决定出最佳化转速及造成最小噪音冲击的一套风扇组合。这将是智能性散热管理的必然趋势。