跟某石油公司信息中心的一位工程师聊天,他说刀片真是很适合石油这种并行计算量非常大的行业,“就是现在的刀片服务器散热量有点可怕”,他犹豫了一下说。
原来,年初的时候,他们搭建了一个基于300多片刀片服务器的高性能集群系统,跑油田的勘探业务。比起以前的老集群系统,新的刀片集群系统从速度上的确快了许多,而且现在的系统携带的软件分发工具、网络监测工具、系统资源检测工具等很多,从管理上来说,也的确比以前方便了。但是,刀片运行时间长了以后,大家感觉有一点越来越不舒服,就是一靠近刀片机架旁边,就感觉烤得慌。
“说实话就是一个大烤箱”,工程师笑着说,“在转换成热能之前,那可是电能啊!”
市场上主流的刀片服务器提供商,在发布产品的时候,一定会着重介绍功耗和散热的问题。功耗方面,刀片应该说基本上走出了动不动就跳闸的初级阶段。而关于散热,厂商们也是没少动脑筋,有的采用了水冷方式,有的是一个7u机箱里的14片刀片共用2个大风扇,类似“中央空调”的思路,有的则宣布采用了垂直吹风的方式,不管用的哪种方式,可是厂商们都信誓旦旦地说,散热早就不是问题了。如果问得紧了,可能就会说:“是会感到一点点热,但是绝对不会损害到系统的运营以及数据中心的环境。”
可是,我曾经看到这样一个数字,说是IBM自己测的——虽然刀片服务器的整体耗电量减少了,但是单颗处理器所占的耗电比例从机架服务器的30%提高到了整体的46%。
也就是说,问题已经越来越底层化了,而且可以看出现在已经牵扯到处理器端了。
看来,要彻底根治刀片的“发烧”问题,不仅服务器厂商还要在技术上多下功夫,处理器厂商也要多动脑筋、多想想用户才是。