Hyper-Threading

耐久試験をもう一回やろうと思って調べたら、LinpackのプログラムはIntelからAVX対応のものが提供されており、それを使うとより高性能かつ高負荷がかかるとのことだったので、入れ替えてやってみた。
4スレッド時48GFLOPS→88GFLOPSとほぼ倍のベンチマーク結果になり、温度も71度まで上昇した。
グリスがうまく塗れてないのか…?という疑惑が出てきたので、一回バラしてみよう。


それはさておき、Linpackを実行するスレッドの数を変化させていくと物理コア数と等しい4スレッドまで、Turbo Boostの利き具合と思しき誤差はあるもののほぼ線形に性能が増える。
しかし、5スレッドから8スレッドまではほぼ性能は横ばいで下がることもあった。
これはHyper-Threadingで論理コア数は8コア分あるものの、浮動小数点演算器を含む演算器は4コア分しかないために、浮動小数点を多用するLinpackでは性能が横ばいになるうえに、コンテキストの影響で性能が低下するという理論とあった動きになっているといえる。
逆にHTで性能を出そうと思うと、個数に余裕がある整数演算器を使うアプリケーションが良い=エンコードという説明も裏付けている。


やっぱりi5(HTなし4コア)で十分だったかも。