 |
米ARC International社は、プロセッサの性能向上に向けて、SIMD技術およびマルチコア技術の開発に注力する。同社のチーフ・アーキテクトを務めるNigel Topham氏(写真)が「マイクロプロセッサフォーラム」で明らかにした。
同氏は組み込みシステムの性能向上に向けた取り組みとして「VLIW(Very Long Instruction Word)」、「スーパースケーラ」、「SMT(Simultaneous MultiThreading)」、「データレベルの並列化」、「プロセッサの並列化」が考えられるとしながらも、「これらのうち3つ(VLIW、スーパースケーラ、SMT)については我々は問題があると考えている」と述べた。それぞれの問題点としてVLIWはコンパイラが複雑になる点、スーパースケーラはハードウエアが複雑になる点、SMTは確かにスループットを向上させるものの、その効果は限られたコア(比較的大きく、かつ非効率的なもの)でしか期待できない点を挙げた。
そしてデータレベルの並列化における同社のSIMD(Single Instruction Multiple Data)技術について述べた。同社は2005年10月25日に米国でSIMD技術に基づく104個の拡張命令セットを公開している(日本発表は2005年11月17日)。ARC750Dコアに向けたこのSIMD拡張命令は、128ビットデータの並列処理が可能。既存のARCompact Instructionアーキテクチャとの互換性がある。ARC750Dコアは、90nmプロセスの場合700MHz動作が可能で、1.526DMIPS/MHz、1068DMIPS/CPUを実現する。
続いて、SIMD拡張機能をパイプライン実行する場合のフローを示した(図1)。SIMD命令セットは、ARC750Dコア内に格納されている。実行の際には命令がSIMDエクステンション部のコードキューに蓄積され、パイプライン実行される。MPEG画像処理の場合、ここでiDCT(逆離散コサイン変換)が繰り返し実行される。その間にARC750Dコア内では画像データのビットストリームに対するエントロピーデコードを実行する。DMA(Direct Memory Access)部ではリファレンスブロック(過去の画像の一部)と最新のデコード結果を元に最新の画像が生成される。
 |
|
図1 SIMD拡張命令の実行ブロック図
|
このSIMD拡張命令を使用すれば、使用していない場合に比べMPEGやH.264などのマルチメディアアプリケーションの処理を10倍程度まで加速できるという。
(鴨川 学)
|