CPU比較

SSE4.1(Supplemental Streaming SIMD Extensions 4.1)

SSE4.1 (ストリーミング SIMD 拡張機能 4.1) は、マルチメディアやその他の計算集約型アプリケーションのパフォーマンスを向上させる新しい命令を追加する x86 命令セット アーキテクチャの拡張機能で、Intel によって 2007 年に Penryn マイクロアーキテクチャとともに導入された。

SSE4.1 は、ビデオのエンコードとデコード、画像処理、オーディオ処理などのマルチメディア処理のパフォーマンスを向上させるために特別に設計されたいくつかの新しい命令と機能を提供している。

SSE4.1 の主な機能について

  1. ベクトル化された整数命令:
    SSE4.1 には、128 ビット SIMD (単一命令、複数データ) レジスタ上で動作する一連の新しい命令を追加されている。これらの命令は主に整数演算に焦点を当てており、データのシャッフル、ブレンディング、バイト単位の操作などのタスクのパフォーマンスを向上させる。
  2. 文字列とテキストの処理命令:
    SSE4.1 では、文字列とテキストを効率的に処理するためのいくつかの命令が導入されている。たとえば、PCMPESTRI 命令と PCMPISTRI 命令は文字列比較演算の実行に使用でき、PCMPESTRM 命令と PCMPISTRM 命令は文字列内のパターンの検索に有効となる。
  3. CRC32 命令:
    SSE4.1 には、効率的な巡回冗長検査 (CRC) 計算を可能にする専用の CRC32 命令が含まれています。この命令は、データ送信時のエラー検出など、チェックサム計算を必要とするアプリケーションで特に有効となる。
  4. DPPS および DPPD 命令:
    SSE4.1 では、DPPS (パックド単精度浮動小数点の内積) 命令と DPPD (パックド倍精度浮動小数点の内積) 命令が導入されていてグラフィックスや信号処理アプリケーションで一般的に使用される、パックされた浮動小数点値の 2 セット間の効率的なドット積計算が可能となる。

SSE4.1 は、Penryn マイクロアーキテクチャから始まり、Nehalem、Sandy Bridge、Ivy Bridge、Haswell、Broadwell、Skylake、および新しいアーキテクチャを含むそれ以降の世代のさまざまな Intel プロセッサでサポートされている。Bulldozer マイクロアーキテクチャ以降の AMD プロセッサも SSE4.1 をサポート。SSE4.1 命令を利用するには、SSE4.1 サポートを有効にしてアプリケーションを特別にコンパイルする必要がある。