DRAMで作られたメモリからデータを読み、処理を行ってメモリに書き戻すというのは時間が掛かり効率が悪い。このため、CPUでは小容量だが高速のメモリをキャッシュとして使うが、GPUでは伝統的にローカルな小容量のスクラッチパッドメモリを用いてきた。
従来のGPUは定数やテクスチャ用のキャッシュを持っていたが、これらはCPUで言えば命令キャッシュのような読み出しオンリーのキャッシュで、書き込みが行えるデータキャッシュを持っていなかった。このため、高速に読み書きが必要なデータはローカル ...