CUDAランタイム¶
ランタイムはcudart
ライブラリに実装されていて、cudart.lib
またはlibcudart.a
を使って静的にリンクするか、cudart.dll
またはlibcudart.so
を使って動的にリンクする。
cudart
の全てのエントリーポイントはcuda
から始まる。
デバイスメモリでは、デバイスメモリの管理に使われる関数の概要を述べる。
共有メモリでは、性能を最大化するために共有メモリの使い方を述べる。
ページロックドホストメモリでは、ホストとデバイス間のデータ転送を行うカーネルの実行をオーバーラップするために使われるページロックドホストメモリを紹介する。
非同期並列実行では、コンセプトといろいろなレベルでの非同期並列実行を行うためのAPIを述べる。
マルチデバイスシステムでは、プログラミングモデルが同じホストに付けられた複数のデバイスを持つシステムにどのように拡張されるかを述べる。
エラーチェックでは、ランタイムによって発生したエラーを適切に確認する方法を述べる。
コールスタックでは、CUDA C++コールスタックを管理するために使われる関数を述べる。
テクスチャとサーフェスメモリでは、デバイスメモリにアクセスする別の方法を提供するテクスチャとサーフェスメモリ空間について述べる。これらはGPUのテクスチャハードウェアのサブセットも提供する。
グラフィックとの相互運用性では、ランタイムがOpenGLとDirect3Dと相互運用するために提供する、さまざまな関数を紹介する。