英文: Is there a CUDA equivalent to the OpenCL shuffle operation? 问题 这个链接描述了如何使用掩码来对矢量类型的元素进行洗牌。CUDA 中...
访问向量类型的第i个组件
英文: Access i'th component of vector type 问题 有没有一种方法可以访问类似int4的向量类型的第j个分量?以下是我目前的方法,但是否有更简单的方法? i...
随机排列某些 OpenCL/CUDA 索引
英文: Randomizing OpenCL/CUDA indexing by some permutation 问题 通常,我在OpenCL中使用整数大小vdimx、vdimy和vdimz的floa...
Unable to use GPU in custom Docker container built on top of nvidia/cuda image despite –gpus all flag
英文: Unable to use GPU in custom Docker container built on top of nvidia/cuda image despite --gpus al...
你可以在我的CMake配置中如何设置nvcc的-arch=sm_NN参数?
英文: How can I set -arch=sm_NN of nvcc in my CMake configuration? 问题 我有一个 .cu 文件,其中使用了 atomicCAS,输入参数...
获取PyTorch中GPU的CUDA计算能力如何?
英文: How to get CUDA compute capability of a GPU in Pytorch? 问题 这个问题非常简单:我的一个用户在使用PyTorch时遇到了一个错误: 找到...
cuModuleGetSurfRef和cuModuleGetTexRef的替代方法是什么?
英文: What's the replacement for cuModuleGetSurfRef and cuModuleGetTexRef? 问题 CUDA 12 表示这两个函数已弃用: ...
Cuda 使用模板类 / 将 Lambda 传递给非类函数
英文: Cuda using template class / passing lambdas to non-class function 问题 第一个程序(ts0.cu)编译和运行成功,产生了预期的...
寄存器是如何分配给GPU内的线程的?
英文: How are registers allocated to threads inside a GPU? 问题 在GPU内部,每个线程的寄存器数量是如何确定的?我想知道GPU是否有每个SM可以...
如何使用cuda-gdb进行Python调试?
英文: How to use cuda-gdb python debugging? 问题 我写了一个名为hello.py的简单文件 print("hi") 然后运行 cuda-gdb ...
7