gpu | 开发者交流平台

仅有一个线程的块是否高效？

英文: Are blocks of only one thread efficient? 问题假设没有线程间通信和GPU上的其他进程，在N <= 32且32 < N < 32 *...

2023年7月24日162评论

英文: How to tune the SM utilization (across the entire GPU) of a CUDA kernel? 问题我想尝试使用CUDA MPS（Multi...

2023年7月24日192评论

英文: Is there a way to know vendor specific GPU rasterization differences? 问题让我澄清一下。假设我只想渲染一条线（或三角形）...

2023年7月20日139评论

英文: CUDA math function register usage 问题我正在尝试理解在使用一些内置的CUDA数学操作时所产生的显著寄存器使用情况，比如atan2()或除法，以及如何减少/消...

2023年7月14日186评论

英文: Pytorch version for cuda 12.2 问题抱歉，我无法提供代码部分的翻译。以下是翻译好的内容： "我无法找到适用于CUDA驱动程序12.2的PyTorch版本...

2023年7月13日161评论

英文: Difference between __kernel and KERNEL_FQ in OpenCL 问题在 HashCat 项目中，许多 OpenCL 文件中的内核函数定义如下： ```...

2023年7月7日184评论

英文: How should I handle Vulkan objects for issuing commands 问题好的，以下是翻译好的部分：好的，我们有队列，我们将命令缓冲提交给队列，我...

2023年7月3日261评论

英文: how can I connect to a remote machine like ssh 问题我想创建一个RTX租赁网站，这样任何拥有RTX的人都可以将其租给我，我会支付他租金。但是如...

2023年7月3日166评论

英文: Is it possible to check if GPU is available without using deep learning packages like TF or torc...

2023年6月29日183评论

英文: How does a GPU access addresses or indices greater than 32 bit from the shader? 问题以下是您要翻译的内容： &...

2023年6月26日172评论