在测试一段包含内存错误的 CUDA 时,我的屏幕被卡住了。重新启动后我无法再检测到显卡。我的代码是否有可能物理损坏该卡?
这发生在 Ubuntu 14.04 下。我不知道该卡的型号,因为我无法检测到它,但我记得它是一张相当新的卡。
最佳答案
感谢所有评论,我解决了问题。
我将列出我所采取的行动。我不确定它们是否都有效,但最终问题得到了解决。
首先,我断开了显卡的连接并在没有显卡的情况下重新启动。后来我再次插上卡并重新启动。我被带到一个菜单,据说我正在低图形模式下运行。我打开一个 tty
(ctrl+alt+1) 并尝试使用以下命令重新安装 Nvidia 驱动程序说明here .
它最初失败是因为 nouveau 驱动程序正在运行(我认为这是整个问题的罪魁祸首)。
我按照此 link 将驱动程序列入黑名单.
总之,创建文件/etc/modprobe.d/blacklist-nouveau.conf
并添加:
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
然后我重新启动。那时我的屏幕开始正常工作,但我无法启动 ubuntu
桌面。我重新安装了cuda驱动程序(有一些错误,但不是 fatal error )。
然后我重新启动,屏幕又恢复正常了。
回答主要问题:我通过测试CUDA
代码没有损坏显卡。
关于cuda - CUDA 代码会损坏 GPU 吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26060762/