Ubuntu 18.04上安装cuda「建议收藏」

Ubuntu 18.04上安装cuda「建议收藏」一、准备工作参照官网上资料,进行准备工作1.验证自己的电脑是否有一个可以支持CUDA的GPU$lspci|grep-invidia我的显示为TeslaP800ifitislistedinhttp://developer.nvidia.com/cuda-gpus,yourGPUisCUDA-capable2.验证自己的Linux版本是否支持…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

一、准备工作

参照官网上资料 ,进行准备工作

1. 验证自己的电脑是否有一个可以支持CUDA的GPU

 $ lspci | grep -i nvidia 我的显示为Tesla P800

if it is listed in http://developer.nvidia.com/cuda-gpus, your GPU is CUDA-capable

2.验证自己的Linux版本是否支持 CUDA:The CUDA Development Tools are only supported on some specific distributions of Linux. These are listed in the CUDA Toolkit release notes

           uname -m && cat /etc/*release

3. 验证系统是否安装了gcc 在终端中输入: $  gcc –v

4. 验证系统是否安装了kernel header和 package development

sudo apt-get install linux-headers-$(uname -r)

结果显示:升级了 0 个软件包,新安装了 0 个软件包,要卸载 0 个软件包,有 x个软件包未被升级. 表示系统里已经有了,不用重复安装。

 

二、下载cuda并安装(官网步骤

1.首先注意版本!

查看版本之间要求 https://www.tensorflow.org/install/source#linux

Ubuntu 18.04上安装cuda「建议收藏」

gcc需要降级、cudnn需要7,TensorFlow需要1.12.0

 

2.下载

官网下载页面上是最新的10.1版本,在后面的过程中才发现TensorFlow可能还不支持,所以想下载低版本的cuda

下载旧版本的cuda地址,本来想选择cuda 9.* ,但里面Ubuntu最高只支持17.10,我的是18.04,所以只能选择cuda 10.0

Ubuntu 18.04上安装cuda「建议收藏」

2.安装:runfile形式安装据说错误率更少

1) 禁用 nouveau驱动

Ubuntu 18.04上安装cuda「建议收藏」

lsmod | grep nouveau 若无内容输出,则禁用成功

我执行以上操作后,还是有输出,reboot重启后,无输出了。

 

2)执行安装脚本

sudo sh cuda_***_linux.run (你下载的runfile安装包名字)

注意:先accept,安装项里不要选择安装驱动,避免有坑,其他都yes

Ubuntu 18.04上安装cuda「建议收藏」

会提示:

***WARNING: Incomplete installation! This installation did not install the CUDA Driver. A driver of version at least 384.00 is required for CUDA 10.0 functionality to work.忽略就行

可以看到软连接已经指向10.0版本了

Ubuntu 18.04上安装cuda「建议收藏」

3)设置环境变量

在主目录下的~/.bashrc文件添加如下路径

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.0/lib64
export PATH=$PATH:/usr/local/cuda-10.0/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-10.0

用su直接切换到root,再执行 source ~/.bashrc

 

4)检测是否安装成功

Ubuntu 18.04上安装cuda「建议收藏」

出现以下结果

Ubuntu 18.04上安装cuda「建议收藏」Ubuntu 18.04上安装cuda「建议收藏」Ubuntu 18.04上安装cuda「建议收藏」

博客里说这个result为pass则为成功

 

时隔几个月之后,cuda又不能正常使用了

Ubuntu 18.04上安装cuda「建议收藏」

显示是缺失driver(安装的时候选了安,不知为何又bug了)

参照网上的安装步骤

(1)方式1

ubuntu-drivers devices
sudo ubuntu-drivers autoinstall #自动安装

报错

Ubuntu 18.04上安装cuda「建议收藏」

(2)方式2

Ubuntu 18.04上安装cuda「建议收藏」

(3)方式3

只能尝试手动下载,在https://www.nvidia.com/Download/index.aspx官网选择

下载之后 Ubuntu 18.04上安装cuda「建议收藏」,会进入交互界面

提示说一句有410.48版本

但是再用sudo dpkg –list | grep nvi,查不到410.48,用cat /proc/driver/nvidia/version,也是无此文件

交互过程中提示内核版本之类的问题,也是无疾而终

(4)方式4:重装,并选择install driver

Ubuntu 18.04上安装cuda「建议收藏」

发现这次报错了,显示missing recommended library,可由此篇博客解决,但解决之后对驱动没有太大影响

在nvidia安装日志(/tmp/cuda_install_2971.log)里发现是dkms的问题

Ubuntu 18.04上安装cuda「建议收藏」

又寻根到/var/lib/dkms/nvidia/…

找到error:unrecognized command line option ‘fstack-protector-strong’

Ubuntu 18.04上安装cuda「建议收藏」

gcc之前是4.8.5问题,我升级到5.5.0,再重新安装

Ubuntu 18.04上安装cuda「建议收藏」

刚刚dkms的问题没有了,甚至执行王同学的代码都能OK

Ubuntu 18.04上安装cuda「建议收藏」

但存在另一个问题

Ubuntu 18.04上安装cuda「建议收藏」

 

(有人说这个问题不重要)

那难道是没有卸载之前版本的问题吗? sudo apt-get purge nvidia*

一狠心就执行,全部删掉,然后重新sh .run文件

还是不行。。。。重装机器吧。。。

三、安装cudnn

下载地址,需要自行注册,然后选择cuda10.0的对应版本,cudnn 7.4.1

Ubuntu 18.04上安装cuda「建议收藏」

解压缩:tar -xzvf cudnn-9.0-linux-x64-v7.tgz

sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

查看cudnn版本  cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

Ubuntu 18.04上安装cuda「建议收藏」

如果出现所示版本信息,说明安装成功。 

 

四、安装TensorFlow-GPU版本

查看python3对应的TensorFlow安装版本,发现cpu与gpu并存

Ubuntu 18.04上安装cuda「建议收藏」

1.尝试安装对应gpu版本

pip3 install tensorflow-gpu==1.13.1

结果import的时候报错

Ubuntu 18.04上安装cuda「建议收藏」

查了下原因,应该是前面设置的环境变量没有生效,参考博客

(1)临时解决方法1(下次登录失效)

在终端执行前面的的export操作,发现终于能正常运行

Ubuntu 18.04上安装cuda「建议收藏」

(2)临时解决方法2

Ubuntu 18.04上安装cuda「建议收藏」

 

2.判断运行的TensorFlow是cpu还是gpu

# 转自知乎.
a = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a')
b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2], name='b')
c = tf.matmul(a, b)
# Creates a session with log_device_placement set to True.
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))

print(sess.run(c))

Ubuntu 18.04上安装cuda「建议收藏」

可以看到输出信息都是关于GPU的,说明TensorFlow-GPU版本正常工作了

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/193785.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • f stream_fstream

    f stream_fstreamofstream是从内存到硬盘,ifstream是从硬盘到内存,其实所谓的流缓冲就是内存空间;在C++中,有一个stream这个类,所有的I/O都以这个“流”类为基础的,包括我们要认识的文件I/O,stream这个类有两个重要的运算符:1、插入器(  向流输出数据。比如说系统有一个默认的标准输出流(cout),一般情况下就是指的显示器,所以,cout2、析取器(>>)  从流中输入数据

    2022年9月15日
    0
  • spring项目无法引入@Resource注解问题[通俗易懂]

    spring项目无法引入@Resource注解问题[通俗易懂]问题:在spring项目中引入@Resource注解的时候,有红色下划线错误,而且输入注解的时候不能出现自动代码补全。解决办法:Spring项目中缺少javax.annotation包的依赖。在maven配置文件pom.xml中加入依赖。<!– https://mvnrepository.com/artifact/javax.annotation/javax.annotation…

    2022年6月13日
    142
  • 中国主流的大数据分析厂商

    中国主流的大数据分析厂商随着互联网和IT技术的推进,大数据的应用逐渐渗透到各行各业。尤其是数据体量大的互联网、金融、银行、制造行业。大数据正逐渐改变企业的运营模式,市场导向,进而惠及人们的生活。“大数据”这一概念最早在国外被提及。之后国内外兴起了一系列大数据技术,包括大数据硬件类、大数据分析类、大数据数据处理类等等,也因此诞生了一批大数据厂商。其中最为热门的是大数据分析技术,可以直接应用到企业生产经营,来带直…

    2022年5月17日
    42
  • java 函数式编程(java自定义函数)

    以前写过一篇java8的流操作,人们都说流操作是函数式编程,但函数式编程是什么呢?什么是函数式编程什么是函数式编程?它是一种编程范式,即一切都是数学函数。函数式编程语言里也可以有对象,但通常这些对象都是恒定不变的——要么是函数参数,要什么是函数返回值。函数式编程语言里没有for/next循环,因为这些逻辑意味着有状态的改变。相替代的是,这种循环逻辑在函数式编程语言里是通过递归、把函…

    2022年4月18日
    54
  • J2ME中的Hashtable和Vector

    J2ME中的Hashtable和Vector

    2021年8月9日
    48
  • 微商分销系统哪家好,要怎么做?

    微商分销系统哪家好,要怎么做?分销模式的本质是分享经济,wemall微商分销系统将传统商品高昂的推广费用让利给消费者,并抽取一定金额作为分销商的佣金。分销模式使消费者直接与商家沟通,增加用户粘性,促成品牌的口碑转化为流量,相比与零售,分销有着无可比拟的优势,这也使越来越多的微商分销系统涌现出来。微信封杀分…

    2022年5月17日
    33

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号