0.由于对centos不熟悉,以及超算中心的centos版本比较低,实在没法装有些库,于是先换成了ubuntu16.04server。
#一 创建用户
1.1 创建用户
adduser dluser01
passwd xxxxxxxx
dluser01~10
1.2 增加root权限
vim /etc/sudoers
Allow root to run any commands anywhere
root ALL=(ALL) ALL
ubuntu ALL=(ALL) ALL
dluser01 ALL=(ALL) ALL
dluser02 ALL=(ALL) ALL
#二 修改源
参见 http://mirrors.ustc.edu.cn/help/ubuntu.html
#三 安装python2.7
换成ubuntu16.04后自带
四 安装pip
4.0 网速够,ubuntu16.04下 直接sudo apt-get install python-pip python-dev
4.1 安装easyinstall
1 | wget -q http://peak.telecommunity.com/dist/ez_setup.py |
4.2 编译安装python
下载 https://github.com/pypa/pip/releases
1 | tar zvxf pip-9.0.1.tar.gz #解压文件 |
4.3 修改pip源(阿里源)
1 | cd ~ |
五 安装NVIDIA驱动
5.1 查找对应驱动
下载并传至服务器,进入root
1 | sudo init 3 |
六 安装cuda
6.1 下载
下载地址
下载runfile。。
6.2安装
1 | sudo sh xxxxx.run |
6.3 配置环境变量(当前用户)
1 | sudo vim ~/.bashrc |
七 安装cudnn
与8匹配的是cudnn5.1,下载地址
首先需要注册,填一个问卷。
然后下载这个cuDNN v5.1 Runtime Library for Ubuntu14.04 (Deb)
16.06的那个不是amd64平台的。。下载14.04的
1 | sudo dpkg -i libcudnn5_5.1.10-1+cuda8.0_amd64.deb |
八 安装tensorflow gpu
为了保证稳定,不在root配置tensorflow,转而在各个用户下配置,所以需要每个用户配置下pip源(参照上文),配置好之后,执行
1 | pip install tensorflow-gpu |
注意,环境变量也是随着用户的,所以每增加一个用户,需要重新配一下这个用户的环境变量,打开python测试一下:
1 | dluser02@ubuntu:~$ python |
注意,安装版本过低,建议按照官网推荐的方法,找到gpu字样
1 | sudo pip install https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-1.0.1-cp27-none-linux_x86_64.whl |
九 安装keras
装好前面的前提下,直接pip install keras,等待安装好即可,测试如下:
1 | dluser02@ubuntu:~$ python |
注意如果版本过低,去github上面下载源码安装