Ubuntu(通用版本安装)
(一)安装Server 24.04.4为例:
1、启动镜像

2、默认英文

3、默认

4、键盘布局(默认)

5、设置网卡(选择自己需要的IP协议)设置为DHCP动态获取IP


6、默认即可


7、选择安装的硬盘



8、设置用户名和密码以及必备的软件



9、开始安装


10、拔掉U盘



(二)安装驱动
[!NOTE]
这里换源跳过
1、安装基本依赖
1
| sudo apt install -y build-essential gcc g++ make cmake pkg-config
|
2、查看支持的驱动版本:
1
| sudo ubuntu-drivers devices
|
3、选择自己需要的驱动
1
| sudo apt install nvidia-driveers-580-server-open
|
4、安装cuda
[!IMPORTANT]
这里推荐的是12.8.0版本
1
| wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda_12.8.0_570.86.10_linux.run
|
1、运行安装
1
| sudo sh cuda_12.8.0_570.86.10_linux.run
|
2、配置变量
[!IMPORTANT]
根据自己的目标地址配置
1 2
| export PATH=/usr/local/cuda-12.8/bin${PATH:+:$PATH} export LD_LIBRARY_PATH=/usr/local/cuda-12.8/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
|
或者这样写
1 2
| export PATH="/usr/local/cuda-12.8/bin:$PATH" export LD_LIBRARY_PATH="/usr/Local/cuda-12.8/lib64:$LD_LIBRARY_PATH"
|
3、互联工具安装(nvlink)
[!WARNING]
这里必须和驱动版本一样
1
| sudo apt install nvidia-fabricmanager-580
|
开启服务
1
| sudo systemctl enable --now nvidia-fabricmanager
|
(三)服务器BMC网络配置
BMC(Baseboard Management Controller)修改用户名的方法取决于你使用的管理方式(Web界面 / IPMI命令行 / Redfish / 厂商工具)
通过 IPMI 命令行(最通用,推荐)
1
| sudo apt install ipmittool
|
2、 查看当前用户列表
1
| sudo ipmitool user list 1
|
说明:
3、修改用户名
1
| sudo ipmitool user set name <用户ID> <新用户名>
|
示例:
1
| sudo ipmitool user set name 2 admin_new
|
4、(可选)修改密码
1
| ipmitool user set password <用户ID> <新密码>
|
5、启用用户
1
| ipmitool user enable <用户ID>
|
6、设置权限(管理员)
1
| ipmitool channel setaccess 1 <用户ID> callin=on ipmi=on link=on privilege=4
|
权限说明:
创建用户
1.查看可用用户ID
1
| sudo ipmitool user list 1
|
示例:
1 2 3
| ID Name Callin Link Auth IPMI Msg Channel Priv Limit 2 ADMIN true true true ADMINISTRATOR 3 false false false NO ACCESS
|
👉 找一个空的(Name 为空的),比如 ID=3
2.设置用户名
1
| sudo ipmitool user set name 3 newuser
|
3.设置密码
1
| sudo ipmitool user set password 3 'YourPassword123!'
|
4.启用用户
1
| sudo ipmitool user enable 3
|
6.设置权限(管理员)
1
| sudo ipmitool channel setaccess 1 3 callin=on ipmi=on link=on privilege=4
|
权限等级说明:
1 = Callback
2 = User
3 = Operator
4 = Administrator(一般用这个)
7.验证是否成功
1
| sudo ipmitool user list 1
|
BMC 网络配置
1.查看当前
1
| sudo ipmitool lan print 1
|
👉 这里的 1 是常见的 LAN 通道(大多数主板都是 1)
你会看到:
- IP Address
- Subnet Mask
- Default Gateway
2.设置为静态 IP
关闭 DHCP
1
| sudo ipmitool lan set 1 ipsrc static
|
设置 IP
1
| sudo ipmitool lan set 1 ipaddr 192.168.1.100
|
设置子网掩码
1
| sudo ipmitool lan set 1 netmask 255.255.255.0
|
设置网关
1
| sudo ipmitool lan set 1 defgw ipaddr 192.168.1.1
|
(可选)开启访问
有些机器默认没开 LAN 访问:
1
| sudo ipmitool lan set 1 access on
|
3.确认生效
1
| sudo ipmitool lan print 1
|