商城首页欢迎来到中国正版软件门户

您的位置:首页 >CentOS Python机器学习框架怎么用

CentOS Python机器学习框架怎么用

  发布于2026-04-27 阅读(0)

扫一扫,手机访问

CentOS 上使用 Python 机器学习框架的实操指南

CentOS Python机器学习框架怎么用

一 环境准备与 Python 安装

想在 CentOS 上顺利跑起机器学习项目,第一步就是把基础环境打扎实。这里以 CentOS 7 为例,带你走一遍标准流程。

首先,更新系统并安装必要的编译工具和基础依赖,这是后续一切操作的前提。打开终端,执行:

sudo yum update -y && sudo yum groupinstall “Development Tools” -y

接下来,安装 Python 3 的核心组件。别只装个 Python 就完事,开发头文件和 pip 包管理工具同样关键:

sudo yum install -y python3 python3-pip python3-devel

如果你打算运行对数值计算性能要求较高的任务,比如涉及大量矩阵运算的模型,那么启用 EPEL 源并安装 OpenBLAS 这类优化库会是个明智的选择:

sudo yum install -y epel-release openblas-devel

最后,一个至关重要的建议:务必在虚拟环境中进行开发。这能彻底避免不同项目间的依赖冲突,让环境保持干净。具体怎么做?我们下一节详细说。

二 选择与安装框架

环境准备好了,接下来就是选择并安装机器学习框架。这里提供两套主流方案,你可以根据习惯和需求来选。

方案 A 原生 venv 虚拟环境(系统自带,轻量)

如果你追求轻量化和对系统层控制,Python 自带的 venv 模块是首选。创建并激活虚拟环境只需两行命令:

python3 -m venv ml-env && source ml-env/bin/activate

激活后,就可以用 pip 安装框架了。对于 PyTorch:

  • CPU 版pip install torch torchvision torchaudio
  • GPU 版:这需要你已预先安装匹配版本的 CUDA 和 cuDNN。例如,针对 CUDA 11.3 的安装命令是:pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113

别忘了把数据科学生态里的“标配”也装上:pip install numpy pandas matplotlib scikit-learn

方案 B Anaconda/Miniconda(依赖管理更强,适合多版本与科学计算栈)

如果你需要频繁切换 Python 版本,或者希望依赖管理更省心,Conda 是更强大的选择。可以先安装轻量化的 Miniconda:

wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh && bash Miniconda3-latest-Linux-x86_64.sh

安装完成后,创建专属环境并激活:

conda create -n ml python=3.9
conda activate ml

在 Conda 环境下安装 GPU 版 PyTorch 会方便很多,因为它能自动处理 CUDA 工具包的依赖。例如:conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch

安装后验证(两版通用)

无论用哪种方式安装,最后都得验证一下。跑一下这段简单的检查脚本,确保框架被正确识别,尤其是 GPU 是否可用:

python - <<‘PY’
import torch
print(“torch:”, torch.__version__)
print(“cuda:”, torch.cuda.is_a vailable())
PY

三 快速上手 PyTorch MNIST 示例

理论说再多,不如亲手跑个例子。下面我们用 PyTorch 训练一个经典的两层全连接网络来识别手写数字(MNIST数据集)。这段代码在 CPU 上就能流畅运行,如果你的环境有 GPU,它会自动利用 CUDA 加速。

直接上代码,关键步骤都加了注释:

import torch, torch.nn as nn, torch.optim as optim
from torchvision import datasets, transforms

# 1. 准备数据:下载MNIST,并做归一化处理
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))])
train_ds = datasets.MNIST(root=‘./data’, train=True, download=True, transform=transform)
test_ds = datasets.MNIST(root=‘./data’, train=False, download=True, transform=transform)

train_loader = torch.utils.data.DataLoader(train_ds, batch_size=64, shuffle=True)
test_loader = torch.utils.data.DataLoader(test_ds, batch_size=64, shuffle=False)

# 2. 定义网络结构:一个简单的两层全连接网络
class Net(nn.Module):
    def __init__(self):
        super().__init__()
        self.fc1 = nn.Linear(28*28, 500) # 输入层到隐藏层
        self.fc2 = nn.Linear(500, 10)    # 隐藏层到输出层(10个数字类别)

    def forward(self, x):
        x = x.view(-1, 28*28)          # 将图片展平
        x = torch.relu(self.fc1(x))    # 激活函数
        return self.fc2(x)             # 输出层

# 3. 初始化模型、损失函数和优化器
model = Net()
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.01)

# 4. 训练循环(这里只跑5个epoch作为演示)
for epoch in range(5):
    for data, target in train_loader:
        optimizer.zero_grad()           # 梯度清零
        output = model(data)            # 前向传播
        loss = criterion(output, target) # 计算损失
        loss.backward()                 # 反向传播
        optimizer.step()                # 更新参数
    print(f’Epoch {epoch+1}, Loss: {loss.item():.4f}')

# 5. 在测试集上评估准确率
correct = total = 0
with torch.no_grad():  # 评估时不计算梯度,节省内存
    for data, target in test_loader:
        output = model(data)
        _, pred = torch.max(output, 1)
        total += target.size(0)
        correct += (pred == target).sum().item()

print(f’Accuracy: {100 * correct / total:.2f}%')

运行起来后,你会看到损失值逐步下降,最终得到一个不错的准确率。这个过程虽然简单,但涵盖了数据加载、模型定义、训练、评估的完整流程,是理解 PyTorch 工作流的绝佳起点。

四 GPU 使用与常见问题

想充分发挥 CentOS 服务器的性能,用好 GPU 是关键。但这一步也是踩坑高发区,主要集中在版本匹配和环境配置上。

驱动与库版本匹配

这是最核心的一条:确保 NVIDIA 驱动、CUDA 工具包、cuDNN 库三者的版本严格匹配。安装后,先用 nvidia-smi 命令查看驱动和 CUDA 运行时版本。

经常遇到的报错,比如 ImportError: libcublas.so.10.xlibcudnn.so.7 找不到,十有八九是版本不匹配,或者库文件路径没有正确添加到系统环境变量 LD_LIBRARY_PATH 中。解决办法就是对齐版本,并在 ~/.bashrc 文件中添加类似 export LD_LIBRARY_PATH=/usr/local/cuda-11.3/lib64:$LD_LIBRARY_PATH 的配置,然后执行 source ~/.bashrc 使其生效。

框架安装与验证

安装 GPU 版 PyTorch 时,pip 安装命令必须指定与系统 CUDA 版本对应的索引。如果使用 Conda,它会自动处理 cudatoolkit 的依赖,相对省心。安装完成后,务必用 torch.cuda.is_a vailable() 返回的 True 来确认 GPU 已被框架识别。

其他框架

除了 PyTorch,TensorFlow/Keras 同样可以在 CentOS 上通过 pip 或 conda 安装。GPU 版本同样需要匹配 CUDA/cuDNN 版本。安装后,可以使用 tf.config.list_physical_devices(‘GPU’) 来验证 GPU 是否可用。其版本匹配和路径配置的逻辑与 PyTorch 类似,核心原则都是“对齐版本,配置路径”。

本文转载于:https://www.yisu.com/ask/22241327.html 如有侵犯,请联系zhengruancom@outlook.com删除。
免责声明:正软商城发布此文仅为传递信息,不代表正软商城认同其观点或证实其描述。

热门关注