找回密码
 立即注册
首页 业界区 业界 深度学习模型在C++平台的部署

深度学习模型在C++平台的部署

琴丁辰 昨天 22:35
一、概述

  深度学习模型能够在各种生产场景中发挥重要的作用,而深度学习模型往往在Python环境下完成训练,因而训练好的模型如何在生产环境下实现稳定可靠的部署,便是一个重要内容。C++开发平台广泛存在于各种复杂的生产环境,随着业务效能需求的不断提高,充分运用深度学习技术的优势显得尤为重要。本文介绍如何实现将深度学习模型部署在C++平台上。
二、步骤

  s1. Python环境中安装深度学习框架(如PyTorch、TensorFlow等);
  s2. P        ython环境中设计并训练深度学习模型;
  s3. 将训练好的模型保存为.onnx格式的模型文件;
  s4. C++环境中安装Microsoft.ML.OnnxRuntime程序包;
  (Visual Studio 2022中可通过项目->管理NuGet程序包完成快捷安装)
  s5. C++环境中加载模型文件,完成功能开发。
三、示例

  在Python环境下设计并训练一个关于手写数字识别的卷积神经网络(CNN)模型,将模型导出为ONNX格式的文件,然后在C++环境下完成对模型的部署和推理。
1. Python训练和导出
  1. import torch
  2. import torch.nn as nn
  3. import torch.optim as optim
  4. from torchvision import datasets, transforms
  5. from torch.functional import F
  6. # 定义简单的CNN模型
  7. class SimpleCNN(nn.Module):
  8.     def __init__(self):
  9.         super(SimpleCNN, self).__init__()
  10.         self.conv1 = nn.Conv2d(1, 16, kernel_size=3, stride=1, padding=1)
  11.         self.pool = nn.MaxPool2d(2, 2)
  12.         self.conv2 = nn.Conv2d(16, 32, kernel_size=3, stride=1, padding=1)
  13.         self.fc1 = nn.Linear(32 * 7 * 7, 128)
  14.         self.fc2 = nn.Linear(128, 10)
  15.     def forward(self, x):
  16.         x = self.pool(F.relu(self.conv1(x)))
  17.         x = self.pool(F.relu(self.conv2(x)))
  18.         x = x.view(-1, 32 * 7 * 7)
  19.         x = F.relu(self.fc1(x))
  20.         x = self.fc2(x)
  21.         return x
  22. # 数据预处理
  23. transform = transforms.Compose([
  24.     transforms.ToTensor(),
  25.     transforms.Normalize((0.1307,), (0.3081,))
  26. ])
  27. # 加载训练数据
  28. train_dataset = datasets.MNIST('data', train=True, download=True, transform=transform)
  29. train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=64, shuffle=True)
  30. # 初始化模型、损失函数和优化器
  31. model = SimpleCNN()
  32. criterion = nn.CrossEntropyLoss()
  33. optimizer = optim.Adam(model.parameters(), lr=0.001)
  34. # 训练模型
  35. def train(model, train_loader, criterion, optimizer, epochs=5):
  36.     model.train()
  37.     for epoch in range(epochs):
  38.         running_loss = 0.0
  39.         for batch_idx, (data, target) in enumerate(train_loader):
  40.             optimizer.zero_grad()
  41.             output = model(data)
  42.             loss = criterion(output, target)
  43.             loss.backward()
  44.             optimizer.step()
  45.             running_loss += loss.item()
  46.         print(f'Epoch {epoch+1}, Loss: {running_loss/len(train_loader)}')
  47. # 训练模型
  48. train(model, train_loader, criterion, optimizer)
  49. # 导出为ONNX格式
  50. dummy_input = torch.randn(1, 1, 28, 28)
  51. torch.onnx.export(
  52.     model,
  53.     dummy_input,
  54.     "mnist_model.onnx",
  55.     export_params=True,
  56.     opset_version=11,
  57.     do_constant_folding=True,
  58.     input_names=['input'],
  59.     output_names=['output'],
  60.     dynamic_axes={'input': {0: 'batch_size'}, 'output': {0: 'batch_size'}}
  61. )
  62. print("模型已成功导出为mnist_model.onnx")
复制代码
1.png

2. C++ 部署和推理

[code]#include #include #include #include int main() {    // 初始化环境    Ort::Env env(ORT_LOGGING_LEVEL_WARNING, "MNIST");    Ort::SessionOptions session_options;    session_options.SetIntraOpNumThreads(1);    session_options.SetGraphOptimizationLevel(GraphOptimizationLevel::ORT_ENABLE_ALL);    // 加载模型    std::wstring model_path = L"mnist_model.onnx";    Ort::Session session(env, model_path.c_str(), session_options);    // 准备输入    std::vector input_shape = { 1, 1, 28, 28 };    size_t input_tensor_size = 28 * 28;    std::vector input_tensor_values(input_tensor_size);        // 读取测试图片    cv::Mat test_image = cv::imread("test.jpg", cv::IMREAD_GRAYSCALE);             // 将Mat数据复制到vector中    for (int i = 0; i < test_image.rows; ++i) {        for (int j = 0; j < test_image.cols; ++j) {            input_tensor_values[i * test_image.cols + j] = static_cast(test_image.at(i, j)); // 注意:uchar是unsigned char的缩写,表示无符号字符,通常用于存储灰度值        }    }     // 创建输入张量    auto memory_info = Ort::MemoryInfo::CreateCpu(OrtArenaAllocator, OrtMemTypeDefault);    Ort::Value input_tensor = Ort::Value::CreateTensor(        memory_info, input_tensor_values.data(), input_tensor_size, input_shape.data(), 4);    // 设置输入输出名称    std::vector input_names;    std::vector output_names;    input_names.push_back(session.GetInputNameAllocated(0, Ort::AllocatorWithDefaultOptions()).get());    output_names.push_back(session.GetOutputNameAllocated(0, Ort::AllocatorWithDefaultOptions()).get());    // 运行推理    auto output_tensors = session.Run(        Ort::RunOptions{ nullptr },        input_names.data(),        &input_tensor,        1,        output_names.data(),        1);    // 获取输出结果    float* output = output_tensors[0].GetTensorMutableData();    std::vector results(output, output + 10);    // 找到预测的数字    int predicted_digit = 0;    float max_probability = results[0];    for (int i = 1; i < 10; i++) {        if (results > max_probability) {            max_probability = results;            predicted_digit = i;        }    }    std::cout
您需要登录后才可以回帖 登录 | 立即注册