首页 › 业界区 › 业界 ›多层感知机的从零开始实现

多层感知机的从零开始实现

杼氖 2025-9-26 10:38:20

博客地址：https://www.cnblogs.com/zylyehuo/

基本设置

import torch
from torch import nn
from d2l import torch as d2l

复制代码

batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

复制代码

初始化模型

为什么不直接使用 Tensor 而是用 nn.Parameter 函数将其转换为 parameter呢？

nn.Parameter 函数会向宿主模型注册参数，从而在参数优化的时候可以自动一起优化。
此外，由于内存在硬件中的分配和寻址方式，选择2的若干次幂作为层宽度会使计算更高效。

num_inputs, num_outputs, num_hiddens = 784, 10, 256
# 输入层参数
W1 = nn.Parameter(torch.randn(
num_inputs, num_hiddens, requires_grad=True) * 0.01)
b1 = nn.Parameter(torch.zeros(num_hiddens, requires_grad=True))
# 隐藏层参数
W2 = nn.Parameter(torch.randn(
num_hiddens, num_outputs, requires_grad=True) * 0.01)
b2 = nn.Parameter(torch.zeros(num_outputs, requires_grad=True))
params = [W1, b1, W2, b2]

复制代码

激活函数

def relu(X): # 自定义 ReLU 函数
a = torch.zeros_like(X)
return torch.max(X, a)

复制代码

模型

由于忽略了空间结构，我们调用 reshape 函数将每个二维图像转换成长度为 num_inputs 的向量

def net(X):
X = X.reshape((-1, num_inputs))
H = relu(X @ W1 + b1) # 输入层运算+激活这里“@”代表矩阵乘法
return (H @ W2 + b2) # 隐藏层运算

复制代码

损失函数

loss = nn.CrossEntropyLoss(reduction='none') # 使用交叉熵损失函数

复制代码

训练

num_epochs, lr = 10, 0.1
updater = torch.optim.SGD(params, lr=lr) # 优化算法
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, updater)

复制代码

d2l.predict_ch3(net, test_iter) # 在一些测试集上运行一下这个模型

复制代码

来源：程序园用户自行投稿发布，如果侵权，请联系站长删除
免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

多层感知机开始实现

回复

使用道具举报

安全

让您的应用实现跨多个子系统融合的场景化服务

0293

账暴
2025-10-07
安全

ABP框架结合Entity Framework（非Core版）与MySQL实现大数据量高效分页查询解决方案

0290

肇默步
2025-10-07
业界

从零开始学Flink：实时流处理实战

0991

纣捎牟
2025-10-07
业界

从零开始学Flink：数据输出的终极指南

0195

锷稠
2025-10-08
业界

Kubernetes Service详解：实现服务发现与负载均衡

0711

骆贵
2025-10-09
业界

从零开始:C#实现计算表达式解析与求值——以后缀表达式为例

0615

筒濂
2025-10-09
代码

vxe-table 实现列头授权自定义插槽模板，自定义输入框

0372

袁曼妮
2025-10-10
业界

用低成本FPGA实现FSMC接口的多串口（UART）缓冲控制器

0374

里豳朝
2025-10-10
业界

学习ReAct并使用langgraph实现一个简单的ReAct AI Agent！！

031

稼布欤
2025-10-10

敛饺乖

12 小时前

回复

使用道具举报

感谢，下载保存了

0

粉丝关注

23

主题发布

板块介绍填写区域，请于后台编辑

财富榜{圆}