多层感知机的从零开始实现

杼氖发表于 2025-9-26 10:38:20

博客地址：https://www.cnblogs.com/zylyehuo/
基本设置

import torch
from torch import nn
from d2l import torch as d2lbatch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)初始化模型

为什么不直接使用 Tensor 而是用 nn.Parameter 函数将其转换为 parameter呢？

[*]nn.Parameter 函数会向宿主模型注册参数，从而在参数优化的时候可以自动一起优化。
[*]此外，由于内存在硬件中的分配和寻址方式，选择2的若干次幂作为层宽度会使计算更高效。
num_inputs, num_outputs, num_hiddens = 784, 10, 256

# 输入层参数
W1 = nn.Parameter(torch.randn(
num_inputs, num_hiddens, requires_grad=True) * 0.01)
b1 = nn.Parameter(torch.zeros(num_hiddens, requires_grad=True))
# 隐藏层参数
W2 = nn.Parameter(torch.randn(
num_hiddens, num_outputs, requires_grad=True) * 0.01)
b2 = nn.Parameter(torch.zeros(num_outputs, requires_grad=True))

params = 激活函数

def relu(X):# 自定义 ReLU 函数
a = torch.zeros_like(X)
return torch.max(X, a)模型

由于忽略了空间结构，我们调用 reshape 函数将每个二维图像转换成长度为 num_inputs 的向量
def net(X):
X = X.reshape((-1, num_inputs))
H = relu(X @ W1 + b1)# 输入层运算+激活这里“@”代表矩阵乘法
return (H @ W2 + b2)# 隐藏层运算损失函数

loss = nn.CrossEntropyLoss(reduction='none')# 使用交叉熵损失函数训练

num_epochs, lr = 10, 0.1
updater = torch.optim.SGD(params, lr=lr)# 优化算法
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, updater)
d2l.predict_ch3(net, test_iter)# 在一些测试集上运行一下这个模型

来源：程序园用户自行投稿发布，如果侵权，请联系站长删除
免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

敛饺乖 发表于 2025-10-11 03:07:23

感谢，下载保存了

丘娅楠 发表于 2025-10-31 02:58:51

用心讨论，共获提升！

狞嗅发表于 2025-11-18 04:26:28

懂技术并乐意极积无私分享的人越来越少。珍惜

习和璧 发表于 2025-12-3 17:05:12

前排留名，哈哈哈

梢疠发表于 2025-12-8 23:51:32

分享、互助让互联网精神温暖你我

庾签发表于 2025-12-13 13:06:11

很好很强大我过来先占个楼待编辑

获弃发表于 2026-1-1 11:53:38

分享、互助让互联网精神温暖你我

枢覆引 发表于 2026-1-18 02:02:56

这个有用。

锟及发表于 2026-1-18 13:19:38

东西不错很实用谢谢分享

庾签发表于 2026-1-21 13:29:30

过来提前占个楼

梢疠发表于 2026-1-21 16:01:44

感谢，下载保存了

劳暄美 发表于 2026-1-25 08:43:52

收藏一下不知道什么时候能用到

娥搽裙 发表于 2026-1-27 05:11:37

前排留名，哈哈哈

咫噎发表于 2026-2-4 10:08:51

过来提前占个楼

桂册发表于 2026-2-6 10:37:22

谢谢分享，试用一下

思矿戳 发表于 2026-2-8 13:40:05

用心讨论，共获提升！

客臂渐 发表于 2026-2-8 16:15:05

这个有用。

痨砖发表于 2026-2-9 15:22:51

yyds。多谢分享

阙忆然 发表于 2026-2-10 10:58:59

收藏一下不知道什么时候能用到

页: [1] 2

程序园's Archiver

多层感知机的从零开始实现