一文详解多层感知机（MLP）

最新推荐文章于 2025-06-26 15:59:16 发布

原创

最新推荐文章于 2025-06-26 15:59:16 发布 · 6.5k 阅读

45 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #数据挖掘 #机器学习 #神经网络 #回归 #分类

文章目录

What(是什么)

多层感知机（Multilayer Perceptron，MLP）是一种基本的前馈人工神经网络，由多层神经元组成。它是一种全连接（fully connected）的神经网络

多层感知机的特点:

多层结构: MLP 至少包含三层：输入层（Input Layer）、至少一个隐藏层（Hidden Layer）、输出层（Output Layer）。隐藏层可以有多个，通常在两个以上。
全连接: 每一层的神经元与上一层的所有神经元都有连接。这意味着每个神经元都接收上一层所有神经元的输入，并将自己的输出传递给下一层的所有神经元。
非线性激活函数: 在每个隐藏层和输出层的神经元上使用非线性激活函数，如ReLU（Rectified Linear Unit）、sigmoid 或 tanh（双曲正切函数），以使神经网络能够学习复杂的非线性关系。
训练方法: MLP 使用反向传播算法（Backpropagation）和优化器（如随机梯度下降）来训练网络，通过最小化损失函数来调整网络参数

一个典型的多层感知机：
在这里插入图片描述
可以看到，感知机的每一层之间采用全连接的方式连接，且感知机最少具有1个隐藏层。

Where（用在哪）

多层感知机的应用场景非常广泛，包括但不限于以下场景：

非线性分类问题：与简单的感知机不同，MLP 可以通过多个隐藏层和非线性激活函数来学习和表示复杂的非线性决策边界。这使得它能够处理那些线性不可分的数据集，如手写数字识别（MNIST 数据集）和图像分类。
回归问题：MLP 可以用来预测连续值，例如股票价格预测、房价预测等。输出层可以是一个或多个神经元，根据具体问题的需求。
模式识别和特征学习：MLP 在处理复杂的模式识别任务时表现出色，例如语音识别、人脸识别等。通过多层的特征提取和组合，MLP 能够学习到更高级的数据表示。
序列数据处理：虽然传统的 MLP 不适合处理序列数据，但可以通过一些变种结构（如循环神经网络或者结合卷积神经网络）来处理时间序列数据、文本数据等。
噪声数据的处理：MLP 可以通过训练来适应并处理部分噪声存在的数据，使得在实际应用中能够更加鲁棒地处理各种复杂场景。

How（怎么用）

多层感知机解决分类问题（以`minist`分类为例）

方式1：调用torch.nn手动构建全连接网络模型来实现MLP模型

import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import datasets, transforms
from torch.utils.data import DataLoader

# 定义一个简单的多层感知机（MLP）模型
class MLP(nn.Module):
    def __init__(self):
        super(MLP, self).__init__()
        self.fc1 = nn.Linear(28 * 28, 128)  # 输入大小为图像大小 28x28，输出大小为128
        self.fc2 = nn.Linear(128, 64)       # 隐藏层大小为64
        self.fc3 = nn.Linear(64, 10)        # 输出层大小为10，对应10个数字类别
    
    def forward(self, x):
        x = x.view(-1, 28 * 28)  # 将图像展平成向量
        x = torch.relu(self.fc1(x))  # 第一层：ReLU激活函数
        x = torch.relu(self.fc2(x))  # 第二层：ReLU激活函数
        x = self.fc3(x)              # 输出层，不用激活函数，因为后面会用CrossEntropyLoss

        return x

# 设置训练参数
batch_size = 64
learning_rate = 0.001
num_epochs = 10

# 加载MNIST数据集
train_dataset = datasets.MNIST