【PINN】DeepXDE学习训练营(37)——pinn

本文链接：https://blog.csdn.net/2303_77200324/article/details/148188597

一、引言

随着人工智能技术的飞速发展，深度学习在图像识别、自然语言处理等领域的应用屡见不鲜，但在科学计算、工程模拟以及物理建模方面，传统的数值方法仍然占据主导地位。偏微分方程（Partial Differential Equations, PDEs）作为描述自然界中众多复杂现象的重要数学工具，在物理、化学、工程、金融等领域具有广泛应用。然而，伴随着高维度、多变量、复杂边界条件等挑战，传统数值求解方法面临效率低、适应性差等困境。

近年来，深度学习的崛起为科学计算带来了全新的解决思路。其中，以深度偏微分方程（Deep PDE）为代表的研究方向，通过结合神经网络与偏微分方程的理论，成功开发出高效、灵活的求解方案。这种方法不仅可以克服传统方法的局限，还能应对高维、复杂几何等问题。

作为深度偏微分方程领域的开源工具库，DeepXDE（Deep Learning for Differential Equations）由lululxvi团队精心开发，凭借其强大的功能、易用的接口和丰富的示例，受到学术界与工业界的广泛关注。本文将系统介绍DeepXDE的基本内容与应用价值，深入探讨其核心技术原理，分享环境配置与运行技巧，并结合实际案例进行分析，最后对未来发展趋势进行展望。

二、DeepXDE的用途

DeepXDE，一个基于TensorFlow和PyTorch的深度学习微分方程求解库，应运而生。它提供了一个简洁、高效且易于使用的框架，使得研究人员和工程师能够利用深度学习技术求解各种类型的微分方程，包括常微分方程（ODEs）、偏微分方程（PDEs）、积分微分方程（IDEs）以及分数阶微分方程（FDEs）。

DeepXDE旨在提供一站式的深度学习框架，用于高效求解各种偏微分方程，包括但不限于：

1. 传统偏微分方程求解

定常和非定常问题：热传导方程、波动方程、拉普拉斯方程、扩散方程等。
线性和非线性方程：支持线性边界条件，也能处理非线性、非局部问题。

2. 高维偏微分方程

在高维空间中，传统数值方法面临“维数灾难”。DeepXDE利用神经网络天然的高维逼近能力，有效解决高维PDE，如贝尔曼方程、多体问题等。

3. 复杂几何和边界条件

支持任意复杂的几何区域、非均匀边界条件，极大扩展了求解的适用范围。

4.参数逆问题和数据驱动建模

整合数据，使模型在已知部分信息的基础上进行参数识别、反演问题求解。

5. 动态系统和时间演化

支持带有时间变量的演化问题，模拟动态过程。

6. 结合有限元、有限差分等方法

虽然核心为神经网络，但兼容各种数值方法，提供灵活的求解策略。

7. 教育科研与工程实践

丰富的案例与接口帮助科研人员快速验证理论，工程师实现快速设计优化。

总结而言，DeepXDE不仅是一个纯粹的数学工具，更是工程实践中的“聪明助手”，帮助用户以信赖深度学习的方式突破传统技术瓶颈，实现创新性的科学计算。

三、核心技术原理

DeepXDE的核心思想是利用神经网络作为逼近器，通过构造损失函数，使网络能在满足偏微分方程边界条件的前提下逼近真实解。以下详细阐释其原理基础。

1. 神经网络逼近偏微分方程解

假设待求解的偏微分方程可以写成：

$\mathcal{N}[u](x)=0,x\in\Omega,$

配合边界条件

$\mathcal{B}[u](x)=g(x),x\in\partial \Omega,$

这里， $\mathcal{N}$ 代表微分算子， $\mathcal{B}$ 代表边界条件算子。

DeepXDE利用深度神经网络 𝑢𝜃(𝑥) 作为解的逼近，参数为 𝜃 。通过自动微分（AutoDiff），网络可以自然求出 𝑢𝜃 的各阶导数，从而在网络定义的每个点上计算微分方程的残差。

2. 损失函数设计

训练模型的目标是最小化残差，使神经网络逼近满足偏微分方程的解。损失函数由两部分组成：

方程残差部分：

$\mathcal{L}_{\mathit{PDE}}=\frac{1}{N_{f}}\sum_{i=1}^{N_{f}}|\mathcal{N}[u_{ \theta}](x_{f}^{(i)})|^{2},$

其中， $x{_{f}}^{(i)}$ 为采样点，用于评估微分残差。

边界条件部分：

$\mathcal{L}_{\mathit{BC}}=\frac{1}{N_{b}}\sum_{i=1}^{N_{b}}|\mathcal{B}[u_{ \theta}](x_{b}^{(i)})-g(x_{b}^{(i)})|^{2},$

结合整体目标函数：

$\mathcal{L}(\theta)=\lambda_{f}\mathcal{L}_{\mathit{PDE}}+\lambda_{b} \mathcal{L}_{\mathit{BC}},$

这里 $\lambda {_{f}}$ 、 $\lambda {_{b}}$ 为调节系数。

3. 自动微分（AutoDiff）技术

深度学习框架如TensorFlow或PyTorch提供自动微分功能，方便快速计算神经网络输入的微分，自动应用链式法则求导，极大简化偏微分方程的数值差分表达。

4. 训练优化方法

利用成熟的梯度下降（SGD）、Adam等优化算法，通过反向传播调节神经网络参数，使损失函数达到最小。

5. 样本生成和采样策略

采样点生成：采用随机采样、拉丁超立方（Latin Hypercube Sampling）或网格采样来选取训练点。
自适应采样：在训练过程中，根据误差分布调整采样点，提高训练效率。

6. 复杂边界与几何的处理

采用非结构化的几何描述和SDF（Signed Distance Function）结合，保证不同几何形状的灵活支持。

7. 逆问题与数据融合

在已知数据集上引入数据损失，使模型不仅满足PDE，也通过端到端训练实现数据匹配，增强实际适用性。

五、代码详解

"""Backend supported: tensorflow.compat.v1, tensorflow, pytorch, paddle"""
import deepxde as dde
import numpy as np

# 定义热传导的解析解（正弦初值条件）
def heat_eq_exact_solution(x, t):
    """给定点x和t，返回对应的热传导正弦解"""
    # 这是根据分离变量法得到的解析解公式：
    # u(x,t) = exp(-n^2 * pi^2 * a * t / L^2) * sin(n * pi * x / L)
    return np.exp(-(n**2 * np.pi**2 * a * t) / (L**2)) * np.sin(n * np.pi * x / L)

def gen_exact_solution():
    """生成在[x,t]范围内的热传导问题的解析解数据，并存储"""
    # 在空间和时间维度上采样点数
    x_dim, t_dim = (256, 201)
    # 定义空间和时间范围
    x_min, t_min = (0, 0.0)
    x_max, t_max = (L, 1.0)

    # 生成等间距的时间点（列向量）
    t = np.linspace(t_min, t_max, num=t_dim).reshape(t_dim, 1)
    # 生成等间距的空间点（列向量）
    x = np.linspace(x_min, x_max, num=x_dim).reshape(x_dim, 1)

    # 初始化存储解析解的数组
    usol = np.zeros((x_dim, t_dim))

    # 计算每个点对应的解析解
    for i in range(x_dim):
        for j in range(t_dim):
            usol[i][j] = heat_eq_exact_solution(x[i], t[j])

    # 将生成的空间、时间和解存储到npz文件
    np.savez("heat_eq_data", x=x, t=t, usol=usol)

# 载入解析解数据，用于验证模型
def gen_testdata():
    """加载存储的热方程的解析解数据，并整理成模型输入格式"""
    data = np.load("heat_eq_data.npz")
    # 提取时间、空间和对应解
    t, x, exact = data["t"], data["x"], data["usol"].T

    # 生成网格点（meshgrid）
    xx, tt = np.meshgrid(x, t)
    # 转换成模型输入的二维数组（每行一个点(x, t)）
    X = np.vstack((np.ravel(xx), np.ravel(tt))).T
    # 展平特解作为标签（每个点的对应真实值）
    y = exact.flatten()[:, None]
    return X, y

# 设置问题参数：
a = 0.4  # 传导系数（热扩散系数）
L = 1   # 板的长度
n = 1   # 初始条件的正弦波频率

# 生成已知解析解数据（可跳过此步骤使用实际测验数据）
gen_exact_solution()

# 定义偏微分方程残差
def pde(x, y):
    """表达热传导PDE的残差：u_t - a * u_xx"""
    dy_t = dde.grad.jacobian(y, x, i=0, j=1)   # 时间对u的导数（u_t）
    dy_xx = dde.grad.hessian(y, x, i=0, j=0)   # 空间二阶导数（u_xx）
    return dy_t - a * dy_xx                     # PDE的残差：左边 - 右边

# 构建空间几何：一维区间[0, L]
geom = dde.geometry.Interval(0, L)
# 时间域：从t=0到t=1
timedomain = dde.geometry.TimeDomain(0, 1)
# 结合空间与时间，形成时空域
geomtime = dde.geometry.GeometryXTime(geom, timedomain)

# 设置边界条件：端点为Dirichlet边界，u=0
bc = dde.icbc.DirichletBC(geomtime, lambda x: 0, lambda _, on_boundary: on_boundary)
# 设置初始条件：t=0时，u(x,0)=sin(n*pi*x/L)
ic = dde.icbc.IC(
    geomtime,
    lambda x: np.sin(n * np.pi * x[:, 0:1] / L),
    lambda _, on_initial: on_initial,
)

# 设置PDE点的自动采样回调（每10轮更新采样点）
pde_resampler = dde.callbacks.PDEPointResampler(period=10)

# 构建训练数据集
data = dde.data.TimePDE(
    geomtime,
    pde,
    [bc, ic],
    num_domain=2540,      # 内部采样点
    num_boundary=80,      # 边界采样点
    num_initial=160,      # 初值采样点
    num_test=2540,        # 测试点
)

# 定义神经网络：输入2维（x,t），经过多层全连接层，最后输出1个值
net = dde.nn.FNN([2] + [20] * 3 + [1], "tanh", "Glorot normal")

# 添加输出变换，确保在边界点上u=0
# 变换为：(1 - x^2 - t^2) * y，保证边界值为0
net.apply_output_transform(
    lambda x, y: (1 - tf.reduce_sum(x ** 2, axis=1, keepdims=True)) * y
)

# 如果使用paddle，只需取消下面的注释，使用paddle版本
# net.apply_output_transform(
#     lambda x, y: (1 - paddle.sum(x ** 2, axis=1, keepdim=True)) * y
# )

# 构建模型
model = dde.Model(data, net)

# 使用adam优化器训练
model.compile("adam", lr=1e-3)
model.train(iterations=20000)  # 训练20,000轮

# 换用L-BFGS优化器进一步优化
model.compile("L-BFGS")
losshistory, train_state = model.train()

# 画出损失变化曲线
dde.saveplot(losshistory, train_state, issave=True, isplot=True)

# 用模型在测试点进行预测
X, y_true = gen_testdata()
y_pred = model.predict(X)

# 计算模型在测试集上的残差（pde剩余）
f = model.predict(X, operator=pde)
print("Mean residual:", np.mean(np.absolute(f)))

# 计算真实值和预测值的L2相对误差
print("L2 relative error:", dde.metrics.l2_relative_error(y_true, y_pred))

# 保存测试点的真实值和预测值
np.savetxt("test.dat", np.hstack((X, y_true, y_pred)))