Apr 1, 2026

miniyuan

解线性方程组的直接法

题 2.1

增广矩阵为：

\left[\begin{array}{ccc|c} 0 & 2 & 1 & 5 \\ 1 & 1 & 0 & 3 \\ 2 & 3 & 2 & 0 \end{array}\right]

在第 1 列的主元在第 3 行，交换第 1 行和第 3 行：

\left[\begin{array}{ccc|c} 2 & 3 & 2 & 0 \\ 1 & 1 & 0 & 3 \\ 0 & 2 & 1 & 5 \end{array}\right]

消元得：

\left[\begin{array}{ccc|c} 2 & 3 & 2 & 0 \\ 0 & -\frac{1}{2} & -1 & 3 \\ 0 & 2 & 1 & 5 \end{array}\right]

在第 2 列的主元在第 3 行，交换第 2 行和第 3 行：

\left[\begin{array}{ccc|c} 2 & 3 & 2 & 0 \\ 0 & 2 & 1 & 5 \\ 0 & -\frac{1}{2} & -1 & 3 \end{array}\right]

消元得：

\left[\begin{array}{ccc|c} 2 & 3 & 2 & 0 \\ 0 & 2 & 1 & 5 \\ 0 & 0 & -\frac{3}{4} & \frac{17}{4} \end{array}\right]

回代求解得：

x_1 = -\frac{7}{3},\quad x_2 = \frac{16}{3},\quad x_3 = -\frac{17}{3}

题 2.2

证明：

由对称正定阵的 Cholesky 分解知：

\mathbf{A} = \mathbf{L}^\mathrm{T} \mathbf{L}

其中 $\mathbf{L}$ 为下三角矩阵，对角元为正。

从而有：

\|\mathbf{x}\|_{\mathbf{A}} = \sqrt{\mathbf{x}^\mathrm{T} \mathbf{L}^\mathrm{T} \mathbf{L} \mathbf{x}} = \|\mathbf{L} \mathbf{x}\|_2

于是根据向量 2-范数的性质知：

正定性：

$\|\mathbf{x}\|_{\mathbf{A}} \ge 0$ 显然。

且：
$\|\mathbf{x}\|_{\mathbf{A}} = 0 \Leftrightarrow \|\mathbf{L} \mathbf{x}\|_2 = 0 \Leftrightarrow \mathbf{L} \mathbf{x} = 0 \Leftrightarrow \mathbf{x} = 0$
齐次性：

$\forall \alpha \in \mathbb{R}$ ，有：
$\|\alpha \mathbf{x}\|_{\mathbf{A}} = \|\alpha \mathbf{L} \mathbf{x}\|_2 = |\alpha| \|\mathbf{L} \mathbf{x}\|_2 = |\alpha|\|\mathbf{x}\|_{\mathbf{A}}$
三角不等式：

$\forall \mathbf{x}, \mathbf{y} \in \mathbb{R}^n$ ，有：
$\|\mathbf{x} + \mathbf{y}\|_{\mathbf{A}} = \|\mathbf{L} (\mathbf{x} + \mathbf{y})\|_2 \le \|\mathbf{L} \mathbf{x}\|_2 + \|\mathbf{L} \mathbf{y}\|_2 = \|\mathbf{x} \|_{\mathbf{A}} + \|\mathbf{y}\|_{\mathbf{A}}$

综上，原范数是一个向量范数。

题 2.3

记 $\mathbf{B}^{-1} = \mathbf{A} = \begin{bmatrix} a^1 \\ a^2 \\ \cdots \\ a^n \end{bmatrix}$ ，其中 $a^i$ 为 $\mathbf{A}$ 的第 $i$ 行。

则利用矩阵乘法的按行展开得：

(\mathbf{B} \mathbf{A})^i = a^i - \sum_{k = i+1}^{n} a^k = e^i. \qquad i = 1, \cdots, n

其中 $e^i = \begin{pmatrix} 0, \cdots, 1, \cdots, 0\end{pmatrix}$ 为第 $i$ 位为 1 的单位行向量。

从下往上回代求解得：

\begin{aligned} a^n &= \begin{pmatrix} 0, \cdots, 0, 1\end{pmatrix} \\ a^{n-1} &= \begin{pmatrix} 0, \cdots, 0, 1, 1\end{pmatrix} \\ a^{k} &= \begin{pmatrix} 0, \cdots, 0, 1, 1, 2, 4, \cdots, 2^{n-k-1} \end{pmatrix}, \quad k \le n-2 \end{aligned}

也即：

\begin{aligned} \|a^i\|_1 &= \sum_{j = 1}^{n} \vert a_{ij} \vert = 2^{n - i} \\ \|b^i\|_1 &= \sum_{j = 1}^{n} \vert b_{ij} \vert = n - i + 1 \end{aligned}

从而有：

\text{Cond}(\mathbf{B}) = \|\mathbf{A}\|_{\infty} \cdot \|\mathbf{B}\|_{\infty} = \max_{i} \|a^i\|_1 \cdot \max_{i} \|b^i\|_1 = n 2^{n-1}

题 2.4

证明 1

证明 $\mathbf{H}_n = \mathbf{H}_n^{\mathrm{T}}$

归纳法。

$n=0$ 时， $\mathbf{H}_0 = [1]$ 显然对称。假设 $\mathbf{H}_{n-1} = \mathbf{H}_{n-1}^{\mathrm{T}}$ 成立，下证对 $\mathbf{H}_n$ 也成立。这是因为：
$\mathbf{H}_n^{\mathrm{T}} = \begin{bmatrix} \mathbf{H}_{n-1}^{\mathrm{T}} & \mathbf{H}_{n-1}^{\mathrm{T}} \\ \mathbf{H}_{n-1}^{\mathrm{T}} & -\mathbf{H}_{n-1}^{\mathrm{T}} \end{bmatrix} = \begin{bmatrix} \mathbf{H}_{n-1} & \mathbf{H}_{n-1} \\ \mathbf{H}_{n-1} & -\mathbf{H}_{n-1} \end{bmatrix} = \mathbf{H}_n$
成立！
证明 $\mathbf{H}_n\mathbf{H}_n^{\mathrm{T}} = 2^n \mathbf{I}_{2^n}$

归纳法。

$n=0$ 时， $\mathbf{H}_0\mathbf{H}_0^{\mathrm{T}} = [1][1] = [1] = 2^0 \cdot \mathbf{I}_1$ 成立。

假设 $\mathbf{H}_{n-1}\mathbf{H}_{n-1}^{\mathrm{T}} = 2^{n-1}\mathbf{I}_{2^{n-1}}$ 成立，下证对 $\mathbf{H}_n$ 也成立。这是因为：
$\begin{aligned} \mathbf{H}_n\mathbf{H}_n^{\mathrm{T}} &= \begin{bmatrix} \mathbf{H}_{n-1} & \mathbf{H}_{n-1} \\ \mathbf{H}_{n-1} & -\mathbf{H}_{n-1} \end{bmatrix} \begin{bmatrix} \mathbf{H}_{n-1}^{\mathrm{T}} & \mathbf{H}_{n-1}^{\mathrm{T}} \\ \mathbf{H}_{n-1}^{\mathrm{T}} & -\mathbf{H}_{n-1}^{\mathrm{T}} \end{bmatrix} \\ &= \begin{bmatrix} \mathbf{H}_{n-1}\mathbf{H}_{n-1}^{\mathrm{T}} + \mathbf{H}_{n-1}\mathbf{H}_{n-1}^{\mathrm{T}} & \mathbf{H}_{n-1}\mathbf{H}_{n-1}^{\mathrm{T}} - \mathbf{H}_{n-1}\mathbf{H}_{n-1}^{\mathrm{T}} \\ \mathbf{H}_{n-1}\mathbf{H}_{n-1}^{\mathrm{T}} - \mathbf{H}_{n-1}\mathbf{H}_{n-1}^{\mathrm{T}} & \mathbf{H}_{n-1}\mathbf{H}_{n-1}^{\mathrm{T}} + \mathbf{H}_{n-1}\mathbf{H}_{n-1}^{\mathrm{T}} \end{bmatrix} \\ &= \begin{bmatrix} 2^n \mathbf{I}_{2^{n-1}} & \mathbf{0} \\ \mathbf{0} & 2^n \mathbf{I}_{2^{n-1}} \end{bmatrix} \\ &= 2^n \mathbf{I}_{2^n} \end{aligned}$
成立！

证明 2

由于 $\mathbf{H}_n$ 对称正定，故其 LDL^T 分解存在且唯一。下归纳证明其 LDL^T 分解满足题示形式。

$n=0$ 时，取 $\mathbf{D}_0 = [1]$ ，则 $\mathbf{L}_0 \mathbf{D}_0 \mathbf{L}_0^\mathrm{T} = [1] = \mathbf{H}_0$ 满足题目形式。

假设对于分解 $\mathbf{H}_{n-1} = \mathbf{L}_{n-1} \mathbf{D}_{n-1} \mathbf{L}_{n-1}^\mathrm{T}$ 满足题目形式，下证对 $\mathbf{H}_n = \begin{bmatrix} \mathbf{H}_{n-1} & \mathbf{H}_{n-1} \\ \mathbf{H}_{n-1} & -\mathbf{H}_{n-1} \end{bmatrix}$ 也有同样的分解形式。也即验证以下关于对角阵 $\mathbf{A}_{n-1}, \mathbf{B}_{n-1}$ 的方程有解：

\begin{bmatrix} \mathbf{L}_{n-1} & \mathbf{0} \\ \mathbf{L}_{n-1} & \mathbf{L}_{n-1} \end{bmatrix} \begin{bmatrix} \mathbf{A}_{n-1} & \mathbf{0} \\ \mathbf{0} & \mathbf{B}_{n-1} \end{bmatrix} \begin{bmatrix} \mathbf{L}_{n-1}^{\mathrm{T}} & \mathbf{L}_{n-1}^{\mathrm{T}} \\ \mathbf{0} & \mathbf{L}_{n-1}^{\mathrm{T}} \end{bmatrix} = \begin{bmatrix} \mathbf{H}_{n-1} & \mathbf{H}_{n-1} \\ \mathbf{H}_{n-1} & -\mathbf{H}_{n-1} \end{bmatrix}

等价于以下方程有解：

\begin{bmatrix} \mathbf{L}_{n-1}\mathbf{A}_{n-1}\mathbf{L}_{n-1}^{\mathrm{T}} & \mathbf{L}_{n-1}\mathbf{A}_{n-1}\mathbf{L}_{n-1}^{\mathrm{T}} \\ \mathbf{L}_{n-1}\mathbf{A}_{n-1}\mathbf{L}_{n-1}^{\mathrm{T}} & \mathbf{L}_{n-1}(\mathbf{A}_{n-1} + \mathbf{B}_{n-1})\mathbf{L}_{n-1}^{\mathrm{T}} \end{bmatrix} = \begin{bmatrix} \mathbf{H}_{n-1} & \mathbf{H}_{n-1} \\ \mathbf{H}_{n-1} & -\mathbf{H}_{n-1} \end{bmatrix}

也即：

\begin{cases} \mathbf{L}_{n-1}\mathbf{A}_{n-1}\mathbf{L}_{n-1}^{\mathrm{T}} = \mathbf{H}_{n-1} \\ \mathbf{L}_{n-1}(\mathbf{A}_{n-1} + \mathbf{B}_{n-1})\mathbf{L}_{n-1}^{\mathrm{T}} = -\mathbf{H}_{n-1} \end{cases}

利用归纳，构造对角阵：

\begin{cases} \mathbf{A}_{n-1} = \mathbf{D}_{n-1} \\ \mathbf{B}_{n-1} = -2\mathbf{D}_{n-1} \end{cases}

满足上述方程，从而满足题目要求的分解对 $\mathbf{H}_n$ 存在。同时得到 $\mathbf{D}_n$ 的递推公式为：

\mathbf{D}_n = \begin{bmatrix} \mathbf{D}_{n-1} & \mathbf{0} \\ \mathbf{0} & -2\mathbf{D}_{n-1} \end{bmatrix}, \quad \mathbf{D}_0 = [1]

题 2.6

算法设计

本质上系数矩阵是上三角的，可以直接回代求解。但是直接回代求解的复杂度为 $\mathcal{O}(n^3)$ ，我们需要想点办法改进一下。

先展开原方程，对第 $i$ 行可得：

\sum_{j=i}^n (\sum_{k=i}^j \mathbf{S}_{i, k} \mathbf{T}_{k, j}) \mathbf{x}_j - \lambda \mathbf{x}_i = \mathbf{b}_i

也即：

(\mathbf{S}_{i, i} \mathbf{T}_{i, i} - \lambda) \mathbf{x}_i + \sum_{j=i+1}^n (\sum_{k=i}^j \mathbf{S}_{i, k} \mathbf{T}_{k, j}) \mathbf{x}_j = \mathbf{b}_i

从而原始的回代求解即为：

\mathbf{x}_i = \frac{\mathbf{b}_i - \sum_{j=i+1}^n (\sum_{k=i}^j \mathbf{S}_{i, k} \mathbf{T}_{k, j}) \mathbf{x}_j} {\mathbf{S}_{i, i} \mathbf{T}_{i, i} - \lambda}, \quad i = n, n-1, \cdots, 1

可以看到复杂度主要花在了计算双重求和 $\sum_{j=i+1}^n (\sum_{k=i}^j \mathbf{S}_{i, k} \mathbf{T}_{k, j}) \mathbf{x}_j$ 上，考虑优化这一部分。

利用恒等式：

\begin{aligned} \sum_{j=i+1}^n (\sum_{k=i}^j \mathbf{S}_{i, k} \mathbf{T}_{k, j}) \mathbf{x}_j &= \sum_{j=i+1}^n (\sum_{k=i+1}^j \mathbf{S}_{i, k} \mathbf{T}_{k, j}) \mathbf{x}_j + \sum_{j=i+1}^n \mathbf{S}_{i, i} \mathbf{T}_{i, j} \mathbf{x}_j \\ &= \sum_{k=i+1}^n \sum_{j=k}^n \mathbf{S}_{i, k} (\mathbf{T}_{k, j} \mathbf{x}_j) + \sum_{j=i+1}^n \mathbf{S}_{i, i} (\mathbf{T}_{i, j} \mathbf{x}_j) \\ &= \sum_{k=i+1}^n \mathbf{S}_{i, k} \mathbf{w}_k + \mathbf{S}_{i, i} \mathbf{v}_i \end{aligned}

其中 $\mathbf{w}_k = \sum_{j=k}^n \mathbf{T}_{k, j} \mathbf{x}_j$ ， $\mathbf{v}_k = \sum_{j=k+1}^n \mathbf{T}_{k, j} \mathbf{x}_j$ 。

于是我们得到改进的回代求解：

\begin{aligned} \mathbf{w}_{i+1} &= \mathbf{v}_{i+1} + \mathbf{T}_{i+1, i+1} \mathbf{x}_{i+1} \\ \mathbf{v}_i &= \sum_{j=i+1}^n \mathbf{T}_{i, j} \mathbf{x}_j \\ \mathbf{x}_i &= \frac{\mathbf{b}_i - \mathbf{S}_{i, i} \mathbf{v}_i - \sum_{j=i+1}^n \mathbf{S}_{i, j} \mathbf{w}_j} {\mathbf{S}_{i, i} \mathbf{T}_{i, i} - \lambda} \end{aligned}

其中 $\mathbf{w}_k$ 与 $\mathbf{v}_k$ 均只需求解一次，后续重复利用。在回代求解 $\mathbf{x}_i$ 之前，已经计算好了 $\mathbf{w}_k$ （ $k \ge i+1$ ）和 $\mathbf{v}_i$ 。并且由于 $\mathbf{w}_k$ 和 $\mathbf{v}_k$ 的相关关系，我们可以只使用一个 $\mathbf{w}$ 数组。

复杂度分析

核心代码如下：

// 求解
x(n - 1) = b(n - 1) / (S(n - 1, n - 1) * T(n - 1, n - 1) - lambda);
for (int i = n - 2; i >= 0; i--) {
    // 预处理 w(i + 1), v(i)
    w(i + 1) += T(i + 1, i + 1) * x(i + 1); // w(i + 1)
    for (int j = i + 1; j < n; j++) {
        w(i) += T(i, j) * x(j); // v(i)
    }

    // 求解 x(i)
    x(i) = b(i);
    for (int j = i; j < n; j++) {
        x(i) -= S(i, j) * w(j);
    }
    x(i) /= (S(i, i) * T(i, i) - lambda);
}

只考虑求解过程和浮点数运算，外层循环有 $n-1$ 次，每次内层循环有 $\mathcal{O}(2n-2i)$ 次。故时间复杂度：

\mathcal{T} = \sum_{i=0}^{n-2} \mathcal{O}(2n-2i) = \mathcal{O}(\sum_{k=2}^n 2k) = \mathcal{O}(2n^2)

空间复杂度上需要 $\mathcal{O}(n)$ 的额外空间。

题 2.7

问题 1

在不重复操作（模 2）意义下，解不一定存在，也不一定唯一，但是要么存在且唯一，要么可能不存在且可能不唯一。注意以下的计算都在域 $\mathbb{F}_2$ 上进行。

考虑一个 $m \times n$ 的网格，用状态向量 $\mathbf{v} \in \mathbb{F}_2^{mn}$ 表示所有灯的亮灭情况。其中 $\mathbf{v}_{(i-1)\cdot n + j} = 1$ 表示 $(i, j)$ 灯亮，反之则灭。初始状态向量记为 $\mathbf{v}^{(0)}$ 。

所有的操作对应操作向量 $\mathbf{x} \in \mathbb{F}_2^{mn}$ 。其中 $\mathbf{x}_{(i-1)\cdot n + j} = 1$ 表示操作了 $(i, j)$ 灯，反之不操作。此处不考虑重复操作。

操作 $(i, j)$ 灯带来的影响是使自己及周围灯改变亮灭，也即使状态向量中对应自己及周围灯的元素加 1。从而定义如下状态转移矩阵，其第 $((i - 1) \cdot n + j, (s - 1) \cdot n + t)$ 元素为 1 则表示操作 $(i, j)$ 灯时会对 $(s, t)$ 灯产生影响：

A = \begin{bmatrix} \mathbf{K}_n & \mathbf{I}_n & \mathbf{O}_n & \cdots & \mathbf{O}_n \\ \mathbf{I}_n & \mathbf{K}_n & \mathbf{I}_n & \cdots & \mathbf{O}_n \\ \mathbf{O}_n & \mathbf{I}_n & \mathbf{K}_n & \cdots & \mathbf{O}_n \\ \vdots & & \ddots & & \vdots \\ \mathbf{O}_n & \cdots & \mathbf{I}_n & \mathbf{K}_n & \mathbf{I}_n \\ \mathbf{O}_n & \cdots & \mathbf{O}_n & \mathbf{I}_n & \mathbf{K}_n \end{bmatrix}_{mn \times mn}

这是一个分块三对角矩阵。其中：

\mathbf{K}_n = \begin{bmatrix} 1 & 1 & 0 & \cdots & 0 \\ 1 & 1 & 1 & \cdots & 0 \\ 0 & 1 & 1 & \cdots & 0 \\ \vdots & & \ddots & & \vdots \\ 0 & \cdots & 1 & 1 & 1 \\ 0 & \cdots & 0 & 1 & 1 \end{bmatrix}_{n \times n}

$\mathbf{I}_n$ 为单位阵， $\mathbf{O}_n$ 为零矩阵。

则经过所有操作后得到的终止状态向量即为：

\mathbf{v} = \mathbf{v}^{(0)} + \mathbf{A} \mathbf{x}

游戏有解等价于以下方程组有解：

\mathbf{A} \mathbf{x} = \mathbf{v}^{(0)}

也即：

解存在 $\Leftrightarrow$ $\forall \mathbf{v}^{(0)} \in \mathbb{F}_2^{mn}, \quad \mathbf{v}^{(0)} \in \text{Col}(\mathbf{A})$ $\Leftrightarrow$ $\dim(\text{Col}(\mathbf{A})) = \text{rank}(\mathbf{A}) = mn$
解唯一 $\Leftrightarrow$ $\det(\mathbf{A}) \ne 0$ $\Leftrightarrow$ $\text{rank}(\mathbf{A}) = mn$

从而若 $\mathbf{A}$ 满秩则解存在且唯一，否则解可能不存在且可能不唯一。

对于经典的 $5 \times 5$ 关灯游戏，状态转移矩阵 $\mathbf{A}$ 的秩为 $23$ ，不满秩，所以解可能不存在也可能不唯一。实际枚举发现存在下述两种不改变任何灯的操作，说明了解确实不唯一。

问题 2

精确代数求解

可以通过求解线性方程组：

\mathbf{A} \mathbf{x} = \mathbf{v}^{(0)}

完成任务。

如果 $\mathbf{A}$ 满秩则可以直接求解，否则可以使用最小二乘法求最优解。

DQN 强化学习

除了直接求解线性方程组外，我们可以基于 DQN（Deep Q-Network）训练一个人工智能近似求出最优解。

马尔可夫决策过程

首先将游戏形式化为马尔可夫决策过程 $\mathcal{M} = (\mathcal{S}, \mathcal{A}, \mathcal{T}, \mathcal{R}, \gamma)$ ：
- 状态空间 $\mathcal{S}$ ：所有可能的灯阵状态，每个状态 $s \in \{0,1\}^{m \times n}$ 表示当前各灯的亮灭情况
- 动作空间 $\mathcal{A}$ ：选择操作 $(i, j)$ 灯，共 $|\mathcal{A}| = m \times n$ 个离散动作
- 状态转移 $\mathcal{T}$ ：确定性转移，执行动作后目标格子及其周围状态取反
- 奖励函数 $\mathcal{R}$ ：每步给予 $-1$ 的步数惩罚，当所有灯熄灭时给予 $+100$ 的目标奖励
- 折扣因子 $\gamma$ ：取 $0.99$ 以平衡步数与目标

神经网络架构

采用卷积神经网络结构，以利用灯阵的空间局部性：

层类型	配置	描述
输入层	$1 \times m \times n$ 张量	0/1 亮灭表示
卷积层 1	32 filters, $3\times3$ , ReLU	捕获局部十字形
卷积层 2	64 filters, $3\times3$ , ReLU	学习复合特征
全连接层	128 单元, ReLU	全局信息整合
输出层	$m \times n$ 个 Q 值	每个动作对应的状态-动作值

训练机制与优化策略

训练过程采用标准 DQN 流程：
- 探索策略：采用 $\varepsilon \text{-greedy}$ 策略，初始时 $\varepsilon=1.0$ ，随训练指数衰减至 $0.01$ 。前期充分探索避免局部最优，后期利用已学策略精细化。
- 经验回放：设置容量为 $10^5$ 的回放缓冲区，随机采样小批量经验以打破时间相关性。
- 稠密奖励：在稀疏奖励（每步 $-1$ ，胜利 $+100$ ）基础上，增加亮灯数减少的稠密奖励（减少 $+5$ ），以引导早期学习。待策略稳定后逐步移除，避免次优解。
评估

每 500 个 episode 进行一次评估，记录：
- 成功率：在限定步数内（如 $3mn$ 步）完成游戏的比例
- 平均步数：成功 episode 的实际步数均值，衡量解的质量
- Q 值收敛性：检查目标状态下的最大 Q 值是否稳定收敛

方法对比

对比代数求解以及 DQN 强化学习方法：

维度	精确代数求解	DQN 强化学习
解的质量	理论保证全局最优（最少步数）	启发式近似，可能陷入局部最优
计算复杂度	训练无开销；推理 $O(mn^3)$ ，因为带状矩阵	训练 $O(E \cdot mn)$ （ $E$ 为 episode数）；推理 $O(mn)$
可扩展性	受限于矩阵求逆，大规模困难	训练后推理时间与网格线性相关，可扩展至更大规模
适应性	要求状态观测精确，对噪声敏感	可通过数据增强学习鲁棒策略，容忍观测误差
在线调整	需重新求解方程组	支持增量学习，适应动态变化的初始配置