Dancing Circle：把"加密题"拽回数独与Dancing Links的一次完整复现

Dancing Circle：把"加密题"拽回数独与Dancing Links的一次完整复现
TL;DR这是一个把数独 + DLX（Dancing Links）藏进"Crypto"壳里的逆向题。程序先用"大整数"算出数独初盘，再用 DLX 解出终盘；用户输入的 80 个十六进制字符在 DLX 2025-11-17 00:13:33 Author: www.freebuf.com(查看原文) 阅读量:8 收藏

TL;DR
这是一个把数独 + DLX（Dancing Links）藏进"Crypto"壳里的逆向题。程序先用"大整数"算出数独初盘，再用 DLX 解出终盘；用户输入的 80 个十六进制字符在 DLX 的 cover()过程中被分步交换、旋转与多次字节查表，最终与 DLX 解得的数独解逐位比较，匹配计数到达预设条件才会输出 "Well Done!"。整套流程可以在调试器/脚本里稳定复现。

环境与工具

系统：Windows（题目二进制在 Win7 x64 下验证可运行）
调试器：x64dbg / IDA（任选其一用于断点、内存转储）
脚本环境：Python 3.10+（用于 DLX 解数独、旋转/查表复刻与最终构造输入）
样本：DancingCircle.exe（题目给出的可执行文件）
参考事实：流程分解、旋转节拍、中心格约束、匹配计数阈值等（本文中出现的这些关键事实均与题目实现一致）

总体流程速览

程序的高层逻辑可概括为 6 步：

双处数据校验 → 生成大数 Num1；
Num1× 固定大数 Num2→ 得到数独初始化数据 Data1；
解析 Data1→ 初始化 DLX；同时把用户输入的 80 位十六进制转成十进制填入 9×9（中心格不由用户输入），中心格由 9 个调试检查函数的返回值推得：必须为 7；
DLX 起舞：在 cover()中分 5 个小步骤做"交换+移位"；每 60 次交换得到一次向右 90° 旋转；共执行 4 次旋转回到原位，但每一格经历了 6 次字节级查表变换，得到用户侧的净数据 UserData2；
对 UserData2查表后与 DLX 解逐位比较，计数 cnt必须为 79（比较到正中心时 cnt–）；
用 cnt解码 + 校验，成立则输出 "Well Done!"。

我们为什么按这条路线复现？
因为第 4 步把"用户输入 → 目标比较"的路径打乱成"旋转+多次查表"，回路关键在 cover()；而第 5 步给出硬性阈值 cnt=79，这为构方程/做映射逆向提供了稳定的可验证目标。

为什么是数独 + DLX？

数独的精确覆盖建模

标准数独问题可以建模为精确覆盖问题（Exact Cover），这是 Knuth 提出 Dancing Links 算法的经典应用场景。

变量定义：

每个候选 (r,c,n)表示在第 r行第 c列填入数字 n
共有 9×9×9=729个候选（行）

约束列（共 324 列）：

格子约束：每格恰填一数（81 列）
行约束：每行每个数字恰出现一次（81 列）
列约束：每列每个数字恰出现一次（81 列）
宫约束：每宫每个数字恰出现一次（81 列）

为什么确认是 DLX？
程序的二进制代码中包含典型的 DLX 实现特征：

构建 324 列约束矩阵
递归调用 cover()/uncover()函数
使用链表数据结构进行高效回溯
题目说明明确提到使用 DancingLinks 算法

题目"加密"的核心其实是 把 DLX 的求解结果当作"真值"，把用户输入折腾一圈再去对齐它。

复现 Part A：还原数独初盘与中心格约束

目标：拿到程序用于 DLX 的初盘（Data1解析后），并落实中心格=7这个硬条件。

实际复现结果

通过分析提取的 board_init.bin文件，我们得到了真实的数独初盘：

数独初盘:
┌───────────────────┐
│ . . . 2 6 . 7 . 1 │
│ 6 8 . . 7 . . 9 . │
│ 1 9 . . . 4 5 . . │
├───────────────────┤
│ 8 2 . 1 . . . 4 . │
│ . . 4 6 . 2 9 . . │
│ . 5 . . . 3 . 2 8 │
├───────────────────┤
│ . . 9 3 . . . 7 4 │
│ . 4 . . 5 . . 3 6 │
│ 7 . 3 . 1 8 . . . │
└───────────────────┘

中心格为何为 7？

程序通过 9 个 CheckDebug()式的调试检查函数，组合约束出中心格必须为 7。这个约束不由用户输入提供，是程序的硬编码限制。这也解释了为什么最终匹配计数是 79 而不是 80——因为中心格（索引 40）不参与用户输入，在比较时还要执行 cnt–的特殊处理。

数独求解结果

使用 DLX 算法求解得到的终盘为：

数独解:
┌───────────────────┐
│ 4 3 5 2 6 9 7 8 1 │
│ 6 8 2 5 7 1 4 9 3 │
│ 1 9 7 8 3 4 5 6 2 │
├───────────────────┤
│ 8 2 1 9 5 7 6 4 3 │
│ 3 7 4 6 8 2 9 1 5 │
│ 9 5 6 1 4 3 8 2 7 │
├───────────────────┤
│ 5 1 9 3 2 6 8 7 4 │
│ 2 4 8 7 5 9 1 3 6 │
│ 7 6 3 4 1 8 2 5 9 │
└───────────────────┘

可以看到，中心格（第5行第5列）的值确实是 7，符合程序的硬性约束。

复现 Part B：跟到 `cover()`——九宫格的分步交换与四次 90° 右转

目标：复刻 "交换+移位 → 旋转 90°（右）"的节拍与次数。

机制分析

通过对程序逆向分析发现：

机制：把一次位置交换拆为 5 个小步骤，每调用一次 cover()执行一个小步骤
旋转：做满 60 次交换，正好让九宫格 向右旋转 90°
循环：共执行 4 次旋转，位置回到起点
次数：5（小步骤/交换） × 60（交换/次旋转） × 4（旋转） = 1200次 cover()

位置置换验证

def rotate_right_90(grid):  # grid: 9x9 list
    n = 9
    return [[grid[n-1-c][r] for c in range(n)] for r in range(n)]

# 连续旋转 4 次 → 回到原样
g0 = [[(r*9+c) for c in range(9)] for r in range(9)]
g = g0
for _ in range(4):
    g = rotate_right_90(g)
assert g == g0  # 位置回到起点

为什么要确认这件事？
旋转让"位置层面的置换"最终回到恒等置换（四次 90°），因此位置不再是难点；真正的难点是在每次小步骤里对字节作查表变换，它们不会因为旋转抵消。

复现 Part C：字节查表链与"6 次变换"的净效应

目标：抓到并复刻"每格 6 次字节级查表变换"的净效果（记作 T_net）。

实际数据

从程序中提取的 6 张变换表（T1-T6），每张 256 字节：

T1: 256 bytes
T2: 256 bytes
T3: 256 bytes
T4: 256 bytes
T5: 256 bytes
T6: 256 bytes
L: 256 bytes  # 最终比较查表

变换合成

在四次旋转的总过程中，每一格经历了 6 次数据变换操作（按字节查表）。这 6 个表串联构成一个净变换T_net：

def compose_tables(tables):
    """合成多个字节变换表为一个净变换表"""
    result = list(range(256))
    for table in tables:
        result = [table[result[i]] for i in range(256)]
    return result

# 实际合成的 T_net[0-9] → [11, 181, 163, 154, 228, 232, 129, 94, 134, 151]

为什么要合成净变换？
位置置换已证明会回到原位；因此用户输入的每个格位只需要通过一个固定的字节映射T_net就能描述"被折腾一圈后的数值变化"。这大幅简化了逆向联立的复杂度。

复现 Part D：与 DLX 解逐位比较、匹配计数为 79

事实：程序把 UserData2先做一次查表（记作 L），再与 DLX 解按位比较，统计完全匹配的位数 cnt，阈值为 cnt=79。比较到正中心（非用户输入）时会执行 cnt–的处理。

比较逻辑

对于除中心以外的 80 个格位，需要满足：

L[T_net(D_i)] == S_i     (∀ i ≠ center)

其中：

D_i是用户输入的十六进制字符转十进制后的值（0..15）
S_i是DLX 求得的数独解对应格位的数字（1..9）
中心格固定为 7，不来自用户输入

实际验证

通过我们的验证脚本证实：

验证结果: PASS
匹配计数: 79/79

为什么阈值是 79？
因中心不参与输入且计数逻辑对其做了 cnt–的处理，满分并非 80 而是 79。这是我们最终"是否成功"的唯一数值型信号。

自动化脚本：一键抽取数据 → 生成 80 位输入 → 本地验证

完整复现代码

我们创建了一个简化的验证脚本 simple_verify.py，完整实现了：

数据加载：读取提取的初盘和变换表
数独求解：使用回溯算法求解 DLX 数独
变换合成：将 6 张表合成为净变换 T_net
答案验证：验证 80 位十六进制答案的正确性

最终答案

32415867057146038208672345171508423626351804840632517408215763137846025652307148

这是一个 80 位的十六进制字符串，每个字符对应数独格中的一个值（0-15），经过 T_net变换和 L查表后与 DLX 解完全匹配。

验证关键步骤

# 1. 重建用户数据
user_data = [None] * 81
idx = 0
for i in range(81):
    if i == CENTER_INDEX:  # 跳过中心格
        user_data[i] = CENTER_VALUE
    else:
        user_data[i] = int(hex_answer[idx], 16)
        idx += 1

# 2. 计算匹配计数
cnt = 0
for i in range(81):
    if i == CENTER_INDEX:
        cnt -= 1  # 中心位特殊处理
        continue

    ud = user_data[i]
    transformed = T_net[ud]
    final = L_table[transformed]
    target = solution[i]

    if final == target:
        cnt += 1

验证结果显示匹配计数正好为 79，符合题目的要求。

常见坑与排错建议

"抓初盘"的时机：尽量在"DLX 矩阵填充前"断下；若晚于此时，可能只能拿到候选而非初盘。
六张表的顺序：严格按调用顺序导出；换序会导致 T_net错误。
中心位处理：脚本与程序都把中心格固定为 7，并在计数时对中心执行 cnt–；两处都要一致。
多解情况：单格可能存在多于一个 x ∈ [0..15]使 L[T_net(x)]==S_i；任选其一即可（计数依然达标）。
编码问题：在 Windows 环境下运行 Python 脚本时注意 Unicode 编码问题。

结语与要点复盘

通过这个 CTF 题目的完整复现，我们成功拆解了一个看似复杂的"加密"题，揭示了其内核是经典的数独求解算法。

技术要点总结

题面骨架：大整数取数 → 数独初盘 → DLX 求解，这是"真值产生器"
输入变换：在 DLX 的 cover()中穿插分步交换 + 旋转 + 字节查表，四次 90° 右转回到原位，但每格经历 6 次查表形成净变换 T_net
判定逻辑：对 UserData2查表 L，与 DLX 解逐位比较，匹配计数 cnt=79为通过条件；中心=7且不由用户输入
复现策略：动态抓初盘与查表 → 合成 T_net→ DLX 解数独 → 逐格穷举逆向 80 位 hex 输入 → 自检 cnt

为什么这个设计巧妙？

算法伪装：将经典的数独求解算法包装成"Crypto"题目
多重混淆：通过大整数运算、自校验、花指令增加静态分析难度
变换叠加：位置旋转与字节变换结合，制造"加密"假象
精确约束：79/80 的匹配要求提供明确的验证目标

学习价值

这个题目告诉我们：

看似复杂的加密题可能隐藏着经典算法
动态分析比静态分析在某些情况下更有效
理解算法本质比关注表面"加密"更重要
数独问题的精确覆盖建模是算法设计的经典案例

最终，我们不仅成功复现了题目，还深入理解了 DLX 算法在实际应用中的巧妙变通。这正体现了 CTF 题目设计的艺术——将基础知识与创新思路完美结合。

版权与说明
文中对流程节拍、中心格约束、匹配阈值等关键事实，均与样本行为一致。本文仅复刻其可观测净行为并给出可运行脚本，不臆造未观测数据。

最终验证结果：PASS（匹配计数：79/79）
完整答案：32415867057146038208672345171508423626351804840632517408215763137846025652307148

文章来源: https://www.freebuf.com/articles/others-articles/457481.html
如有侵权请联系:admin#unsafe.sh