截图陷阱：为什么大多数 AI PPT 是假的

打开 PPT 文件，点击一个图表，发现它是一张图片——你没法编辑任何数据。这就是截图陷阱。

你有没有遇到过这种情况？

用某些 AI 工具生成了一份 PPT，发给同事，同事说：「这个数据要改一下」。你打开文件，点击那个柱状图——发现它是一张嵌入图片。你没法修改任何数字，没法调整任何颜色。

这就是业内大多数「AI 生成 PPT」工具的实质：把网页截图，然后塞进幻灯片文件。PPT Master 解决的正是这个问题。

📸

截图式（大多数工具）

每页是一张大图片。看起来很漂亮，但双击任何元素——什么都动不了。

✏️

原生可编辑（PPT Master）

每个文本框、图表、形状都是真实的 PowerPoint 元素，可以单独点击和编辑。

PowerPoint 文件里面有什么？

你知道 .pptx 文件本质上是什么吗？它是一个ZIP 压缩包，里面是一堆 XML 文件。解压一个 .pptx，你会看到：

presentation.pptx（解压后）其实是个 ZIP 包

ppt/slides/slide1.xml 第 1 页幻灯片的所有内容（用 XML 描述）

ppt/theme/theme1.xml 主题颜色和字体

ppt/media/image1.png 嵌入的图片文件

PPT Master 的工作就是生成正确的 XML——每个图表是真实的 DrawingML 代码，每个文本框是真实的 <a:t> 标签，而不是一张截图。

知识检验

你收到一份 AI 生成的 PPT，里面有几个柱状图。你想判断这份 PPT 是截图式还是原生可编辑的。最快的方法是什么？

02

文档解析管道

一个 PDF、一个网页 URL，或者一段 Markdown——PPT Master 怎么把这些不同格式统一变成 AI 可以处理的内容？

翻译官的工作

想象你是一个联合国翻译官，来了一批文件——有中文报告、英文合同、阿拉伯语演讲稿。你的任务是把它们全部翻译成同一种语言，然后交给一个只看这种语言的决策者。

PPT Master 的解析管道就是这个翻译官。它的目标语言是 Markdown——无论什么格式进来，统一变成 Markdown 再交给 AI。

🌐

原始输入

🔧

格式解析器

📝

Markdown 输出

点击「下一步」开始

解析脚本目录

每种输入格式都有一个专门的 Python 脚本处理，互不干扰：

pdf_to_md.py PDF → Markdown，处理多栏布局和图片

doc_to_md.py DOCX/HTML/EPUB → Markdown，用 python-docx 原生解析

excel_to_md.py Excel 表格 → Markdown 表格，保留数据结构

web_to_md.py 网页 URL → Markdown，支持微信文章特殊处理

ppt_to_md.py 现有 PPTX → Markdown，用于改版已有演示文稿

💡

「统一格式」是系统设计的核心

为什么要先转成 Markdown？因为 LLM 对 Markdown 的理解和生成能力远好于 PDF。统一成 Markdown 后，后续所有 AI 处理步骤不需要关心原始格式是什么，降低了系统复杂度。

知识检验

PPT Master 要新增对 Notion 导出的 CSV 格式的支持。根据它的架构，需要修改哪些地方？

03

形状与动画生成

AI 如何生成真实的 PowerPoint 形状，以及让元素「飞入」的动画？

乐高积木搭成的幻灯片

PowerPoint 的每一页幻灯片，本质上是一堆「积木」的组合：文本框、矩形、图表、图片、连接线……PPT Master 的 Executor 就是那个把积木按照设计图拼起来的工人。

但它不是直接生成 DrawingML XML——它先生成 SVG，再由 svg_to_pptx.py 脚本把 SVG 转成 PowerPoint 格式。这是一个聪明的两步法：AI 擅长生成 SVG，而 SVG 转 PPTX 是确定性的机械转换。

SVG → PPTX 的翻译过程

为什么 SVG 中转而不直接生成 XML？

这是个很好的工程决策问题。答案分三层：

1

AI 更擅长 SVG

训练数据里 SVG 的样本比 DrawingML XML 多得多，AI 生成 SVG 更稳定、更少出错。

2

SVG 可以在浏览器预览

生成后可以立刻在浏览器里看效果，发现问题立即修正，不需要打开 PowerPoint。

3

转换是确定性的

SVG → PPTX 的转换规则是固定的，svg_to_pptx.py 只做机械翻译，不引入 AI 的不确定性。

Executor 生成了 SVG，但有一个图表的数据标签位置不对。根据 PPT Master 的流程，在哪一步可以发现并修复这个问题？

04

LLM → PPTX 翻译

Strategist、Executor、spec_lock.md——PPT Master 怎么用 AI 多角色协作生成一致的演示文稿？

建筑师与施工队

大楼建造分两阶段：建筑师先画出图纸（设计），施工队再按图纸施工（执行）。两者分工明确，建筑师不亲手砌砖，施工队不临场改设计。

PPT Master 的 AI 工作流也是如此：Strategist是建筑师，Executor是施工队。

核心工作流


# Core Pipeline (from SKILL.md)
Source Document
  → Parse (格式解析器)
  → Create Project (初始化)
  → Strategist (内容规划)
  → [Image_Generator] (可选图像)
  → Executor (逐页 SVG)
  → Post-processing (质检)
  → Export → .pptx

PLAIN ENGLISH

从原始文档（PDF/URL/Markdown）开始

统一转成 Markdown 文本

创建项目目录，存储所有中间文件

AI 策略师读取内容，规划每页展示什么

如需图片，调用图像生成 API

AI 执行器按规划逐页生成 SVG 代码

质量检查，修复 SVG 问题

把所有 SVG 打包成可编辑的 .pptx 文件

spec_lock.md：设计规格的宪法

Executor 生成每一页 SVG 之前，都必须先读取 spec_lock.md 这个文件。这是一条铁律，写在 SKILL.md 的核心规则里。为什么？

因为在生成一份 20 页的 PPT 时，AI 的上下文漂移很容易导致第 15 页的字体变了、颜色变了。spec_lock.md 是强制锚点：每页都要从这里读取颜色、字体、图标库，确保整套 PPT 视觉一致。

🔒

「锁定规格」是对抗 AI 不确定性的关键

这是 PPT Master 一个精妙的工程设计：把设计决策提前锁定到一个文件里，让执行阶段的 AI 只能读取它，不能自由发挥颜色和字体。当你让 AI 做任何需要「保持一致性」的事情时，都可以借鉴这个模式：先锁定规格，再批量执行。

截图陷阱：为什么大多数 AI PPT 是假的

你有没有遇到过这种情况？

截图式（大多数工具）

原生可编辑（PPT Master）

PowerPoint 文件里面有什么？

知识检验

你收到一份 AI 生成的 PPT，里面有几个柱状图。你想判断这份 PPT 是截图式还是原生可编辑的。最快的方法是什么？

文档解析管道

翻译官的工作

解析脚本目录

知识检验

PPT Master 要新增对 Notion 导出的 CSV 格式的支持。根据它的架构，需要修改哪些地方？

形状与动画生成

乐高积木搭成的幻灯片

SVG → PPTX 的翻译过程

为什么 SVG 中转而不直接生成 XML？

Executor 生成了 SVG，但有一个图表的数据标签位置不对。根据 PPT Master 的流程，在哪一步可以发现并修复这个问题？

LLM → PPTX 翻译

建筑师与施工队

spec_lock.md：设计规格的宪法

综合测验

客户说整套 PPT 的主题色要从蓝色改成绿色。根据 spec_lock.md 的设计，最高效的做法是什么？

你想加速 PPT 生成，打算让 AI 同时生成第 1-5 页和第 6-10 页。根据 PPT Master 的执行规则，这样做会有什么问题？