01

截图陷阱:为什么大多数 AI PPT 是假的

打开 PPT 文件,点击一个图表,发现它是一张图片——你没法编辑任何数据。这就是截图陷阱。

你有没有遇到过这种情况?

用某些 AI 工具生成了一份 PPT,发给同事,同事说:「这个数据要改一下」。你打开文件,点击那个柱状图——发现它是一张 嵌入图片。你没法修改任何数字,没法调整任何颜色。

这就是业内大多数「AI 生成 PPT」工具的实质:把网页截图,然后塞进幻灯片文件。PPT Master 解决的正是这个问题。

📸

截图式(大多数工具)

每页是一张大图片。看起来很漂亮,但双击任何元素——什么都动不了。

✏️

原生可编辑(PPT Master)

每个文本框、图表、形状都是真实的 PowerPoint 元素,可以单独点击和编辑。

PowerPoint 文件里面有什么?

你知道 .pptx 文件本质上是什么吗?它是一个ZIP 压缩包,里面是一堆 XML 文件。解压一个 .pptx,你会看到:

presentation.pptx(解压后) 其实是个 ZIP 包
ppt/slides/slide1.xml 第 1 页幻灯片的所有内容(用 XML 描述)
ppt/theme/theme1.xml 主题颜色和字体
ppt/media/image1.png 嵌入的图片文件

PPT Master 的工作就是生成正确的 XML——每个图表是真实的 DrawingML 代码,每个文本框是真实的 <a:t> 标签,而不是一张截图。

知识检验

你收到一份 AI 生成的 PPT,里面有几个柱状图。你想判断这份 PPT 是截图式还是原生可编辑的。最快的方法是什么?

02

文档解析管道

一个 PDF、一个网页 URL,或者一段 Markdown——PPT Master 怎么把这些不同格式统一变成 AI 可以处理的内容?

翻译官的工作

想象你是一个联合国翻译官,来了一批文件——有中文报告、英文合同、阿拉伯语演讲稿。你的任务是把它们全部翻译成同一种语言,然后交给一个只看这种语言的决策者。

PPT Master 的解析管道就是这个翻译官。它的目标语言是 Markdown——无论什么格式进来,统一变成 Markdown 再交给 AI。

🌐
原始输入
🔧
格式解析器
📝
Markdown 输出
点击「下一步」开始

解析脚本目录

每种输入格式都有一个专门的 Python 脚本处理,互不干扰:

pdf_to_md.py PDF → Markdown,处理多栏布局和图片
doc_to_md.py DOCX/HTML/EPUB → Markdown,用 python-docx 原生解析
excel_to_md.py Excel 表格 → Markdown 表格,保留数据结构
web_to_md.py 网页 URL → Markdown,支持微信文章特殊处理
ppt_to_md.py 现有 PPTX → Markdown,用于改版已有演示文稿
💡
「统一格式」是系统设计的核心

为什么要先转成 Markdown?因为 LLM 对 Markdown 的理解和生成能力远好于 PDF。统一成 Markdown 后,后续所有 AI 处理步骤不需要关心原始格式是什么,降低了系统复杂度。

知识检验

PPT Master 要新增对 Notion 导出的 CSV 格式的支持。根据它的架构,需要修改哪些地方?

03

形状与动画生成

AI 如何生成真实的 PowerPoint 形状,以及让元素「飞入」的动画?

乐高积木搭成的幻灯片

PowerPoint 的每一页幻灯片,本质上是一堆「积木」的组合:文本框、矩形、图表、图片、连接线……PPT Master 的 Executor 就是那个把积木按照设计图拼起来的工人。

但它不是直接生成 DrawingML XML——它先生成 SVG,再由 svg_to_pptx.py 脚本把 SVG 转成 PowerPoint 格式。这是一个聪明的两步法:AI 擅长生成 SVG,而 SVG 转 PPTX 是确定性的机械转换。

SVG → PPTX 的翻译过程

为什么 SVG 中转而不直接生成 XML?

这是个很好的工程决策问题。答案分三层:

1
AI 更擅长 SVG

训练数据里 SVG 的样本比 DrawingML XML 多得多,AI 生成 SVG 更稳定、更少出错。

2
SVG 可以在浏览器预览

生成后可以立刻在浏览器里看效果,发现问题立即修正,不需要打开 PowerPoint。

3
转换是确定性的

SVG → PPTX 的转换规则是固定的,svg_to_pptx.py 只做机械翻译,不引入 AI 的不确定性。

Executor 生成了 SVG,但有一个图表的数据标签位置不对。根据 PPT Master 的流程,在哪一步可以发现并修复这个问题?

04

LLM → PPTX 翻译

Strategist、Executor、spec_lock.md——PPT Master 怎么用 AI 多角色协作生成一致的演示文稿?

建筑师与施工队

大楼建造分两阶段:建筑师先画出图纸(设计),施工队再按图纸施工(执行)。两者分工明确,建筑师不亲手砌砖,施工队不临场改设计。

PPT Master 的 AI 工作流也是如此:Strategist是建筑师,Executor是施工队。

核心工作流

# Core Pipeline (from SKILL.md)
Source DocumentParse (格式解析器)
  → Create Project (初始化)
  → Strategist (内容规划)
  → [Image_Generator] (可选图像)
  → Executor (逐页 SVG)
  → Post-processing (质检)
  → Export → .pptx
            
PLAIN ENGLISH

从原始文档(PDF/URL/Markdown)开始

统一转成 Markdown 文本

创建项目目录,存储所有中间文件

AI 策略师读取内容,规划每页展示什么

如需图片,调用图像生成 API

AI 执行器按规划逐页生成 SVG 代码

质量检查,修复 SVG 问题

把所有 SVG 打包成可编辑的 .pptx 文件

spec_lock.md:设计规格的宪法

Executor 生成每一页 SVG 之前,都必须先读取 spec_lock.md 这个文件。这是一条铁律,写在 SKILL.md 的核心规则里。为什么?

因为在生成一份 20 页的 PPT 时,AI 的上下文漂移很容易导致第 15 页的字体变了、颜色变了。spec_lock.md 是强制锚点:每页都要从这里读取颜色、字体、图标库,确保整套 PPT 视觉一致。

🔒
「锁定规格」是对抗 AI 不确定性的关键

这是 PPT Master 一个精妙的工程设计:把设计决策提前锁定到一个文件里,让执行阶段的 AI 只能读取它,不能自由发挥颜色和字体。当你让 AI 做任何需要「保持一致性」的事情时,都可以借鉴这个模式:先锁定规格,再批量执行。

综合测验

客户说整套 PPT 的主题色要从蓝色改成绿色。根据 spec_lock.md 的设计,最高效的做法是什么?

你想加速 PPT 生成,打算让 AI 同时生成第 1-5 页和第 6-10 页。根据 PPT Master 的执行规则,这样做会有什么问题?