截图陷阱:为什么大多数 AI PPT 是假的
打开 PPT 文件,点击一个图表,发现它是一张图片——你没法编辑任何数据。这就是截图陷阱。
你有没有遇到过这种情况?
用某些 AI 工具生成了一份 PPT,发给同事,同事说:「这个数据要改一下」。你打开文件,点击那个柱状图——发现它是一张 嵌入图片。你没法修改任何数字,没法调整任何颜色。
这就是业内大多数「AI 生成 PPT」工具的实质:把网页截图,然后塞进幻灯片文件。PPT Master 解决的正是这个问题。
截图式(大多数工具)
每页是一张大图片。看起来很漂亮,但双击任何元素——什么都动不了。
原生可编辑(PPT Master)
每个文本框、图表、形状都是真实的 PowerPoint 元素,可以单独点击和编辑。
PowerPoint 文件里面有什么?
你知道 .pptx 文件本质上是什么吗?它是一个ZIP 压缩包,里面是一堆 XML 文件。解压一个 .pptx,你会看到:
PPT Master 的工作就是生成正确的 XML——每个图表是真实的 DrawingML 代码,每个文本框是真实的 <a:t> 标签,而不是一张截图。
知识检验
你收到一份 AI 生成的 PPT,里面有几个柱状图。你想判断这份 PPT 是截图式还是原生可编辑的。最快的方法是什么?
文档解析管道
一个 PDF、一个网页 URL,或者一段 Markdown——PPT Master 怎么把这些不同格式统一变成 AI 可以处理的内容?
翻译官的工作
想象你是一个联合国翻译官,来了一批文件——有中文报告、英文合同、阿拉伯语演讲稿。你的任务是把它们全部翻译成同一种语言,然后交给一个只看这种语言的决策者。
PPT Master 的解析管道就是这个翻译官。它的目标语言是 Markdown——无论什么格式进来,统一变成 Markdown 再交给 AI。
解析脚本目录
每种输入格式都有一个专门的 Python 脚本处理,互不干扰:
pdf_to_md.py
PDF → Markdown,处理多栏布局和图片
doc_to_md.py
DOCX/HTML/EPUB → Markdown,用 python-docx 原生解析
excel_to_md.py
Excel 表格 → Markdown 表格,保留数据结构
web_to_md.py
网页 URL → Markdown,支持微信文章特殊处理
ppt_to_md.py
现有 PPTX → Markdown,用于改版已有演示文稿
为什么要先转成 Markdown?因为 LLM 对 Markdown 的理解和生成能力远好于 PDF。统一成 Markdown 后,后续所有 AI 处理步骤不需要关心原始格式是什么,降低了系统复杂度。
知识检验
PPT Master 要新增对 Notion 导出的 CSV 格式的支持。根据它的架构,需要修改哪些地方?
形状与动画生成
AI 如何生成真实的 PowerPoint 形状,以及让元素「飞入」的动画?
乐高积木搭成的幻灯片
PowerPoint 的每一页幻灯片,本质上是一堆「积木」的组合:文本框、矩形、图表、图片、连接线……PPT Master 的 Executor 就是那个把积木按照设计图拼起来的工人。
但它不是直接生成 DrawingML XML——它先生成 SVG,再由 svg_to_pptx.py 脚本把 SVG 转成 PowerPoint 格式。这是一个聪明的两步法:AI 擅长生成 SVG,而 SVG 转 PPTX 是确定性的机械转换。
SVG → PPTX 的翻译过程
为什么 SVG 中转而不直接生成 XML?
这是个很好的工程决策问题。答案分三层:
训练数据里 SVG 的样本比 DrawingML XML 多得多,AI 生成 SVG 更稳定、更少出错。
生成后可以立刻在浏览器里看效果,发现问题立即修正,不需要打开 PowerPoint。
SVG → PPTX 的转换规则是固定的,svg_to_pptx.py 只做机械翻译,不引入 AI 的不确定性。
Executor 生成了 SVG,但有一个图表的数据标签位置不对。根据 PPT Master 的流程,在哪一步可以发现并修复这个问题?
LLM → PPTX 翻译
Strategist、Executor、spec_lock.md——PPT Master 怎么用 AI 多角色协作生成一致的演示文稿?
建筑师与施工队
大楼建造分两阶段:建筑师先画出图纸(设计),施工队再按图纸施工(执行)。两者分工明确,建筑师不亲手砌砖,施工队不临场改设计。
PPT Master 的 AI 工作流也是如此:Strategist是建筑师,Executor是施工队。
# Core Pipeline (from SKILL.md)
Source Document
→ Parse (格式解析器)
→ Create Project (初始化)
→ Strategist (内容规划)
→ [Image_Generator] (可选图像)
→ Executor (逐页 SVG)
→ Post-processing (质检)
→ Export → .pptx
从原始文档(PDF/URL/Markdown)开始
统一转成 Markdown 文本
创建项目目录,存储所有中间文件
AI 策略师读取内容,规划每页展示什么
如需图片,调用图像生成 API
AI 执行器按规划逐页生成 SVG 代码
质量检查,修复 SVG 问题
把所有 SVG 打包成可编辑的 .pptx 文件
spec_lock.md:设计规格的宪法
Executor 生成每一页 SVG 之前,都必须先读取 spec_lock.md 这个文件。这是一条铁律,写在 SKILL.md 的核心规则里。为什么?
因为在生成一份 20 页的 PPT 时,AI 的上下文漂移很容易导致第 15 页的字体变了、颜色变了。spec_lock.md 是强制锚点:每页都要从这里读取颜色、字体、图标库,确保整套 PPT 视觉一致。
这是 PPT Master 一个精妙的工程设计:把设计决策提前锁定到一个文件里,让执行阶段的 AI 只能读取它,不能自由发挥颜色和字体。当你让 AI 做任何需要「保持一致性」的事情时,都可以借鉴这个模式:先锁定规格,再批量执行。