用 Claude + NotebookLM 写白皮书 / 电子书:我的真实工作流
目录
两个月前,我给一个 B2B 营销技术客户交付了一份 34 页的白皮书,主题是 "Cookie 退场之后,SaaS 营销人的第一方数据(first-party data)策略"。从研究、大纲、撰写、核查、设计简报,到落地页文案——完整流水线,从 kickoff 到 PDF 上线可下载,2.5 天搞定。三年前同样的范围要花三周,还要搭上一个初级策略人的精神健康。
干重活的是这对组合:Claude Opus 4.6 负责写作、结构和判断,NotebookLM 负责研究素材、基于源文件的核查、以及让最终文档扛得住质疑的引用引擎。两者有些地方重叠,更多地方互补。用错了互相打架,用对了能让获客内容的生产成本降到原来的零头。
下面是我真实在用的 6 阶段工作流、对应 prompt,以及那些我交过学费才知道的坑。
为什么这个组合能 work(以及大多数人为什么会反过来用)
最常见的错误是——只用一个工具包打全场。要么硬让 NotebookLM 写白皮书(它不会,那是研究工具不是写手),要么硬让 Claude 用通用知识做调研(它会,但出来的内容自信满满、没源可查,一到客户那里就崩)。
正确的分工:
- NotebookLM = 你的研究图书馆 + 事实核查员。它会摄入源材料、做索引,然后用指向具体段落的引用来回答问题。还能从同一资料库里生成音频总结、思维导图、简报文档。它不会编造——如果某个说法不在你上传的源文件里,它会直接告诉你。
- Claude Opus 4.6(预算紧的时候用 Sonnet 4.6)= 你的作者、编辑、结构思考者。它能在长上下文里推理,把 30 页文档的线索从头到尾串起来,输出的散文在严肃 B2B(Business-to-Business, 企业对企业)场景下,是 ChatGPT 至今追不上的水准。
错位使用是大多数失败的根源。不要让 Claude 去"研究这个主题"——它会幻觉。不要让 NotebookLM 去"写白皮书"——它会拒绝,或者给你一份干巴巴的总结。各司其职,工作流就能跑到 5–10 倍速。
6 阶段工作流
第 1 阶段:定题目和角度(30 分钟)
不要从"写一篇关于 AI 在营销中应用的白皮书"开始。题目要从你的客户(或你自己的业务)已经在被问的具体问题出发。白皮书要完成两件事:针对高意向搜索词拿到排名,再把流量转化为线索。题目和角度在任何 AI 工具打开之前就该定好。
进入第 2 阶段前我必须锁定的:
- 一个具体的读者画像——岗位、公司规模、他们要解决的具体问题。
- 一个具体的承诺——"读完之后,你会知道如何 [具体结果]。"
- 一份 5–10 份源文件的短清单——分析师报告、原创研究、内部数据、客户访谈、表现好的过往文章。
那份营销技术白皮书,承诺是"一份可落地的 90 天路线图:在不依赖第三方 Cookie 的前提下,收集、治理、激活第一方数据"。源文件是 4 份分析师报告、2 份内部客户访谈 deck、3 份我之前做 SEO 调研时已经扒下来的竞品白皮书。
第 2 阶段:NotebookLM 建研究资料库(1–2 小时)
把所有源文件扔进一个 NotebookLM notebook。PDF、Google Docs、纯文本、YouTube 字幕转录——它都能索引。
关键细节:上传得比你以为需要的多。 文档之间的交叉引用,是 NotebookLM 打败手写笔记的核心能力。如果我把分析师报告、内部访谈、竞品白皮书都扔进同一个 notebook,NotebookLM 就能回答"这 9 份源里,对'邮件送达率是不是第一方数据来源'这个问题分别怎么说?"并且对每一条都给出引用。
这阶段结束前我做的事:
- 让 NotebookLM 给每份源文件做 5 条要点总结,并加置信度标记。
- 用 "Report" 输出格式生成一份简报文档——这是我用过所有工具里最干净的研究简报,它会成为我喂给 Claude 的工作底稿。
- 旁边建一个 "facts" notebook——独立的另一个 notebook,专门放我打算在白皮书里用的 30–50 条具体事实、统计、引用。这是第 5 阶段引用主干的雏形。
NotebookLM 的 "Audio Overview"(音频概览)功能在这阶段是被严重低估的杀手锏。那种播客风格的 10 分钟资料库总结,会冒出一些我本来没注意到的关联。我一般散步时听,标记任何值得拉进简报的内容。
第 3 阶段:Claude 出大纲(45 分钟)
Claude 在这里登场。我把 NotebookLM 简报文档 + 第 1 阶段的画像和承诺喂给它,让它做逐节大纲。
我用的 prompt:
你是一位资深 B2B 内容策略师。我正在为 [读者画像] 写一份 30 页的获客白皮书,主题是 [题目]。目标:针对 [目标搜索词] 拿到排名,并把读者转化成销售对话。附件是一份从 9 份一手源文件(分析师报告、客户访谈、竞品资料)里提炼出来的研究简报。最终成稿里所有论断必须可以追溯到这份简报。
请产出一份逐节大纲,包含:
- 工作标题 + 3 个备选标题(用 SEO 难度筛过)
- 6–8 个主章节,每个一句话论断
- 每个章节:3–5 个具体的子论点,每个绑定到简报里的一条事实或引用(标出来源)
- 合乎逻辑的阅读流——读者在第 3 章需要知道什么,才能让第 4 章立住
- 数据可视化应该出现在哪
- 一份 200 字的执行摘要,读者 90 秒能吸收
如果你发现源文件里有比我原定角度更强的方向,请直接提出来。
最后一句很关键。Claude Opus 真的会说"你这个角度比源数据里支持的那个角度弱"。我大约 60% 的时候会采纳它的反馈。
第 4 阶段:Claude 撰写(3–5 小时,分块进行)
这一步是大多数 AI 白皮书尝试死掉的地方。模型哗哗输出 2000 字泛泛的 thought leadership 鸡汤,写手因为"已经写完了"就接受。
让我走出这个坑的三条规则:
规则 1:一节一节写,绝不一次整本。 30 页白皮书对任何现有模型来说都太长,没法一次写好。我每节要 800–1200 字,按顺序写,每次喂入前面所有章节的 200 字 recap。Claude 的长上下文窗口在这就显出价值——Opus 4.6 能装 1M tokens,前面 30 节的上下文塞进去毫无压力。
规则 2:强迫每节都具体。 泛泛的章节 prompt 出来的是泛泛的散文。每个章节 prompt 里我都会塞:
- 大纲里那句论断
- NotebookLM 简报里 3–5 条要用的具体事实 / 引用
- 2–3 个要引用的具体例子(带名字)
- 语气(见规则 3)
规则 3:给 Claude 一份声音样本。 我贴 800 字最近给客户交付的成稿,或者我自己已发表的文章,让它照着这个声音写。"照这个声音"是把一篇 6 分的草稿拉到 8.5 分的关键。没这个,Claude 默认出来的声音是稍微僵硬的 thought leadership 体,读者一秒就能识破。
真实的循环是:prompt → 草稿 → 我的编辑(通常是 20–30% 的字数)→ 下一节。到第 3 节的时候,声音已经校准,编辑速度也快了。
第 5 阶段:NotebookLM 事实核查(1–2 小时)
这是所有人都想跳过的阶段,也是决定白皮书扛不扛得住质疑的阶段。
把草稿里每个数字论断、具名案例、所有"根据……"的引用拿过来,每条对 NotebookLM 问:
请在源资料库里查 [具体论断]。请引用原文并标出来源。如果该论断不在源文件里,请直接说明。
NotebookLM 会:
- 引用源文件并确认论断(最理想)
- 引用源文件并显示论断有微小偏差——通常是一个记错的数字或外推的(改掉)
- 确认论断不在源文件里(删掉或换成在的)
那份营销技术白皮书,这一轮从 84 条引用里抓出 11 条没源支撑的。大多数是小问题(百分比错位、引用张冠李戴),但有两条是承重墙——开篇章节锚定的那条统计其实是 2022 年的源里来的,2022 年之后源已经被更新了。NotebookLM 30 秒抓住。我手查根本查不到。
光这一步就够让这套组合值回票价。一份扛不住事实核查的白皮书,还不如没有——它会精准杀死你最想转化的那批人的信任。
第 6 阶段:润色、设计简报、获客包装(2–3 小时)
AI 的活基本干完了。我要做的:
- 把整本草稿打印出来读,标出每一句弱的句子,重写。
- 砍掉一切撑不起长度的内容。第一稿永远太长 15–20%。
- 给设计师(或自家用 Canva / Gamma)写一页设计简报——页面结构、callout 框、图表规格、品牌色。
- 写落地页文案、邮件跟进序列(3 封)、推广白皮书的 LinkedIn 帖子。这三样都能从最终文档里让 Claude 直接出——都是短的、低风险的活,模型在这类任务上最稳。
推广物料总共花 1 小时。它们是"白皮书拿到 200 次下载 vs 2000 次下载"的差距,所以我从来不省。
值得偷的 prompt
几个我存在个人 swipe file 里反复用的 prompt:
找角度用:
我要发你 5 篇关于 [题目] 的高排名文章。请告诉我:它们共同漏掉了什么、哪里说错了、一个能打败现有内容的更强角度应该长什么样。然后给我 3 个候选角度,我能用它们写出一份更狠的白皮书。
写章节用:
请写白皮书第 [N] 节,约 900 字。声音:[贴样本]。论断:[从大纲里复制]。必须涵盖这些具体点:[列表]。必须用简报里这些事实:[列表加引用]。以一句过渡句结尾,自然衔接到第 [N+1] 节。
收紧文风用:
请读以下章节。识别每句泛泛的、含糊的、或换到任何一篇同主题文章里都成立的句子,把这些句子改写成贴合我们论点的具体句子。已经够利的句子保留不动。
5 个会吃掉你时间的坑
坑 1:让 Claude 用通用知识"摆事实"。 它会输出写得漂亮的一段,里面夹一个听着真但其实不存在的统计。规则:Claude 可以"知道"事情,但不许"声明"事情。草稿里每个数字都必须能追到你上传的源文件。
坑 2:让 NotebookLM 去写白皮书。 它要么拒绝,要么给你一份 500 字的总结根本算不上白皮书,最坏情况是给你一份看起来像白皮书但只是把你源文件里的引用缝起来、没有原创论点的东东。论点是你的活。
坑 3:一次 Claude 调用写完整本。 即便 Opus 4.6 有 1M tokens 上下文,后半本的散文质量会掉。声音会漂移,论点会重复,例子会感觉是回收的。一节一节写 + recap 更花时间,但读起来是同一篇连贯的文章。
坑 4:跳过事实核查,因为"Claude 在草稿里引用了"。 Claude 对通用知识类论断没有引用功能。它没法告诉你一个数字从哪来。只有 NotebookLM 可以。一条事实不在源资料库里,它就不是可引用的事实。
坑 5:不在同一会话里把推广文案一起写完。 草稿正热在你上下文里。落地页、邮件序列、LinkedIn 帖子——你如果不在同一会话里写,要么跳过(最常见),要么一周后用更差的声音写。把它们一起绑进工作流。
写在最后
一份获客白皮书曾经是 3 周的项目,要策略、写手、研究员、设计师各一个。Claude + NotebookLM 这个组合把它变成一个 2–3 天、一个人能 hold 住全程策略的项目。账目是荒诞的——30 页 B2B 白皮书,我实际付出的 AI 成本(Opus 4.6 API + NotebookLM 免费档)不到 40 美元,相比人工流程省下来约 80% 的时间。
护城河不是 AI。护城河是判断力:选哪个题目、信哪些源、留哪些论点、事实核查时杀掉哪些论断、哪个推广角度真能拉来下载。模型产出文档,你产出决定它值不值得读的思考。
如果你一直把白皮书当"有空再做"的项目,这个工作流就是"多做一些"的理由。一季度一份好的,配上正经的发行,能顶一年泛泛的博客。