AI Tools

用 Claude 搭一个品牌声音分析器：喂 20 篇稿子，吐 12 维风格指南

2025年2月19日

上周我让 Claude 读了我自己过去 14 个月发布的 22 篇英文文章——这个博客上所有英文长文——让它告诉我它看到了什么。没有指令，没有范例，只有一句 prompt（提示词）："用 12 个可测量的维度分析我的写作风格，输出一份结构化画像。"

Claude 吐回来的 12 维画像精准到有点扎心。它标出来：我 78% 的句子用了缩写，口语/正式 70/30，几乎从不用感叹号，文章开头要么是个小场景要么是具体数字（从不用定义句），结尾只用三种招牌动作之一：一句话要点、一个重新框定的问题、或者一个开放问题。其中两种模式是我绝不会主动承认自己有的。还有一种跟我以为自己持有的声音相反。

这个 4 分钟的实验产出的东西，比我用了 18 个月的品牌声音文档更好。花了 4 分钟，API token 成本约 $0.40。这是我现在每个新客户都跑的流程。

下面是完整方法。

为什么品牌手册抓不住品牌声音

大部分品牌声音文档栽在同一步：用形容词描述声音——"温暖、大胆、权威、亲和"——然后奇怪为什么把内容贴进 ChatGPT 之后，模型输出的还是通用文案。

原因是结构性的。形容词是模式的压缩版。它对人类写作者有效，因为人类能基于多年上下文推断出模式；对模型无效，因为模型没有这些上下文。要从 Claude、ChatGPT、Gemini 得到稳定的输出，你需要抽取模式本身——句长、句式、代词选择、修辞动作——直接交出去。

30 页品牌手册活在 CMO 脑子里。1 页风格指南活在模型的上下文窗口（context window，即模型每次对话读取的工作记忆——Claude 一般 200K tokens，GPT-4 系列 128K，但实际使用中你希望所有内容能塞进一次对话）。一份是宣言，一份是工具。

工具的源数据就躺在你的 CMS（Content Management System，内容管理系统）里。你只是还没挖过。

准备工作（5 分钟）

你需要三样东西：

20+ 篇你引以为豪的已发布内容。 博客、newsletter、销售邮件、产品页——任何用你品牌声音写的东西。种类越丰富，画像越好。不要只挑"最满意的几篇"；把中等水平的也塞几篇，这样模型看到的是范围，不是高光集锦。
Claude Sonnet 4.5 或 Opus 4.7。 Sonnet 大部分分析够用，便宜 5 倍。如果要从文学或长篇内容里抽细微风格模式，用 Opus。
一份干净的纯文本 dump。 去掉格式——没有标题、没有图片、没有 markdown 加粗。你要的是模型分析正文，不是版式。一个 .txt 文件，把 20 篇拼接起来，用 ---POST 1--- 这种标记分开，就够了。

如果你在 Claude.ai 用，直接把内容贴进对话窗口就行。如果想要可复用的 prompt，用 API——Anthropic 的 Python SDK（Software Development Kit，软件开发工具包）只要两行代码，完整脚本在文章末尾。

12 个维度

这些是我测量的维度。选它们是因为每个都满足：（a）文本里观察得到；（b）好文章里持续存在；（c）可操作——一旦知道落点，就能写出模型能照做的规则。

正式程度光谱 —— 在 The Economist 和 Substack newsletter 之间的位置。我的落点大约 70% 口语 / 30% 正式。一个高端 B2B（Business to Business，企业对企业）品牌可能落在 30/70。
平均句长 —— 按字数计。营销文案一般 12-18 字。文学长篇 20-30。短不总是更好；方差比均值更重要。
主动 vs 被动语态比例 —— 你的默认语法姿态。AI 模型默认被动，因为训练数据过度代表正式文本。主动语态听起来更自信。
代词策略 —— we / you / I / 第三人称。每种代词选择都暗示一种关系。B2B SaaS（Software as a Service，软件即服务）博客偏 you。创始人主导的 newsletter 偏 I。企业品牌偏 we。
缩写使用 —— don't 对 do not，we're 对 we are。缩写使用率高是"非正式声音"最强的单一信号之一。
黑话密度 —— 每千字行业专属术语数。相对于你目标读者的知识水平来衡量，不是你内部团队。
幽默和比喻语言 —— 频率、类型（冷面、荒诞、自嘲）、目标对象。幽默是模型最难靠规则复刻的模式，这也是为什么风格指南里的范例部分比形容词部分重要得多。
问句频率 —— 修辞问句和直接问句。某些声音（我）把问句当作结构支点。其他的从不提问只回答。
数据引用方式 —— 怎么把数字带进来。括号内？行内？脚注？带不带出处？这是一个小维度，但对"可信度"感知影响巨大。
开头钩子模式 —— 文章第一句。多数声音有 2-3 种招牌开头轮着用。按 Claude 对我的分析：（a）具体数字/小场景，（b）反主流说法，（c）小段个人瞬间。从不用定义。
CTA（Call to Action，行动召唤）方式 —— 文章怎么收。三种常见模式：行动清单、一句话要点、开放问题。挑跟你发布节奏匹配的那一种。
列表-正文比例 —— 文章里 bullet point 占比。AI 默认约 40% 列表。多数人类声音落在 15-25%。这个数字是"是不是 AI 写的"最强的单一信号。

有些维度用正则（regex，文本模式匹配）就能量——缩写、句长、代词计数；其他要靠模型的阅读判断。我通常用混合：维度 2、3、5、6、8、12 用程序计数；1、4、7、9、10、11 用模型判断。

完整 Prompt

这是我用的 prompt，原文。上面贴 20 篇内容，下面塞这个 prompt，提交。

你是一位品牌声音分析师。我会给你一个品牌的 20 篇已发布内容。
你的任务是产出 12 维声音画像。

对下面每个维度，输出：
- 一个精确分数（用给出的单位）
- 1-2 句引用文本具体证据的论证
- 一个招牌例子（从语料里摘一句能代表该模式的短引文）

12 个维度：

1. 正式程度光谱（0-100，0=正式-Economist，100=口语-Substack）
2. 平均句长（字数，加标准差）
3. 主动 vs 被动语态比例（百分比）
4. 代词策略（按频率给 we / you / I / 第三人称 排序）
5. 缩写使用（含至少一个缩写的句子占比）
6. 黑话密度（每千字行业专属术语数）
7. 幽默和比喻语言（频率、类型、目标对象）
8. 问句频率（每千字问句数，分修辞 vs 直接）
9. 数据引用方式（行内 / 括号 / 脚注，带不带出处）
10. 开头钩子模式（最常见的 2-3 种首句形态，各举一例）
11. CTA 方式（文章怎么收——排出前 3 种模式）
12. 列表-正文比例（在 bullet 或编号列表里的字数占比）

最后，输出一段"声音总结"——一位初级文案读 3 分钟输出就能模仿这个品牌的总结。

要诚实。如果声音在文章之间不一致，直接说出来，识别出 2-3 种
子声音。不要奉承作者。引用具体句子作为证据。

最后两句是承重的。少了它们，模型会吐出一份奉承式的总结，把棱角都平均掉。多了它们，你得到的是真正有用的声音——包括你自己都不知道的不一致性。

输出长什么样

对我自己的写作，Claude 输出了大致下面这样（意译——完整输出约 700 字）：

声音画像：Song, AI Marketing Focus

正式程度：72/100。缩写出现在 78% 的句子里，持续偏好短句。声音偶尔在技术文章掉到 30/100，在观点文章升到 90/100。

平均句长：14.3 字（标准差 8.1）。偏短。标准差大于中位数，说明有意做节奏变化。

主动 vs 被动：91% 主动。几乎无被动结构。

代词策略：you (38%)，I (24%)，we (12%)，第三人称 (26%)。高 I 频率是最偏离典型 B2B 营销声音的特征。

缩写：78% 句子。

黑话密度：每千字 4.2 个术语。低于典型 SaaS（平均 11）。

幽默：冷面、自嘲，70% 时候目标对象是作者自己（如"我要是说这是个干净实验，那是骗你"）。几乎从不针对读者。

问句：每千字 6.3 个，其中 80% 是修辞支点，20% 是直接问读者。

数据引用：行内，不带正式出处链接。数字用"大致""约""差不多"引出——从不用权威断言。

开头钩子：（a）具体数字/场景 (40%)，（b）反主流说法 (30%)，（c）小段个人瞬间 (20%)，其他 (10%)。

CTA：一句话要点 (50%)，开放问题 (30%)，行动清单 (20%)。

列表-正文比：18%。在同类内容里显著偏低。

声音总结： 一位 15 年的从业者写给其他从业者。这个声音假设读者已经做过功课；不解释基础。直接但不生硬，有观点但不挑衅，自我觉察到能承认实验没做成。招牌动作是"扎心的精准"——一个关于作者自己流程的事实，作者本来不会主动交代。

这段总结是我现在放在每个 Claude Project 顶部、每个 ChatGPT Custom Instructions 字段里的内容。这就是品牌声音文档——以模型能用的形式。

把画像变成可用的风格指南

12 维画像是分析。风格指南是操作版——写作者（人或模型）能照着做、不用每次回头重读分析的规则。

把 12 个维度翻译成 12 条规则。每个维度一条规则。每条规则加上（a）一正一反的范例，（b）触发重写的分数阈值。

对我声音的规则长这样：

正式程度（目标 70/100）： 用缩写。丢掉第三人称企业腔。不写"用户可以配置"——写"你可以这样设置"。
句长（目标 14 字，标准差 8）： 短句（5-10 字）和长句（20-30 字）混着来。连续三句短句是个破绽。
主动语态（目标 90%+）： "我们上了这个功能"而不是"该功能已发布"。
代词（偏 you 和 I）： 避免 we，除非指真正在做这件事的团队。
缩写（目标 80%+）： "Don't" 不是 "do not"。"It's" 不是 "it is"。
黑话（目标 <5/千字）： 如果术语需要定义，就行内定义，否则不用。
幽默： 冷面、自嘲。绝不让读者成为笑点。
问句： 用作结构支点，不是填充。每 500 字一个修辞问句足矣。
数据： 估算用"大致""约""差不多"。具体声明要带具体出处。不要"研究表明"而不给研究。
开头钩子： 具体数字、场景、或反主流说法。不用定义句。不用"在今天的世界里……"这种开头。
CTA： 三种结尾里挑一种，有意识地轮换。不要每篇都用行动清单收尾。
列表-正文比（目标 <20%）： 如果一篇文章超过 25% 是列表，结构就在抢本来该由正文做的工作。重写。

结果是一页纸。这一页就是塞进 Claude Project Instructions、ChatGPT Custom Instructions、团队里每个 Custom GPT（ChatGPT 提供的"训练一个专属助手"功能）和 Gemini Gem（Gemini 的预配置个性化 AI 助手）的内容。这是操作版的声音。

要注意什么

新手跑这个流程时我反复看到的三种失败。

1. 选错 20 篇内容。 只挑"高光集锦"，模型会过度拟合到你最精致的声音，错过读者日常体验的语域。塞 5-7 篇你没那么满意的。毛糙的地方才是稳定性的来源。

2. 只跑一次分析就当真理。 声音会漂移。每季度在滚动 6 个月的窗口上跑一次分析。如果某个维度移动超过 15%，声音在变——你需要判断这是有意还是漂移。

3. 规则过拟合。 12 维画像描述声音。它不规定每句话。如果你把每条规则都变成硬约束（"绝不用超过 20 字的句子"），模型产出的就是满足约束、读起来像清单的文本。挑 2-3 条做硬限制，其他做软目标。声音活在软目标里。

完整 API 脚本

如果想按需跑这个——比如每季度一次，跟上你声音的演化——整个工作流 15 行 Python。画像存成 JSON 文件，可以跨版本 diff。

pythonimport anthropic
import json
from pathlib import Path

client = anthropic.Anthropic()
corpus = Path("voice-corpus.txt").read_text()

prompt = Path("voice-analyzer-prompt.txt").read_text()

msg = client.messages.create(
    model="claude-sonnet-4-5",
    max_tokens=4096,
    messages=[{
        "role": "user",
        "content": f"{prompt}\n\n---CORPUS---\n{corpus}\n---END CORPUS---"
    }]
)

profile = msg.content[0].text
Path("voice-profile.json").write_text(profile)
print(f"Profile written: {len(profile)} chars")

想跨季度比较，在新语料上跑同一个脚本，写到 voice-profile-2025Q2.json，diff 一下 JSON key。变动的维度就是你刚刚失去控制的维度。

它替代了什么

我不给客户写品牌声音文档了。直接拿客户最好的 20 篇内容跑分析器，把 12 维画像交给他，当场翻译成一页式风格指南。整个过程 90 分钟，包括 Claude 跑分析的 4 分钟。输出比两周的品牌工作坊更准，客户当天就能用。

声音最难的不是定义它。是让模型看到你已经写过的内容，并且相信里面的模式就是你真正持有的声音——不是你以为自己有的声音。

拿你自家的归档跑一遍分析器。第一次结果通常有点扎心。半年后第二次结果，就是你一直试图写向的那个声音。

Twitter LinkedIn Facebook Reddit Email

用 Claude 把一个核心选题扩展成 30 天内容日历小预算 AI 出价优化：每天 50 美元也别烧钱 Claude Computer Use:让 AI 自己看 SERP,然后自己写内容简报不听起来像 AI 写的长文大纲：Claude 的方法