AI Tools

用 Claude 搭一个品牌声音分析器:喂 20 篇稿子,吐 12 维风格指南

用 Claude 搭一个品牌声音分析器:喂 20 篇稿子,吐 12 维风格指南
目录

上周我让 Claude 读了我自己过去 14 个月发布的 22 篇英文文章——这个博客上所有英文长文——让它告诉我它看到了什么。没有指令,没有范例,只有一句 prompt(提示词):"用 12 个可测量的维度分析我的写作风格,输出一份结构化画像。"

Claude 吐回来的 12 维画像精准到有点扎心。它标出来:我 78% 的句子用了缩写,口语/正式 70/30,几乎从不用感叹号,文章开头要么是个小场景要么是具体数字(从不用定义句),结尾只用三种招牌动作之一:一句话要点、一个重新框定的问题、或者一个开放问题。其中两种模式是我绝不会主动承认自己有的。还有一种跟我以为自己持有的声音相反。

这个 4 分钟的实验产出的东西,比我用了 18 个月的品牌声音文档更好。花了 4 分钟,API token 成本约 $0.40。这是我现在每个新客户都跑的流程。

下面是完整方法。

为什么品牌手册抓不住品牌声音

大部分品牌声音文档栽在同一步:用形容词描述声音——"温暖、大胆、权威、亲和"——然后奇怪为什么把内容贴进 ChatGPT 之后,模型输出的还是通用文案。

原因是结构性的。形容词是模式的压缩版。它对人类写作者有效,因为人类能基于多年上下文推断出模式;对模型无效,因为模型没有这些上下文。要从 Claude、ChatGPT、Gemini 得到稳定的输出,你需要抽取模式本身——句长、句式、代词选择、修辞动作——直接交出去。

30 页品牌手册活在 CMO 脑子里。1 页风格指南活在模型的上下文窗口(context window,即模型每次对话读取的工作记忆——Claude 一般 200K tokens,GPT-4 系列 128K,但实际使用中你希望所有内容能塞进一次对话)。一份是宣言,一份是工具。

工具的源数据就躺在你的 CMS(Content Management System,内容管理系统)里。你只是还没挖过。

准备工作(5 分钟)

你需要三样东西:

  • 20+ 篇你引以为豪的已发布内容。 博客、newsletter、销售邮件、产品页——任何用你品牌声音写的东西。种类越丰富,画像越好。不要只挑"最满意的几篇";把中等水平的也塞几篇,这样模型看到的是范围,不是高光集锦。
  • Claude Sonnet 4.5 或 Opus 4.7。 Sonnet 大部分分析够用,便宜 5 倍。如果要从文学或长篇内容里抽细微风格模式,用 Opus。
  • 一份干净的纯文本 dump。 去掉格式——没有标题、没有图片、没有 markdown 加粗。你要的是模型分析正文,不是版式。一个 .txt 文件,把 20 篇拼接起来,用 ---POST 1--- 这种标记分开,就够了。

如果你在 Claude.ai 用,直接把内容贴进对话窗口就行。如果想要可复用的 prompt,用 API——Anthropic 的 Python SDK(Software Development Kit,软件开发工具包)只要两行代码,完整脚本在文章末尾。

12 个维度

这些是我测量的维度。选它们是因为每个都满足:(a)文本里观察得到;(b)好文章里持续存在;(c)可操作——一旦知道落点,就能写出模型能照做的规则。

  1. 正式程度光谱 —— 在 The Economist 和 Substack newsletter 之间的位置。我的落点大约 70% 口语 / 30% 正式。一个高端 B2B(Business to Business,企业对企业)品牌可能落在 30/70。

  2. 平均句长 —— 按字数计。营销文案一般 12-18 字。文学长篇 20-30。短不总是更好;方差比均值更重要。

  3. 主动 vs 被动语态比例 —— 你的默认语法姿态。AI 模型默认被动,因为训练数据过度代表正式文本。主动语态听起来更自信。

  4. 代词策略 —— we / you / I / 第三人称。每种代词选择都暗示一种关系。B2B SaaS(Software as a Service,软件即服务)博客偏 you。创始人主导的 newsletter 偏 I。企业品牌偏 we

  5. 缩写使用 —— don'tdo notwe'rewe are。缩写使用率高是"非正式声音"最强的单一信号之一。

  6. 黑话密度 —— 每千字行业专属术语数。相对于你目标读者的知识水平来衡量,不是你内部团队。

  7. 幽默和比喻语言 —— 频率、类型(冷面、荒诞、自嘲)、目标对象。幽默是模型最难靠规则复刻的模式,这也是为什么风格指南里的范例部分比形容词部分重要得多。

  8. 问句频率 —— 修辞问句和直接问句。某些声音(我)把问句当作结构支点。其他的从不提问只回答。

  9. 数据引用方式 —— 怎么把数字带进来。括号内?行内?脚注?带不带出处?这是一个小维度,但对"可信度"感知影响巨大。

  10. 开头钩子模式 —— 文章第一句。多数声音有 2-3 种招牌开头轮着用。按 Claude 对我的分析:(a)具体数字/小场景,(b)反主流说法,(c)小段个人瞬间。从不用定义。

  11. CTA(Call to Action,行动召唤)方式 —— 文章怎么收。三种常见模式:行动清单、一句话要点、开放问题。挑跟你发布节奏匹配的那一种。

  12. 列表-正文比例 —— 文章里 bullet point 占比。AI 默认约 40% 列表。多数人类声音落在 15-25%。这个数字是"是不是 AI 写的"最强的单一信号。

有些维度用正则(regex,文本模式匹配)就能量——缩写、句长、代词计数;其他要靠模型的阅读判断。我通常用混合:维度 2、3、5、6、8、12 用程序计数;1、4、7、9、10、11 用模型判断。

完整 Prompt

这是我用的 prompt,原文。上面贴 20 篇内容,下面塞这个 prompt,提交。

你是一位品牌声音分析师。我会给你一个品牌的 20 篇已发布内容。
你的任务是产出 12 维声音画像。

对下面每个维度,输出:
- 一个精确分数(用给出的单位)
- 1-2 句引用文本具体证据的论证
- 一个招牌例子(从语料里摘一句能代表该模式的短引文)

12 个维度:

1. 正式程度光谱(0-100,0=正式-Economist,100=口语-Substack)
2. 平均句长(字数,加标准差)
3. 主动 vs 被动语态比例(百分比)
4. 代词策略(按频率给 we / you / I / 第三人称 排序)
5. 缩写使用(含至少一个缩写的句子占比)
6. 黑话密度(每千字行业专属术语数)
7. 幽默和比喻语言(频率、类型、目标对象)
8. 问句频率(每千字问句数,分修辞 vs 直接)
9. 数据引用方式(行内 / 括号 / 脚注,带不带出处)
10. 开头钩子模式(最常见的 2-3 种首句形态,各举一例)
11. CTA 方式(文章怎么收——排出前 3 种模式)
12. 列表-正文比例(在 bullet 或编号列表里的字数占比)

最后,输出一段"声音总结"——一位初级文案读 3 分钟输出就能模仿这个品牌的总结。

要诚实。如果声音在文章之间不一致,直接说出来,识别出 2-3 种
子声音。不要奉承作者。引用具体句子作为证据。

最后两句是承重的。少了它们,模型会吐出一份奉承式的总结,把棱角都平均掉。多了它们,你得到的是真正有用的声音——包括你自己都不知道的不一致性。

输出长什么样

对我自己的写作,Claude 输出了大致下面这样(意译——完整输出约 700 字):

声音画像:Song, AI Marketing Focus

  1. 正式程度:72/100。缩写出现在 78% 的句子里,持续偏好短句。声音偶尔在技术文章掉到 30/100,在观点文章升到 90/100。
  2. 平均句长:14.3 字(标准差 8.1)。偏短。标准差大于中位数,说明有意做节奏变化。
  3. 主动 vs 被动:91% 主动。几乎无被动结构。
  4. 代词策略:you (38%),I (24%),we (12%),第三人称 (26%)。高 I 频率是最偏离典型 B2B 营销声音的特征。
  5. 缩写:78% 句子。
  6. 黑话密度:每千字 4.2 个术语。低于典型 SaaS(平均 11)。
  7. 幽默:冷面、自嘲,70% 时候目标对象是作者自己(如"我要是说这是个干净实验,那是骗你")。几乎从不针对读者。
  8. 问句:每千字 6.3 个,其中 80% 是修辞支点,20% 是直接问读者。
  9. 数据引用:行内,不带正式出处链接。数字用"大致""约""差不多"引出——从不用权威断言。
  10. 开头钩子:(a)具体数字/场景 (40%),(b)反主流说法 (30%),(c)小段个人瞬间 (20%),其他 (10%)。
  11. CTA:一句话要点 (50%),开放问题 (30%),行动清单 (20%)。
  12. 列表-正文比:18%。在同类内容里显著偏低。

声音总结: 一位 15 年的从业者写给其他从业者。这个声音假设读者已经做过功课;不解释基础。直接但不生硬,有观点但不挑衅,自我觉察到能承认实验没做成。招牌动作是"扎心的精准"——一个关于作者自己流程的事实,作者本来不会主动交代。

这段总结是我现在放在每个 Claude Project 顶部、每个 ChatGPT Custom Instructions 字段里的内容。这就是品牌声音文档——以模型能用的形式。

把画像变成可用的风格指南

12 维画像是分析。风格指南是操作版——写作者(人或模型)能照着做、不用每次回头重读分析的规则。

把 12 个维度翻译成 12 条规则。每个维度一条规则。每条规则加上(a)一正一反的范例,(b)触发重写的分数阈值。

对我声音的规则长这样:

  • 正式程度(目标 70/100): 用缩写。丢掉第三人称企业腔。不写"用户可以配置"——写"你可以这样设置"。
  • 句长(目标 14 字,标准差 8): 短句(5-10 字)和长句(20-30 字)混着来。连续三句短句是个破绽。
  • 主动语态(目标 90%+): "我们上了这个功能"而不是"该功能已发布"。
  • 代词(偏 youI): 避免 we,除非指真正在做这件事的团队。
  • 缩写(目标 80%+): "Don't" 不是 "do not"。"It's" 不是 "it is"。
  • 黑话(目标 <5/千字): 如果术语需要定义,就行内定义,否则不用。
  • 幽默: 冷面、自嘲。绝不让读者成为笑点。
  • 问句: 用作结构支点,不是填充。每 500 字一个修辞问句足矣。
  • 数据: 估算用"大致""约""差不多"。具体声明要带具体出处。不要"研究表明"而不给研究。
  • 开头钩子: 具体数字、场景、或反主流说法。不用定义句。不用"在今天的世界里……"这种开头。
  • CTA: 三种结尾里挑一种,有意识地轮换。不要每篇都用行动清单收尾。
  • 列表-正文比(目标 <20%): 如果一篇文章超过 25% 是列表,结构就在抢本来该由正文做的工作。重写。

结果是一页纸。这一页就是塞进 Claude Project Instructions、ChatGPT Custom Instructions、团队里每个 Custom GPT(ChatGPT 提供的"训练一个专属助手"功能)和 Gemini Gem(Gemini 的预配置个性化 AI 助手)的内容。这是操作版的声音。

要注意什么

新手跑这个流程时我反复看到的三种失败。

1. 选错 20 篇内容。 只挑"高光集锦",模型会过度拟合到你最精致的声音,错过读者日常体验的语域。塞 5-7 篇你没那么满意的。毛糙的地方才是稳定性的来源。

2. 只跑一次分析就当真理。 声音会漂移。每季度在滚动 6 个月的窗口上跑一次分析。如果某个维度移动超过 15%,声音在变——你需要判断这是有意还是漂移。

3. 规则过拟合。 12 维画像描述声音。它不规定每句话。如果你把每条规则都变成硬约束("绝不用超过 20 字的句子"),模型产出的就是满足约束、读起来像清单的文本。挑 2-3 条做硬限制,其他做软目标。声音活在软目标里。

完整 API 脚本

如果想按需跑这个——比如每季度一次,跟上你声音的演化——整个工作流 15 行 Python。画像存成 JSON 文件,可以跨版本 diff。

pythonimport anthropic
import json
from pathlib import Path

client = anthropic.Anthropic()
corpus = Path("voice-corpus.txt").read_text()

prompt = Path("voice-analyzer-prompt.txt").read_text()

msg = client.messages.create(
    model="claude-sonnet-4-5",
    max_tokens=4096,
    messages=[{
        "role": "user",
        "content": f"{prompt}\n\n---CORPUS---\n{corpus}\n---END CORPUS---"
    }]
)

profile = msg.content[0].text
Path("voice-profile.json").write_text(profile)
print(f"Profile written: {len(profile)} chars")

想跨季度比较,在新语料上跑同一个脚本,写到 voice-profile-2025Q2.json,diff 一下 JSON key。变动的维度就是你刚刚失去控制的维度。

它替代了什么

我不给客户写品牌声音文档了。直接拿客户最好的 20 篇内容跑分析器,把 12 维画像交给他,当场翻译成一页式风格指南。整个过程 90 分钟,包括 Claude 跑分析的 4 分钟。输出比两周的品牌工作坊更准,客户当天就能用。

声音最难的不是定义它。是让模型看到你已经写过的内容,并且相信里面的模式就是你真正持有的声音——不是你以为自己有的声音。

拿你自家的归档跑一遍分析器。第一次结果通常有点扎心。半年后第二次结果,就是你一直试图写向的那个声音。