Claude Computer Use:让 AI 自己看 SERP,然后自己写内容简报
目录
上周二,我只给 Claude Sonnet 4.5 喂了一个目标关键词和一张空白 Chromium 标签页的截图。4 分钟后,它产出了一份 1200 字的内容简报:引用了 SERP(搜索引擎结果页)上 10 个"People Also Ask"(其他人也搜)问题中的 8 个,梳理出前 5 名结果共用的 H2 结构,还标出了一个所有竞品都没覆盖的内容缺口。我一个 URL 都没给。
诀窍在于 Claude Computer Use —— Anthropic 的一个 beta 工具,它让模型面对一块虚拟屏幕:截图 → 返回动作(点这里、输这个字、滚动、读这段)→ 循环执行。官方主推的场景是浏览器自动化,但几乎没人讨论的那个用例,正在悄悄取代一半的 SEO 工具链:让一个内容简报 Agent 像人一样读 SERP,然后自己把简报写出来。
这就是我搭建这个 Agent 的全过程、跑过 60 多份简报后总结的经验,以及它在什么场景下真正值得用。
为什么"真实"SERP 上下文,胜过抓取的纯文本
大多数程序化 SERP 抓取工具(Ahrefs、SEMrush,我们自己写的 Playwright 脚本)都返回三列:标题、URL、Meta 描述。这是 1990 年代对 SERP 的理解。今天的搜索结果页是一份结构化文档:这边是知识卡片,那边是 AI Overview(Google 生成的 AI 摘要框),中间夹着 People Also Ask 折叠菜单,底部是相关搜索、Sitelinks、视频轮播。搜索意图藏在版式里,不只是文字里。
一个有经验的 SEO 打开 SERP 时,先扫的是结构。看 Google 主动推了哪些问题。数一下广告位、谁抢到了精选摘要位,再追问一句"这篇内容明显比那篇差,凭什么排前面?"。一个纯文本抓取工具把这些信息全扔掉了。
Claude Computer Use 是像人一样读 SERP 的。它会滚动、展开 PAA 折叠菜单、点进排名靠前的文章,然后把观察结果写进一个草稿本。它产出的简报基于一个真实用户实际看到的页面,而不是解析后的抽象数据。
5 步搭建流程
第一步:起一个 Claude 能驱动的无头浏览器
computer_20251124 这个工具类型需要一块虚拟屏幕、像素尺寸、以及一套收发截图和执行动作的机制。我找到的最干净的方案是 Docker 容器:
dockerfileFROM mcr.microsoft.com/playwright:v1.48.0-jammy
RUN apt-get update && apt-get install -y xvfb x11vnc
ENV DISPLAY=:99
CMD Xvfb :99 -screen 0 1440x900x24 & \
x11vnc -display :99 -forever -rfbport 5900 & \
sleep infinity启动后转发 5900 端口(可选,只是想看的话),你就得到一块 1440×900 的虚拟桌面,Claude 可以直接操作。我把它跑在一台每月 7 美元的 Hetzner(欧洲一家平价云服务商)机器上。
第二步:接好 Agent 循环
核心循环大约 60 行 Python。伪代码:
pythondef run_agent(goal: str, max_turns: int = 50):
history = [{"role": "user", "content": goal}]
for turn in range(max_turns):
response = client.beta.messages.create(
model="claude-sonnet-4-5-20250929",
max_tokens=4096,
tools=[{
"type": "computer_20251124",
"name": "computer",
"display_width_px": 1440,
"display_height_px": 900,
}],
messages=history,
system=SYSTEM_PROMPT,
)
action = parse_action(response) # left_click, type, scroll, etc.
if action is None:
return extract_brief(response)
execute(action) # 派发到 playwright / xdotool
screenshot = capture()
history.append(screenshot_to_tool_result(response, screenshot))大多数人漏掉的点:动作原语是像素坐标加按键码。一次点击是 x=842, y=311,一次滚动是 delta_y=400。你得用 xdotool(一个命令行工具,可以在 X 桌面上模拟键鼠操作)把它们派发到 X 显示器上。体验上不如 API SDK 自带的 web_search、text_editor 工具清爽,但写好派发器之后就稳了。
第三步:给 Agent 一本草稿本
Computer Use 本身在每次截图之间会"失忆"。你得想办法让 Agent 做持久化笔记 —— 不然 40 轮之后产出的简报只剩下"我最后看到的那段"。把 text_editor_20250722 工具和 computer 工具一起挂上,Agent 就能把观察写进一个跨循环保存的文件:
BRIEF.md(第 6 轮后):
- 目标关键词:"AI content brief tool"
- 首屏有 4 条广告,全部推 Surfer / Clearscope / Frase
- 精选摘要:列表型,"8 款工具对比"
- PAA Q1:"Is there a free AI content brief tool?"
- PAA Q4:"How is an AI brief different from a regular outline?"这是杠杆最高的一步改造。没有草稿本,Agent 就会瞎编 SERP 内容;有了它,简报里能引到真实的页码。
第四步:用系统提示词把 Agent 框成"产出简报"的角色
这是我真正在用的提示词,跑得通:
You are a senior SEO content strategist. You research search results by browsing
Google in a real browser. Your job is to produce a content brief for a writer.
Rules:
- Always start with a single Google search for the target keyword.
- Read the top 5 organic results. For each, note the URL, word count, H2s,
and one unique angle.
- Expand at least 6 "People Also Ask" boxes. Quote the question text exactly.
- Note the featured snippet format (list, paragraph, table) and what would beat it.
- After browsing, write a final brief to BRIEF.md with these sections:
1. Search intent (informational / commercial / transactional)
2. The 8 questions PAA surfaced, verbatim
3. The 5 subheadings every top-3 result uses
4. The angle gap — what no one is covering well
5. Recommended word count and format
6. 3 internal link targets
- Do not write the article. Stop after the brief.
- If a CAPTCHA appears, abandon the brief and return "BLOCKED".里面有两个不太显眼的设计:一是"如果出现验证码"的分支,能帮你省下 0.5 美元 —— 不然它会陷入永远跑不完的死循环;二是"不要写文章",这能拦住 Agent 越界,毕竟你不让它写,它会自己洋洋洒洒来一篇 2000 字,那就违背初衷了。
第五步:触发 + 落地
端到端这就是一次函数调用。生产环境我把它包进一个小 Flask 应用,团队成员把关键词丢进 Slack 表单,4-6 分钟就能在 DM 里收到简报。我们每周这么处理 8-12 份。
简报实际长什么样
针对关键词"AI content brief tool",Agent 产出简报的前三段是这样:
搜索意图(Search Intent)。 商业调研型。用户知道内容简报这东西存在,正在对比工具,接近购买决策。搜索结果页被广告和对比型清单文主导。
PAA 问题,逐字引用。 "What is the best AI tool for content briefs?" / "Is there a free AI content brief tool?" / "How is an AI brief different from a regular outline?" / "Do content writers use briefs?" / "How long should a content brief be?" / "What should a content brief include?" / "Are AI content briefs good for SEO?" / "Can ChatGPT write a content brief?"
前 3 名结果共用的副标题。 What is a content brief / Why use one / Key elements / How to write one / Best tools / Free vs paid / Conclusion。内容缺口:没有一篇以"你到底需不需要内容简报"开篇 —— 这个角度根本没人占。
最后那句话是我最看重的部分。换成周二的下午我自己手动看,大概率注意不到这个缺口。Agent 4 分钟搞定了。
需要注意的坑
- 循环预算。 我设的上限是 50 轮。一份干净的简报通常 25-35 轮。超过 50 轮基本就是死循环,要么是 Google 改了版式,要么是 Agent 点偏了一次。
- 成本。 Sonnet 4.5 配截图并不便宜。每张截图约 1300 tokens。一份 35 轮的简报,根据截图密度,实际花 0.30-0.80 美元。一定要记账。第一周我们没节制,凡是能想到的关键词全跑了一遍,一周烧了 14 美元。
- 验证码和频率限制。 大约 1-2% 的 Google 查询会撞验证码。提示词里的"BLOCKED"分支就是干这个的。别想着自己解验证码 —— 一小时内你家的 IP 就会被 Google 拉进影子黑名单(因多次可疑操作被降权标记)。
- 别让它抓自己的站。 Agent 会老老实实把你站上的弱点列进"内容缺口"分析里。简报的对象永远是竞品,不是自己。
- 别信它估算的字数。 它是按渲染后的页面估的,经常把导航、页脚、评论一起算进去。乘以 0.7-0.8 才是真实正文长度。
它真正发挥价值的地方
对于全新主题 —— SERP 还新鲜、搜索意图模糊的那种 —— 这一套是我每周最值的 4 分钟。对于已经成熟的关键词集群、我对 SERP 了如指掌的,反而是杀鸡用牛刀。它真正出彩的场景是:有一阵子没看的关键词、或者团队里写手们吵起来的选题。
这套模式可以推广。只要是"看一个真实页面,推理它的结构"这类任务 —— 拆解竞品定价页、挖竞品广告文案、抓 App Store 评论做情感分析 —— 现在都是 60 行 Python 加一段系统提示词。我手头有 6 个这样的 Agent。"AI 会不会取代营销人"这种说法是错的,但一个手里有 6 个 Claude Agent、月费 7 美元的营销人,会跑赢一个月花 300 美元买 SaaS 的营销人。这才是真正在发生的故事。