SEO

Claude Computer Use:让 AI 自己看 SERP,然后自己写内容简报

2025年2月7日

上周二,我只给 Claude Sonnet 4.5 喂了一个目标关键词和一张空白 Chromium 标签页的截图。4 分钟后,它产出了一份 1200 字的内容简报:引用了 SERP(搜索引擎结果页)上 10 个"People Also Ask"(其他人也搜)问题中的 8 个,梳理出前 5 名结果共用的 H2 结构,还标出了一个所有竞品都没覆盖的内容缺口。我一个 URL 都没给。

诀窍在于 Claude Computer Use —— Anthropic 的一个 beta 工具,它让模型面对一块虚拟屏幕:截图 → 返回动作(点这里、输这个字、滚动、读这段)→ 循环执行。官方主推的场景是浏览器自动化,但几乎没人讨论的那个用例,正在悄悄取代一半的 SEO 工具链:让一个内容简报 Agent 像人一样读 SERP,然后自己把简报写出来。

这就是我搭建这个 Agent 的全过程、跑过 60 多份简报后总结的经验,以及它在什么场景下真正值得用。

为什么"真实"SERP 上下文,胜过抓取的纯文本

大多数程序化 SERP 抓取工具(Ahrefs、SEMrush,我们自己写的 Playwright 脚本)都返回三列:标题、URL、Meta 描述。这是 1990 年代对 SERP 的理解。今天的搜索结果页是一份结构化文档:这边是知识卡片,那边是 AI Overview(Google 生成的 AI 摘要框),中间夹着 People Also Ask 折叠菜单,底部是相关搜索、Sitelinks、视频轮播。搜索意图藏在版式里,不只是文字里。

一个有经验的 SEO 打开 SERP 时,先扫的是结构。看 Google 主动推了哪些问题。数一下广告位、谁抢到了精选摘要位,再追问一句"这篇内容明显比那篇差,凭什么排前面?"。一个纯文本抓取工具把这些信息全扔掉了。

Claude Computer Use 是像人一样读 SERP 的。它会滚动、展开 PAA 折叠菜单、点进排名靠前的文章,然后把观察结果写进一个草稿本。它产出的简报基于一个真实用户实际看到的页面,而不是解析后的抽象数据。

5 步搭建流程

第一步:起一个 Claude 能驱动的无头浏览器

computer_20251124 这个工具类型需要一块虚拟屏幕、像素尺寸、以及一套收发截图和执行动作的机制。我找到的最干净的方案是 Docker 容器:

dockerfileFROM mcr.microsoft.com/playwright:v1.48.0-jammy
RUN apt-get update && apt-get install -y xvfb x11vnc
ENV DISPLAY=:99
CMD Xvfb :99 -screen 0 1440x900x24 & \
    x11vnc -display :99 -forever -rfbport 5900 & \
    sleep infinity

启动后转发 5900 端口(可选,只是想看的话),你就得到一块 1440×900 的虚拟桌面,Claude 可以直接操作。我把它跑在一台每月 7 美元的 Hetzner(欧洲一家平价云服务商)机器上。

第二步:接好 Agent 循环

核心循环大约 60 行 Python。伪代码:

pythondef run_agent(goal: str, max_turns: int = 50):
    history = [{"role": "user", "content": goal}]
    for turn in range(max_turns):
        response = client.beta.messages.create(
            model="claude-sonnet-4-5-20250929",
            max_tokens=4096,
            tools=[{
                "type": "computer_20251124",
                "name": "computer",
                "display_width_px": 1440,
                "display_height_px": 900,
            }],
            messages=history,
            system=SYSTEM_PROMPT,
        )
        action = parse_action(response)  # left_click, type, scroll, etc.
        if action is None:
            return extract_brief(response)
        execute(action)  # 派发到 playwright / xdotool
        screenshot = capture()
        history.append(screenshot_to_tool_result(response, screenshot))

大多数人漏掉的点:动作原语是像素坐标加按键码。一次点击是 x=842, y=311,一次滚动是 delta_y=400。你得用 xdotool(一个命令行工具,可以在 X 桌面上模拟键鼠操作)把它们派发到 X 显示器上。体验上不如 API SDK 自带的 web_search、text_editor 工具清爽,但写好派发器之后就稳了。

第三步:给 Agent 一本草稿本

Computer Use 本身在每次截图之间会"失忆"。你得想办法让 Agent 做持久化笔记 —— 不然 40 轮之后产出的简报只剩下"我最后看到的那段"。把 text_editor_20250722 工具和 computer 工具一起挂上,Agent 就能把观察写进一个跨循环保存的文件:

BRIEF.md(第 6 轮后):
- 目标关键词:"AI content brief tool"
- 首屏有 4 条广告,全部推 Surfer / Clearscope / Frase
- 精选摘要:列表型,"8 款工具对比"
- PAA Q1:"Is there a free AI content brief tool?"
- PAA Q4:"How is an AI brief different from a regular outline?"

这是杠杆最高的一步改造。没有草稿本,Agent 就会瞎编 SERP 内容;有了它,简报里能引到真实的页码。

第四步:用系统提示词把 Agent 框成"产出简报"的角色

这是我真正在用的提示词,跑得通:

You are a senior SEO content strategist. You research search results by browsing
Google in a real browser. Your job is to produce a content brief for a writer.

Rules:
- Always start with a single Google search for the target keyword.
- Read the top 5 organic results. For each, note the URL, word count, H2s,
  and one unique angle.
- Expand at least 6 "People Also Ask" boxes. Quote the question text exactly.
- Note the featured snippet format (list, paragraph, table) and what would beat it.
- After browsing, write a final brief to BRIEF.md with these sections:
  1. Search intent (informational / commercial / transactional)
  2. The 8 questions PAA surfaced, verbatim
  3. The 5 subheadings every top-3 result uses
  4. The angle gap — what no one is covering well
  5. Recommended word count and format
  6. 3 internal link targets
- Do not write the article. Stop after the brief.
- If a CAPTCHA appears, abandon the brief and return "BLOCKED".

里面有两个不太显眼的设计:一是"如果出现验证码"的分支,能帮你省下 0.5 美元 —— 不然它会陷入永远跑不完的死循环;二是"不要写文章",这能拦住 Agent 越界,毕竟你不让它写,它会自己洋洋洒洒来一篇 2000 字,那就违背初衷了。

第五步:触发 + 落地

端到端这就是一次函数调用。生产环境我把它包进一个小 Flask 应用,团队成员把关键词丢进 Slack 表单,4-6 分钟就能在 DM 里收到简报。我们每周这么处理 8-12 份。

简报实际长什么样

针对关键词"AI content brief tool",Agent 产出简报的前三段是这样:

搜索意图(Search Intent)。 商业调研型。用户知道内容简报这东西存在,正在对比工具,接近购买决策。搜索结果页被广告和对比型清单文主导。

PAA 问题,逐字引用。 "What is the best AI tool for content briefs?" / "Is there a free AI content brief tool?" / "How is an AI brief different from a regular outline?" / "Do content writers use briefs?" / "How long should a content brief be?" / "What should a content brief include?" / "Are AI content briefs good for SEO?" / "Can ChatGPT write a content brief?"

前 3 名结果共用的副标题。 What is a content brief / Why use one / Key elements / How to write one / Best tools / Free vs paid / Conclusion。内容缺口:没有一篇以"你到底需不需要内容简报"开篇 —— 这个角度根本没人占。

最后那句话是我最看重的部分。换成周二的下午我自己手动看,大概率注意不到这个缺口。Agent 4 分钟搞定了。

需要注意的坑

循环预算。 我设的上限是 50 轮。一份干净的简报通常 25-35 轮。超过 50 轮基本就是死循环,要么是 Google 改了版式,要么是 Agent 点偏了一次。
成本。 Sonnet 4.5 配截图并不便宜。每张截图约 1300 tokens。一份 35 轮的简报,根据截图密度,实际花 0.30-0.80 美元。一定要记账。第一周我们没节制,凡是能想到的关键词全跑了一遍,一周烧了 14 美元。
验证码和频率限制。 大约 1-2% 的 Google 查询会撞验证码。提示词里的"BLOCKED"分支就是干这个的。别想着自己解验证码 —— 一小时内你家的 IP 就会被 Google 拉进影子黑名单(因多次可疑操作被降权标记)。
别让它抓自己的站。 Agent 会老老实实把你站上的弱点列进"内容缺口"分析里。简报的对象永远是竞品,不是自己。
别信它估算的字数。 它是按渲染后的页面估的,经常把导航、页脚、评论一起算进去。乘以 0.7-0.8 才是真实正文长度。

它真正发挥价值的地方

对于全新主题 —— SERP 还新鲜、搜索意图模糊的那种 —— 这一套是我每周最值的 4 分钟。对于已经成熟的关键词集群、我对 SERP 了如指掌的,反而是杀鸡用牛刀。它真正出彩的场景是:有一阵子没看的关键词、或者团队里写手们吵起来的选题。

这套模式可以推广。只要是"看一个真实页面,推理它的结构"这类任务 —— 拆解竞品定价页、挖竞品广告文案、抓 App Store 评论做情感分析 —— 现在都是 60 行 Python 加一段系统提示词。我手头有 6 个这样的 Agent。"AI 会不会取代营销人"这种说法是错的,但一个手里有 6 个 Claude Agent、月费 7 美元的营销人,会跑赢一个月花 300 美元买 SaaS 的营销人。这才是真正在发生的故事。

Twitter LinkedIn Facebook Reddit Email

用 Claude 把一个核心选题扩展成 30 天内容日历小预算 AI 出价优化：每天 50 美元也别烧钱用 Claude 搭一个品牌声音分析器：喂 20 篇稿子，吐 12 维风格指南 Claude Computer Use:搭一个审核 Agent,给你的 Meta 广告素材做体检