回收 1,000 条死链:把外链的 404 批量映射到活页(Ahrefs + Claude)
目录
去年八月我打开一个 SaaS 客户的 Ahrefs 报告,1,243 条断链指向 404 页。手头有周五一个下午。当晚 5 点之前 580 条跳转上线。剩下 663 条不需要跳转——而且根本就不该跳。
断链恢复的难点不是把它们找出来。Ahrefs 的 Broken Backlinks 报告直接交到你手里。难点是判断哪些死主题值得 301、哪些值得 410。Claude 做批量匹配,你做编辑判断。三步搞定。
1. 从 Ahrefs 导出,先加两个筛选
Site Explorer → Backlinks → Broken backlinks。导出之前先加两个筛选:
- DR(域名评级)> 20——低于这个基本都是评论垃圾或低质量目录站,跳了也带不动权重
- 只选 "Follow"——nofollow 不传递权重,跳过
导出成 CSV。DR 筛选通常会砍掉一半左右。那个 SaaS 客户,未筛选是 1,243 条,加完 DR>20 之后剩 612 条。最后其中 580 条变成了活页跳转。
2. 用 Claude 批量归类(这才是真正干活的环节)
把 25–30 行一批丢给 Claude,同时把你站点 10–15 个核心 section 列出来。Prompt:
For each row, give me the topic of the dead URL (read the slug and anchor), and suggest the most likely live URL on my site for the redirect. Output as CSV with columns:
broken_url, anchor, dr, topic, suggested_live_url, confidence. Confidence: "high" if the topic clearly matches an existing section. "no_match" if no live page fits. Do not invent live URLs.
"Do not invent live URLs" 是这条 prompt 里唯一关键的那句。不管这句,Claude 会很有把握地把 /blog/2019/best-x-tool 跳到一个根本不存在的 /blog/best-x-tool-2024。结果就是——你做了一堆跳转到 404 的跳转,比不跳还糟。
Claude 返回结果后,挑 "high" 置信度的行,手动在浏览器里抽 20 个 suggested_live_url 看看。如果都返回 200,这批就过了。如果一半是 404,说明你的 prompt 缺站点上下文——通常需要把 section 结构列得更完整。
3. 上线跳转
筛过的 CSV——只含 suggested_live_url 真实存在的那些行——交给有服务器权限的人。格式看主机:
- Apache / Nginx——
.htaccess或 server config 里一行一条 - Cloudflare——Rules → Redirect Rules 批量上传
- Vercel / Netlify——
vercel.json或_redirects文件
大家最怵的 5 分钟活儿是上传。真正费 3 小时的活儿是匹配。
剩下的那些怎么办
no_match 的行不是失败——它们就是编辑判断。大部分时候,死主题就是真死了:你停售的产品、过期的 campaign 页面。正确答案就是 410。把 301 跳到一个勉强相关的页面,对 Google 来说就是软 404(Soft 404),Google 早就反复表态过了。
如果这个主题确实值得复活(而且你有空写一个新活页),先把新页面建出来,再做跳转。别反着来。
整个活就是一个下午。技能不在工具——在于你愿意把 663 行留在桌上不动。