Paid Media

50 条素材 × 5 个渠道 × 4 类受众:14 天读懂跨渠道付费投放测试矩阵

50 条素材 × 5 个渠道 × 4 类受众:14 天读懂跨渠道付费投放测试矩阵
目录

周日晚 11 点 42 分,Slack 上弹了一条消息。我刚吃完晚饭,B2B SaaS 客户的营销总监把第 14 天的数据读数直接粘贴了过来。矩阵里一共 50 个 cell,最关键的一行是冷流量获客 (cold prospect)——Meta × 产品演示:ROAS 低于目标 34%;TikTok × 产品演示:低于目标 22%;LinkedIn × 精修客户证言:低于目标 12%。过去两周我们在内部一直争论的那几个 cell,数据出来之后,全部符合我们事先的预判。

然后是这一行最右下角那个 cell:LinkedIn × 冷流量获客 × 创始人对着镜头 90 秒,不切镜头、不加包装地讲当初为什么做这家公司——ROAS 高出目标 41%,CTR 是整个矩阵中位数的 3.2 倍。

一个 cell,就是这整轮测试的全部答案。第二天上午,客户把 Meta 冷流量获客的预算砍掉 70%,把我们在 LinkedIn 自然内容上的投入翻了一倍。这次的预算大转弯之所以能落地,是因为矩阵把信号做到了"可读"的程度。大部分"上个季度我们测了 50 条广告"的故事,结局都是一场没人能拿出数据为预算调整背书的 Slack 群争吵。这一次,季度业务评审 (QBR) 上,预算迁移的背后站的是实打实的数字。

让数字站住脚的,是矩阵。下面是这个矩阵的结构。

"在 Meta 上跑 50 条广告"的虚假安全感

我接触的大多数团队一上来都会说"上个季度我们跑了 50 条广告"。当我问"你们学到了什么",答案几乎都是这些:"这个素材方向好像有效"、"这个人群感觉偏冷"、"不知道为什么第三周 ROAS 就掉下来了"。问题不在广告数量,而在于 50 条广告如果只跑在同一个渠道 × 同一套人群结构上,本质上是一次实验,不是 50 次。你把三个维度里的两个锁死,指望第三个维度——创意——承担所有的解释力。

这套打法在 2026 年已经失效了。因为投放系统 (auction) 早就接管了大部分创意筛选工作。Meta 的 Andromeda、TikTok 的 Smart+ Campaign、LinkedIn 的预测人群——算法在渠道 × 人群的组合内部,挑创意变体的速度比任何人都快。真正没被解释清楚的是:哪个「渠道 × 人群 × 创意角度」组合,才是真的适合这款产品。这个问题才决定 ROI。只跑一个渠道,根本回答不了它。

矩阵的方法,是用三个维度同时变化来回答它。

矩阵:5 个渠道 × 4 类人群 × 2-3 个创意角度

我用三个维度搭建结构:

  • 渠道 (5 个): Meta(包含 Facebook + Instagram)、TikTok、LinkedIn、YouTube、Reddit。这五个付费渠道,是一家 B2B SaaS 公司在 14 天窗口里、有像样预算的前提下,有可能触达 ICP(理想客户画像)潜客的全部候选。
  • 人群 (4 类): 冷流量获客 (cold prospect, 宽泛定向,无第一方信号)、网站回访 (warm site visitor, 180 天站内回访)、客户相似人群 (customer lookalike, 1% LAL,用客户名单建模)、流失客户 (lapsed customer, 90 天以上未复购)。
  • 每格的创意角度 (2-3 个): "角度"指的是不同的价值主张,不是不同的 hook。对 B2B SaaS,我通常跑:(a) 产品演示 + 录屏,(b) 创始人对着镜头讲为什么做这家公司,(c) UGC 客户证言或量化的客户案例。这三个角度分别对应三种价值:能力、使命、证据。

乘起来是 5 × 4 × 3 = 60 个 cell。实操中,如果客户的流失客户不足 1000 人可以触达,就砍掉"流失客户"这一列;如果客户没有 Reddit 的社区运营能力,也把 Reddit 砍掉。最小可跑的矩阵:5 × 3 × 3 = 45 个 cell;最大:5 × 4 × 3 = 60 个。我叫它"50 条广告",因为 14 天的窗口里,大多数客户能塞下的工作数字就是 50——再高,创意团队和预算都不一定扛得住。

表格模板

下面是这个模板。Google Sheet 里一个 tab,每个 cell 一行,命名要统一:

Cell ID 渠道 人群 角度 花费(14天) 曝光 点击 CTR CVR CPA ROAS 状态
M-CP-D1 Meta 冷流量 演示 $X ... ... ... ... ... ... 在投 / D7 砍 / D14 砍 / 放量
M-WSV-D1 Meta 网站回访 演示 ...
T-CP-F1 TikTok 冷流量 创始人 ...
L-CP-F1 LinkedIn 冷流量 创始人 ...
Y-CL-D1 YouTube 客户相似 演示 ...
R-WSV-T1 Reddit 网站回访 证言 ...

花费列往左五列是搭建信息,之后全部是输出,通过 Supermetrics、Triple Whale 或各平台原生导出,每晚刷新。命名规则——「渠道-人群-角度#」——是矩阵能被读懂的前提。如果你的广告叫"Ad 1、Ad 2、Ad 3",矩阵就读不出来。Cell ID 才是分析单位。每一次砍量、每一次放量、每一次决策,都要带日期和数字写回这张表里。不写,就是靠感觉在跑。

最小花费数学(简化版,不讲统计课)

这是大多数团队最容易低估、也最容易过度解读的环节。常见冲动是:50 条广告,每条给 $20,跑三天,看到"赢家"就结案。数学上根本立不住。

14 天内要做到 CTR 信号"可读",目标是 95% 置信度、相对提升 25%、对比基准是矩阵中位数。1% 的 CTR 基准(冷流量 B2B 的典型值)意味着每个 cell 大约需要 76,000 次曝光。$5 CPM(千次曝光成本)折算下来,每个 cell 约 $380。50 个 cell 一共 ~$19,000。这是地板。低于这个数,第 14 天的"赢家"可能只是比中位数 CTR 高 30%,但统计学上跟噪声根本分不开。你是在小样本上做模式匹配,不是在读结果。

CVR(转化率)要做到"可读"就难得多:0.5% 转化率基准、25% MDE(最小可检测效应)、95% 置信度,大约需要每个 cell 60,000 次点击。1% CTR 折算就是每个 cell 600 万次曝光,$5 CPM 对应每个 cell $30,000。50 个 cell 一共 $150 万——14 天、绝大多数预算都跑不出来。

所以规则是:**14 天的测试,优化目标是 CTR 可读,不是 CVR 可读。**CTR 是代理指标。用它在第 7 天砍掉垫底的 25%,再把预算挪给表现最好的那批 cell,让它们进入一个更长的转化测试。CVR 的真实信号会在第 3-6 周、在更小的一组放量 cell 上出来,而不是在 14 天的矩阵里。

如果客户只有 $20k 预算,砍 cell,不要砍天数。50 个 cell 每个 $400 是 14 天的地板;20 个 cell 每个 $1,000,10 天就能读出 CTR 信号;10 个 cell 每个 $2,000,7 天就能读出来。矩阵在缩,周期不变。但"50 个 cell 每个 $400 然后把测试拉到 30 天"是行不通的——到第 14 天,撑下来的 cell 已经饱和和疲劳,第 15-30 天的数据对应的人群和第 1-14 天根本不是同一群人。14 天不是预算约束,是结构性选择。

第 7 天 vs 第 14 天的砍量规则

两轮砍量,目标完全不同:

  • **第 7 天砍量——按 CTR 排名。**把 cell 按 CTR 排序,砍掉垫底的 25%,把它们的预算挪给头部的 25%。带一个保留条件:任何 7 天 CTR 在矩阵中位数 1.5 倍以内的 cell,一律保留。1.5 倍这条线,是为了防止你误杀在统计上跟中位数无法区分的 cell。曝光不足 10,000 次的 cell,排名不可信,不要看。这轮砍量不是"这条广告不行"的判断,是"这条广告在可预见的路径上没有赢面"的判断——留给下一轮再测。
  • **第 14 天砍量——看转化读数。**对幸存的上一半个矩阵,看 CPA(单次获客成本)和 ROAS。这是第一次能读出转化信号的时点,而且即便是这一轮,也只有点击量大的头部 cell 才有 CVR 可读性。两类 cell 同时砍:14 天 CPA 比目标高 30% 以上的 并且 从第 7 天到第 14 天 CTR 排名没有提升的。CTR 从第 7 天到第 14 天持平或下滑,意味着这群人在疲劳,cell 是实时在死的,没必要放量。

我看到的常见错误是:第 7 天砍完,后面一周就再没动过矩阵。矩阵是动态的。第 14 天的问题不是"幸存者有没有活下来",而是"幸存者是在加速、稳住、还是在衰减"。第 7 天高于中位数 8%、第 14 天高于中位数 25% 的 cell,是在加速——这是放量候选。第 7 天高于中位数 30%、第 14 天只高 12% 的 cell,是在衰减——不要放量,直接淘汰。

读矩阵:找到维度

测试结束之后,真正要回答的问题不是"哪条广告赢了",而是"赢家活在哪个维度上"。大多数时候,答案会落到三种之一:

  • 渠道维度。 胜出 cell 被某一个渠道主导。比如 LinkedIn × 冷流量 × 创始人视频的 CTR 是其他冷流量 cell 的 3 倍。渠道就是主导维度。下个季度:LinkedIn 预算翻倍,组建 LinkedIn 原生创意团队,把 LinkedIn Ads 的运营节奏和 Meta 分开。
  • 人群维度。 某个人群(网站回访、流失客户、客户相似)在多个渠道都跑赢了其他人群。人是杠杆,渠道是次要的。下个季度:搭建更厚的第一方信号管道来扩大这群人——更多邮件订阅入口、更多 lead form 数据、更多购买数据流进 LAL 的种子包。
  • 角度维度。 某个创意角度(创始人镜头、量化案例、UGC 证言)在多个 cell 都赢了。角度是杠杆,渠道和人群是次要的。下个季度:这个角度再做 10 个变体、换不同 hook、把跑不动的角度彻底砍掉。

一个跑完的矩阵通常会给出主、次、辅三个维度。第一个维度,下个季度 70% 预算押上去;第二个 20%;第三个 10%,作为学习押注。如果跑完找不到明确的主导维度,大概率是矩阵规模不够——加 cell 或者加预算,不要靠平均数硬凑结论。

$90k B2B SaaS 案例

文章开头的那个 50 cell 矩阵,客户是一家 B2B SaaS 公司,产品卖给开发者,ACV(年度合同价值) $12,000。$90k 测试预算、14 天、50 个 cell、每个 $1,800。我们用的是 5 × 4 × 3 减掉 10 个 cell——这 10 个 cell 是我们已经知道"渠道-人群组合不可行"的(比如 Reddit × 冷流量,公司之前在 Reddit 没积累也没社区运营能力;YouTube × 冷流量,14 天内曝光根本凑不到 CTR 可读)。

跑出来的发现:

  • 冷流量获客 × 渠道。 Meta 和 TikTok 的 cell,ROAS 全部低于目标 20-35%。LinkedIn 冷流量的几个 cell 分化:产品演示 -12%,精修证言 -8%,创始人镜头 +41%。规律很清晰:这个渠道在冷流量上具备竞争力,但只有一种角度能真正打穿。LinkedIn 的 B2B ROAS 在 Dreamdata 2026 基准里已经是 121%——我们之前只是没找到对的角度把它在这个产品上解锁出来。
  • 客户相似 × 人群。 客户相似的 cell 跑下来,效率是冷流量 cell 的 2-3 倍,在所有渠道都是。用客户名单建模出来的 1% LAL,跑赢了我们所有冷定向的方案。这是次要维度——需要扩量时,客户相似的管道就是放大器。
  • 创始人 × 角度。 整个矩阵里,创始人镜头在 5 个渠道中的 4 个上,冷流量都跑赢精修素材。角度是杠杆,渠道是放大器。这是辅助维度——它告诉我们下一轮做什么素材,而不是预算往哪边搬。

最终决策:Meta 冷流量的预算砍掉 70%(持续负值,没有放量路径);LinkedIn 在创始人创意上的投入翻倍(这个角度再做 5 个变体,推到网站回访和流失客户这群还没测过的人群);开始为客户相似的扩量搭建更厚的客户名单管道。下一季度付费预算的大约 60%,做了重新分配。

如果当初只跑"在 Meta 上测 50 条",这个转向根本不会发生。Meta 那列看上去就是一份普通的"创意测试"读数——有赢有输,平均下来"Meta 还行,只是素材要再优化"。跨渠道的维度,才是把正确答案逼出来的唯一方式。

为什么新账户用这套方法比单渠道强

对于没有历史数据的账户——新客户、新产品线、新地区——单渠道测试只能回答一个问题:"创意角度 X 在渠道 Y 上对人群 Z 有效。"前提是 Y 本身是正确渠道。新账户上,大多数时候你根本不知道 Y 是不是对的渠道。矩阵用一次测试同时回答三个问题:哪个渠道对、哪个角度对、哪个人群对。三个答案,同预算,同时间。

最常见的反对声音:"我们没有 $90k 跑测试。"好。20 个 cell 跑 $20k。矩阵一样能跑——只是覆盖更少的组合。5 × 4 × 3 缩成 5 × 2 × 2。读得出渠道 + 角度两件事,人群这一维度留给下一轮。结构缩小,诊断价值不会丢。缩不掉的是"在 Meta 上跑 50 条广告"——那是在一个你可能选错的渠道内部做素材测试。测试会告诉你 Meta 上跑哪条素材,不会告诉你一开始是不是该选 Meta。

第二个反对声音:"我们凑不齐 50 个创意角度。"对一些团队确实如此。变通方法:同一组 3 个角度套到所有 cell 上。角度不一定非要"为渠道原生"才能测。创始人对着镜头讲 90 秒,可以剪成 LinkedIn 90 秒、Meta 30 秒、TikTok 15 秒、Reddit 6 秒。剪辑长短没那么重要,角度才重要。矩阵测的是角度和维度,不是剪辑工艺。

一句话带走

测试矩阵的目的不是找广告,而是找到下个季度增长到底活在哪一个维度上——渠道、人群、还是角度——并且这个答案的置信度,要高到当 CMO 问"数据呢?"的时候你能拿出来。