AI Tools

用 Perplexity 做问卷设计:从研究问题到成稿问卷的 5 个提示词

2025年3月3日

上个季度,一位 SaaS 客户让我帮忙设计一份客户 onboarding 调研问卷。48 小时 deadline,目标受众是中型市场的运营负责人,样本量 300。我没有打开 Google Doc,也没有翻任何问卷设计的教科书。我打开 Perplexity,按顺序跑了 5 个 prompt,到中午就拿到了一份 12 题的问卷草稿。又改了两轮小修小补,问卷就上线了 —— 在一个出了名难触达的细分人群里,完卷率做到了 67%。

下面我就把这条工作流拆给你看。不是「AI 帮你头脑风暴」那种空话,而是任何一份问卷 brief 落到我手上,我都会跑一遍的 5 个 prompt。

为什么选 Perplexity,而不是 ChatGPT 或 Claude

这套流程在 ChatGPT、Claude、Gemini 里都能跑,我都试过。但单就问卷设计这个场景,Perplexity 有两个结构性的优势。

第一,实时联网的支撑。问卷设计的最佳实践一直在变。2018 年还能用的那套 —— 长的李克特量表、双重问题(double-barreled question,一句话里塞两个问题)、开头铺一大段人口属性问题 —— 放到 2025 年往往会拉低完卷率。Perplexity 在回答前会先去网上搜一遍,所以它给的建议是基于 Qualtrics、SurveyMonkey、Pew 这些机构最新公开的方法论,不是两年前的训练数据。我让它设计筛选题的时候,它引用了一篇 2024 年 SurveyMonkey 关于「顺序效应」(order effects,前面题目的措辞会带偏后面题目的回答倾向)的文章,这个点我自己不一定能马上想到。

第二,每个结论都带引用。Perplexity 给出一个问题措辞的时候,你可以点开源头去验证它的理由。这件事在问卷设计里特别重要,因为措辞的细微差异会让结果偏差很大。"你对 onboarding 有多满意" 通常会比 "请评价你整体的 onboarding 体验" 高出 8 分左右 —— 这种差异会直接反映在最终 benchmark 报告里。所以你一定要先看到证据再采用。

我自己是在 Perplexity Pro(每月 20 美元)的 Pro Search 模式下测试这套工作流的,Pro Search 会在多个源头之间做多步检索。免费版对付日常的轻度使用没问题,但要做客户的正式交付物,我还是愿意付这个钱。

Prompt 1 —— 把研究目标钉死

我在收到的问卷 brief 里最常看到的错误,是研究目标含糊。"我们想知道客户怎么想" 不是研究问题,是愿望。第一个 prompt 的作用,就是在任何具体题目出现之前先把目标钉死。

我在帮 [客户/产品] 设计一份客户调研。目标受众是 [ICP —— 行业、职位、公司规模]。研究目标是 [决策 / 衡量 / 对标][具体某件事]。请帮我把这件事拆成 3–5 个锋利的、可以被回答的研究问题,每个问题都要明确「它会支撑哪一个具体的业务决策」。对每个研究问题,再给 1–2 个建议的细分维度(比如"按公司规模切数据,找出 gap 最大的那一组")。

针对 onboarding 这个 brief,跑出来大致是这样的:

RQ1。在 [产品] 上线后的前 90 天,客户感知到的 ROI 是多少?按公司规模切片。
RQ2。哪一步 onboarding 的流失率最高,主要原因是?
RQ3。自助 onboarding 和销售辅助 onboarding 的 NPS (Net Promoter Score,净推荐值)差异有多大?

每个研究问题都带了一个指标、一个细分维度、一个对应的决策。这就是"调研"和"问卷"的根本区别 —— 也是市面上大多数 AI 生成的问卷最缺的那块东西。

Prompt 2 —— 起草具体题目

到这一步你手上有 3–5 个研究问题。第二个 prompt 用来生成问卷题目本身。

基于上面的研究问题,起草 12–15 道问卷题,能够回答这些研究问题。题型按这个比例混合:60% 封闭式(单选、多选、排序),30% 量表题(李克特 1–5、NPS、频率),10% 开放式。每道题请注明:题干、选项、对应的研究问题编号。请避免双重问题、引导性措辞、行话。目标完成时间 8 分钟。

我每次都会显式给题型比例和目标完成时间。没有这两条护栏,LLM 要么会塞太多开放式题目(直接搞垮完卷率),要么会塞太多 1–10 量表(导致 straight-lining —— 受访者每道题都选同一个数字)。

Perplexity 给 onboarding 这份问卷草的题包括:

Q4(对应 RQ1):"请评价 [产品] 在前 90 天给你带来的价值。" 1 = 非常低,5 = 非常高
Q7(对应 RQ2):"你在哪一步 onboarding 上花的时间最长?" 下拉菜单里填上产品里真实的步骤名
Q11(对应 RQ3):"你有多愿意把 [产品] 推荐给同行?" 0–10 NPS 量表

"题目 → 研究问题" 这层映射,才是客户真正在买的东西。当客户问"你为什么问这个",你能一句话答上来;当某个受访者跳过了某道题,你立刻知道是哪个研究目标丢了数据。

Prompt 3 —— 加筛选题、人口属性、跳转逻辑

大多数问卷都死在筛选题那一块。开头塞一大段无聊的人口属性问题,完卷率立刻就崩了。但这些数据你又不能不要。第三个 prompt 就专门处理这件事,而且有一个反直觉的小动作。

基于上面的问卷,设计:(1) 2–3 道筛选题,用来识别对的目标受访者、排除错的人(比如不是决策者、行业不对、没用过产品);(2) 一段 4 题的简短人口属性问题块,放在问卷的结尾(不是开头);(3) 跳转逻辑,跳过不适用的题目。筛选题放最前面,不合格的受访者立即退出 —— 这是你节省他们时间、也保证数据质量的关键。

"人口属性放结尾" 这一招,把这份 onboarding 问卷的完卷率从 50% 拉到了 67%。Perplexity 在解释这个建议时引用了 SurveyMonkey 一篇关于顺序效应的方法论文章。开头塞人口属性题,是专业受访者放弃问卷的头号原因,而放在开头又没有任何收益。等到受访者答到最后,他/她已经投入了,这时候再问行业、职位、公司规模,他/她愿意填。

跳转逻辑的例子:如果 Q2 选了"我还没走完 onboarding",那 Q3–Q7 整组体验评分题就跳过,跳到另一组认知/兴趣题。十几行配置,换来的就是数据不被"懵圈"的受访者污染。

Prompt 4 —— 给问卷做偏差和措辞体检

这一步是大多数人跳过的,也是 fielding 之前抓出问题最多的一步。

把上面这份问卷的每道题都审一遍,看有没有:(1) 双重问题(一句话问两件事),(2) 引导性或带偏见的措辞,(3) 含义模糊的词,(4) 顺序效应(前一道题带偏了后一道),(5) 社会期许偏差(受访者答出"听起来更体面"的答案,而不是真实想法)。每发现一个问题,给一个具体的改写,并解释它去除了哪种偏差。

Perplexity 在 onboarding 这份问卷里抓出了三处我本来要直接发的:

"Onboarding 有多有效、多容易?" —— 标记为双重问题。拆成两题:"Onboarding 有多有效?" 和 "它有多容易走完?"
"你觉得新仪表盘是不是比旧的好?" —— 标记为引导性问题。改成"相比旧版本,新仪表盘怎么样?",五分量表,从「差很多」到「好很多」。
"你多久用一次高级功能?" —— 标记为含义模糊。"高级"对不同人意思完全不同。改成具体功能名的多选清单。

整个偏差体检花了不到 5 分钟。要是这些问题带着发出去,光是清理脏数据就要多花好几个小时,更别说上线后客户发现这些毛病带来的信任损耗。

Prompt 5 —— 规划投放和分析

最后一个 prompt 把问卷本身变成一份项目计划,强迫你在数据进来之前就想清楚"每道题到底要干嘛"。

基于最终版的问卷,产出:(1) 一份推荐的投放计划(样本量、渠道组合、激励、预期完卷率);(2) 一份 4 行的分析计划 —— 对每个研究问题,用什么图表/指标回答,要做哪些交叉分析(按细分维度交叉分析),什么算"反常到值得深挖"的发现;(3) 一份客户 3 分钟能读完的单页总结模板。

onboarding 这份问卷跑出来的是:

投放:站内信 + 邮件共 400 封,25 美元礼品卡激励,7 天投放窗口,目标完卷率 30%(我们调整了一轮筛选题之后,第二波完卷率做到了 67%)。
分析:NPS 按公司规模切片;流失步骤按自助 vs. 销售辅助切片;ROI 感知按客户 tenure 交叉。
总结模板:单页报告,3 张图、3 个核心发现、3 个建议动作。

客户真正会读的,就是这份单页总结。在 fielding 之前就把模板写好,是大多数 marketer 跳过的步骤 —— 而正是这个步骤,决定了你这份问卷是产出一个决策,还是只产出一份数据集。

这套流程做不了的几件事

说几个实在的局限。

领域上下文。Perplexity 不知道你产品的功能、客户的真实用语、你们公司内部的黑话。它起草的题目是 80 分 —— 剩下 20 分要靠你把真实的功能名、客户的原话、真实的竞品名改进去。一份写着"新仪表盘"的问卷,和一份写着"新版的 Insights tab"的问卷,质感完全不同,受访者一眼能感觉到。

翻译质量。如果你跑的是英中双语问卷,中文翻译一定要自己来,不要交给 Perplexity。中文的营销语言细节很多 ——「满意」「很高兴」「认可」在情绪强度上差得很远,机翻会把这些都抹平。用 Perplexity 起草英文,再找一个 native 中文 speaker 重新润色中文。

合规。涉及 GDPR(欧盟《通用数据保护条例》)、CCPA、或者中国 PIPL(《个人信息保护法》)的问卷,需要法务审核。Perplexity 能提醒你需要哪些(同意文案、数据保留期限、删除权之类),但它不是律师,真到了审计现场,"我这是从 AI 那里抄的"不能当挡箭牌。

题目贪多。Prompt 里要的是 12–15 道题,但如果你 8 道题就能回答你的研究问题,就只发 8 道。多一道题就是给完卷率多收一道税,短问卷在数据质量上几乎一定赢过长问卷。

真正的赢面

这 5 个 prompt 跑下来,把一份原本要 2–3 天的问卷设计工作,压缩到了 90 分钟左右。但更大的赢面在质量上。

因为每道题都映射到一个研究问题、每个研究问题都映射到一个决策,你就不会再"以防万一"地堆题。问卷更短、更锋利,客户问"你为什么要问这个"的时候你更好辩护。文章开头我提的那份 onboarding 问卷,在出了名对邮件调研冷漠的中型市场运营负责人群体里,做到了 67% 的完卷率 —— 按我过去 10 年的经验,这个群体直接删掉 80% 的调研邮件都不带看的。

Perplexity 并没有替你写这份问卷。它压缩掉的,是过去最吃时间的那部分 —— 检索、起草、审计 —— 让我能把省下来的时间,花在只有我能做的事情上:把题目和真实的业务决策绑在一起,再把题目用客户自己的语言改写一遍。

就问卷设计这个场景来说,这是 AI 和人最合理的分工:AI 负责广度,你负责判断。

Twitter LinkedIn Facebook Reddit Email

12种问卷题型：何时使用，以及如何用AI改写一个糟糕的问题每天 5 条有内容的 LinkedIn 评论：我替代发帖的 Perplexity + ChatGPT 循环 AI Deep Research 实战指南：3 小时跑完原本要一周的市场和竞品分析 AI 搜索正在吃掉你的 SEO 流量——以及你该怎么办