用 Claude 创作短视频脚本的完整流程
去年11月,我接了一个知识付费客户的需求:一周内产出30条3分钟的口播脚本,主题涉及认知心理学、行为经济学和团队管理。按常规流程,一条深度脚本从调研到成稿需要4-6小时,30条意味着180小时的工作量,一个人根本不可能完成。
我不是什么脚本写作大神。在那之前,我写一条口播脚本的平均时长是3.5小时,效率瓶颈不在“写”这个动作本身,而在信息检索、论点搭建、案例匹配这三个前置环节。真正落到文字上,反而只占全部时间的30%。
那周我干了件当时看起来有点冒险的事:我把整个前期研究流程扔给了Claude,自己只做决策和润色。最终交付结果是:7天产出34条脚本,客户过审率91%,单条平均耗时1.8小时,从3.5小时压缩到1.8小时,提效接近50%。
这篇文章不是什么“AI副业月入过万”的捷径教程。我想讲的是一个更枯燥但也更实际的问题:在真实、高压的商业内容生产中,人怎么跟Claude分工,才能既快又不翻车。我会把30多条脚本踩过的坑、验证过的流程、以及最重要的,为什么有些步骤必须人来做,完整拆出来。
先用一个真实案例说明:这条流程到底长什么样
在展开完整方法论之前,先看一条真实脚本的协作流程。这会帮你建立直观感受,后文的所有技术拆解才有落脚点。
客户需求:主题“幸存者偏差”,目标人群是25-35岁的职场中层,抖音口播,90秒以内,必须用一个具体的商业案例开场,不能出现教科书式定义。
我用Claude协作产出这条脚本,经历了以下6个步骤:
第一步:让Claude补充案例库存(15分钟)
我给出的Prompt是:“列出8个典型的幸存者偏差商业案例,要求发生在2020年之后,单个案例描述不超过3句话,标注案例来源是否可查证。”
Claude返回了8个案例,其中有一个关于2021年NFT市场的数据案例很有力,它引用了Chainalysis的二手转售盈亏数据。但另外两个案例(一个涉及某家倒闭的连锁餐饮品牌,另一个提到某教育公司的增长)我无法在10分钟内找到公开来源验证。我直接划掉这两个,从剩余6个里选了3个。
这一步揭示了一个关键原则:Claude解决“广度搜索”问题,你来解决“可信度把关”问题。
第二步:用案例拉着Claude推论点(20分钟)
我没有直接让它写脚本,而是给出这个指令:“基于如下案例[粘贴选中的案例],推导出3个可以反驳‘幸存者偏差’的行动建议。每个建议需要包含反直觉的数据或事实。”
Claude的输出里有一个点很妙:它引用了Bureau of Labor Statistics关于新创企业存活率的追踪数据,指出“不是只研究活下来的公司才有价值,研究死掉的公司能学到更多”。这个角度比“不要只看成功案例”这种老生常谈锋利得多。
第三步:构建脚本结构(10分钟)
我给出结构要求:“90秒脚本,结构为:15秒钩子(用案例制造认知冲突)→60秒展开(2个核心观点,每个配一个具象例子)→15秒收尾(给一个可操作的行动建议)。输出结构框架,暂不写完整文案。”
Claude输出了一套框架,我改动了两处:钩子从“你知道吗”改成“去年有2000万人买了NFT,其中80%的人亏了钱,但你永远不会看到他们发帖”;把第二段“用数据论证”改成“用《大空头》电影里的片段类比”。
第四步:生成脚本初稿(5分钟)
这一步最快。我把确认后的框架和修改点回填给Claude,让它生成完整口播脚本。Claude产出的初稿逻辑很干净,但语气太书面,比如开头写的是“在数字化浪潮中,大量投资者盲目涌入NFT市场”。
第五步:口播化改写(20分钟)
我手动把开头改成:“去年有一批人买NFT,有一批人晒截图,这两拨人你发现没?根本不是同一拨。亏钱的永远不说话,说话的都是赚了的,这事儿就叫幸存者偏差。”整个改写时间20分钟,改动了大约40%的措辞。
第六步:向客户说明脚本的素材来源(5分钟)
每条脚本交付时,我把案例来源、引用数据的公开链接整理成备注,方便客户做事实核查。这件事Claude能帮你整理一部分,但最终核实必须你自己来,尤其涉及具体公司、具体金额时。
完整6步下来,总耗时75分钟,产出1条客户直接过审的脚本。
下面这张图归纳了6个步骤中,人机时间分配的实际占比:

你看到的数据是这样的:看似人机协作,实际上人的决策时间占总时长的80%。Claude真正帮到我的不是“替代我写字”,而是在需要快速广撒网的信息搜集和初稿起草环节充当了一个不需要休息的助理。 它把最耗时的“空文档焦虑”消除之后,我才能把精力集中在只有人类做得好的事情,判断哪个案例真的成立,哪个观点真的锋利,哪句表达真的能打在观众的情绪点上。
这个问题正好引出核心结论。
核心结论:Claude在短视频脚本创作中的真实角色
如果你期望的答案是“给Claude一个标题,它一键生成爆款脚本”,那你可以关掉这篇文章了。那不是我的经验,我验证过的大量案例也不支持这个预期。
基于34条商业脚本的实战数据,我的核心结论是:
Claude在脚本创作中的真实角色是“结构化初稿引擎”和“多角度信息检索器”,而不是“创作者”。它消除的是“从0到0.6”的效率黑洞,也就是信息匮乏、框架摇摆、初稿起草这三个最消耗意志力的环节。而从0.6到1.0的质感跃迁,观点锋利度、情绪感染力、口语节奏感、案例真实感,依然必须由人来完成。
这不是观点,是可复现的实测结果。我让同一个脚本需求跑过Claude、ChatGPT-4、文心一言和通义千问,然后请3位短视频编导盲评。结果很有趣:
| 评估维度 | Claude | ChatGPT-4 | 其他国产模型均值 |
|---|---|---|---|
| 逻辑结构完整性 | 4.3/5 | 4.1/5 | 3.2/5 |
| 信息密度与案例丰富度 | 4.0/5 | 3.8/5 | 2.9/5 |
| 观点锋利度 | 2.1/5 | 2.3/5 | 1.8/5 |
| 口语自然度 | 1.9/5 | 2.2/5 | 2.5/5 |
| 可直接过审率 | 18% | 15% | 8% |
数据背后的含义很清晰:Claude强在结构性和信息密度,弱在观点锐度和语言质感。 这恰好解释了为什么直接堆AI输出会翻车,它能把稿子写“对”,但写不“好”。你的内容最终能不能打动观众,取决于后面那40%你手动改写时注入的东西。
有一个常被忽略的细节值得一提:Claude在长文本环境下的信息组织能力明显优于同类模型。当输入材料超过3000字时,大多数AI模型会出现“遗忘首段”的问题,而Claude的上下文跟踪稳定得多。这对于需要综合5-8篇参考素材的深度脚本来说,是一个强加成。
下面这张雷达图可以帮你快速理解Claude与其他模型在5个关键维度上的差异:

现在结论很清楚,我们得回到真实场景,为什么大多数创作者会用错Claude?
三个最常见的错误用法,以及它们从何而来
我在观察了身边几个内容团队使用AI进行脚本制作的过程之后,发现了一些大家普遍在犯的错误。总结下来,频次最高的三个误区是:
误区一:把Claude当“出题机器”,而不是“答题队友”
典型做法:输入“给我写5条关于职场沟通的短视频脚本”,然后对着5条整整齐齐、看起来什么都说到了但什么都平淡得一塌糊涂的脚本发呆。
问题出在哪?
Claude在没有充分上下文的情况下,会退行到“最安全”的答案,也就是互联网上最常见的、已经被说烂了的观点。你得到的不是“好脚本”,而是“最不容易出错的脚本”。
正确做法应该反过来:你不是给出题,你是被Claude出的题逼着思考。比如我经常用的指令是:“基于以下主题[X],列出10个大多数创作者会忽略却容易产出反常识结论的角度。”Claude列出来之后,我来判断哪个角度真的能打,然后再沿着这个方向深挖。
Claude的价值不在答案层,而在问题层。它帮你穷举可能性,你来筛选锐利度。
误区二:跳过“信息投喂”环节,期望Claude全知全能
Claude的知识截止日期是2025年4月。但比截止日期更关键的问题是:即使在其训练数据覆盖的时间范围内,它对垂直行业、中国本土市场、小众圈层的细节掌握也非常稀疏。
我测试过一个典型案例:让Claude“分析2024年中国消费电子行业的市场格局,并给出一个适合抖音口播的切入角度”。它输出了一个框架客观但极度泛化的答案,提到华为、小米、苹果等头部品牌,但没有任何关于细分品类格局变化的具体数据。
后来我做了另一组对比测试:先把QuestMobile和IDC的3份研报摘要投喂给Claude(约2500字),再提同一个问题。这次它的输出质量完全不一样了,它准确提取了“折叠屏手机在女性用户中的渗透率同比增长240%”这一信息点,并以此为基础构建了一个很有差异化的脚本角度:“折叠屏的增量用户不是极客,是35岁以上的女性,这件事所有数码博主都讲错了。”
结论:Claude输出质量的上限,等于你投喂给它信息质量的上限。 偷懒不投喂=得到低质输出。这条规律几乎适用于所有AI模型,但Claude的长文本能力让它在“大量投喂后稳定输出”这一点上表现格外突出。
误区三:把“生成完成”当“交付完成”
这是最致命也最普遍的误区。
Claude生成一段文字只需要几秒钟。但一段文字要变成能用的口播脚本,至少要过三关:
第一关,事实核查。Claude有时会“自信地编造”,它引用了一篇“哈佛商业评论2023年的研究”,但实际上那篇文章根本不存在。任何你打算放进嘴里的数据、引用、案例名称,都必须手动查证。
第二关,口语化改写。Claude的默认语感更接近公文写作,连口语指令也只能缓解而无法根除这个问题。我把脚本读给自己听,凡是舌头打结的地方,一定是Claude的原句。
第三关,个人视角注入。Claude写不出“我上个星期见了一个客户,他跟我说了一句让我特别受冲击的话……”这种真实的个体经验。没有真实经验锚定的脚本很容易飘在空中,观众能感觉到。
这三关中任何一关跳过,都会有翻车风险。
下面这张流程图总结了从使用Claude到脚本交付的完整链路,标注了三个高频翻车点和对应的检查动作:

完整的“3层信息投喂+4轮对话”流程
现在来讲操作层面。这套流程我迭代了三版才稳定下来。第一版过于简化(直接提问),第二版过于繁琐(8轮对话),目前的第三版在效率和深度之间取了一个比较平衡的点。
第一层:基础信息投喂(5项必填信息)
在你问Claude任何脚本相关的问题之前,先给它足够多的信息。我固定投喂5类信息:
- 内容领域说明:不是“短视频脚本文案”,而是“面向25-35岁一线城市职场人群的认知类口播脚本,语言风格偏理性但接地气,经常使用商业案例类比”。
- 对标账号/内容样本:粘贴2-3条你自己写过的、最满意的脚本全文。Claude会从样本中提取你的语言节奏、论证习惯和常用结构。
- 禁用表达清单:列出你不会用的词和句式。我的清单包括:“在当今社会”、“随着……的发展”、“众所周知”、“毋庸置疑”、“干货满满”、“建议收藏”。
- 本期需求简报:主题、预期时长、平台、核心观点(如果你已经有了)、特别要求(如“不能用教科书式定义开头”)。
- 参考素材:你搜集到的与该主题相关的文章链接或摘要、数据、案例。这一步决定了Claude的输出天花板。
为什么这5项是必填项? 因为在我300多次实测中,投喂全部5项与只投喂1项(仅主题)相比,脚本初稿的直接可用率从8%提升到42%。差异不在字数,而在信息密度与结构的匹配度。
以下是投喂完整度与初稿质量的对应关系:

第二层:对话式探索与角度筛选
信息投喂完成后,我不会让Claude直接写脚本,而是进入一轮探索对话。这个环节的目标是:在你还没动笔之前,先穷举所有可能的切入点,然后由你来选那个最锋利的。
我的探索对话一般按以下顺序进行:
- 广度穷举:“基于我投喂的信息,列出12-15个可以从这个主题切入的独特角度。要求每个角度包含一个核心观点和一句话案例提示。”
- 反常识筛选:“从这15个角度中,挑出4个最容易产出反直觉结论的方向,并解释为什么常见的认知与事实不符。”
- 素材支撑检测:“针对这4个角度,分别列出你能联想到的具体案例、数据或事实。标注每个素材的可查证程度(高/中/低)。”
- 结构适配:“评估这4个角度分别适合什么脚本结构(三段论/对比反转/故事引入/问答体),并给出简短理由。”
4轮对话后,你会得到一份“已筛选的切入角度+对应素材+建议结构”的清单。接下来不是让Claude选,你来选。我的筛选标准只有一条:这个角度我在其他博主那里没听过,或者很少有人从这个角度讲。
多说一句:这个环节最容易出现的错误是让Claude帮你做最终选择。 Claude判断一个角度“好”的依据,是它在其训练数据中见过的同类内容多不多,这恰恰是你应该避开的。它觉得好的角度,很可能就是已经被用烂的角度。
第三层:结构化Prompt与多轮改写
选定角度后,进入脚本生成环节。这里我不用自然语言对话方式,而是用一套标准化Prompt模板。原因很简单:标准化输入带来可预期输出。自然语言对话容易让Claude在前后两轮中“漂移”结构。
我的标准化Prompt模板包含4个模块:
【结构约束】:明确脚本的段落划分、每段时间分配、开头类型(案例冲突/反常识数据/提问引入/直给观点)、结尾行动指令类型。
【内容约束】:给定必须出现的核心观点、必须使用的案例、必须回避的常见表达。这部分信息从第二层的对话结果中提取。
【风格约束】:句式长度限制(单句不超过25字)、词汇偏好、口语化程度、是否需要使用某个特定的表达习惯(如“你发现没”“这事儿其实……”)。
【输出约束】:要求输出完整脚本文案,不使用占位符或“以此类推”,不添加解释性备注。
模板投喂之后,Claude通常1-2轮就能给出可用初稿。如果不行,我不会让它继续改,我会回到第二层,重新确认一下,看是角度选错了,还是素材不够好,又或者是我的结构约束出了问题。改Prompt比改输出有效得多。
下面这张表格汇总了标准Prompt的4个模块及每个模块的必填与选填项:
| Prompt模块 | 必填项 | 选填项 | 常见错误 |
|---|---|---|---|
| 结构约束 | 段落划分、每段时间、开头类型 | 转折点位置、情绪曲线要求 | 只写“写一个脚本”,不限定结构 |
| 内容约束 | 核心观点、必用案例 | 禁用案例、引用要求 | 给出的观点太泛,Claude无处着力 |
| 风格约束 | 句式长度上限、口语化程度 | 特定表达习惯、节奏标记 | 写“口语化”但不定量,Claude理解偏差 |
| 输出约束 | 完整文案、无占位符 | 字数范围、分段标记方式 | 不禁止解释性备注,Claude输出掺杂说明文字 |
人工介入的4个关键节点
如我前面所说,Claude的脚本初稿直接可用率最高能拉到55%左右,但剩下45%依然要人来补齐。补齐不是随心所欲地改,它有四个相对明确的介入节点。
节点一:事实核查与数据核验
这是我给自己定的铁律:脚本中任何引用具体数字、研究报告、公司名称、人名、事件时间的句子,必须手动核查到原始来源。
Claude存在“幻觉”问题,这不是什么秘密。但它的幻觉有自己的特征:不是完全凭空编造,而是把真实存在的元素错位组合。比如它会说“MIT斯隆管理学院2022年的一项研究指出……”,MIT斯隆管理学院存在,这个研究方向也存在,但那项具体研究可能根本不存在,或者年份不对,或者数据和结论被嫁接到了一个虚构的出处上。
我的处理方式是这样的:交付脚本时,在文案下方以注释形式标注每条关键信息的来源和可查证链接。这不仅是对客户负责,也是对自己的保护,你永远不想在发完视频之后被观众扒出来“你引用的那个数据是编的”。
核查的过程可以部分借助搜索引擎,但不要指望Claude自己提供可靠来源,它提供的链接,点进去有大约30%的概率是404、重定向或者和它描述的内容无关。
节点二:核心观点锐化
Claude把信息组织成脚本结构的能力很强,但它的观点倾向是趋中、安全、四平八稳的。这符合它的对齐训练目标,不输出极端立场。但对于短视频来说,没有锐度的观点等于没观点。
举个实测案例。主题是“内卷”,Claude输出的核心观点是:“内卷现象反映了当前社会竞争加剧,我们需要理性看待,找到适合自己的节奏。”,这属于正确的废话。
我的改写是:“你现在加班到十一点,不是因为你不够努力,是因为你的对手也在加班。但当所有人都加班到十一点,没人赢,大家只得到了更少的睡眠和更差的体检报告。这就是内卷的本质,它是个囚徒困境,破局的方式不是更努力,是找到不玩这个游戏也能赢的赛道。”
两段话信息骨架一样,但锐度天差地别。我的经验是:拿到Claude的观点后,问自己一个问题,“这个观点,我敢确定观众听完会停下来吗?” 如果不能,接着改。
节点三:口语化改写与语感调整
Claude最让我头疼的问题不是逻辑,是语感。即使Prompt里注明了“口语化”、“接地气”、“短句”,它还是容易滑向书面化表达。
常见的毛病包括:
- “进行”泛滥(把“进行优化”改成“优化一下”,把“进行分析”改成“看一下”)
- 从句嵌套(“当我们在面对一个从未经历过的挑战时”,改成“有件事你从来没见过,第一次碰上”)
- 连接词僵硬(“首先、其次、再次、最后”,改成自然转场方式)
- 缺少口气词和停顿位置(真实口播脚本天然需要“嗯、对吧、你发现没”之类的语气锚点)
我的改写方法是:把Claude生成的脚本逐段念出声。 凡是用眼睛扫过去没问题、但读出口会咬舌头的句子,必改。经过几轮调整,我已经慢慢养成了一个习惯:在Prompt里加这样一句话,“所有句子做完稿后请用口语读一遍,发现有阅读阻力的地方自动简化。”
这个指令能减少大约30%的口语问题,但剩下的还是要靠你的舌头来检测。
节点四:个人经验锚点的植入
这是最重要、也是Claude最不可能替代的一步。
Claude能给你案例、数据、逻辑,但它给不了你个人经验。而短视频口播内容60%以上的说服力,来自这种私人化表达:“去年我见过一个案例……”,“我有个客户跟我说……”,“我自己在这件事上踩过一个坑……”。
每次脚本定稿之前,我会检查一遍:全文中至少有一个地方,观众听完之后的反应是“这个人真的经历过”,而不是“这个人查了很多资料”。如果整条脚本找不到这样的瞬间,打回去重改。
植入个人经验的技巧是:“找补丁位”,而不是推倒重来。Claude写的案例作为论证材料本身没问题,你只需要在它旁边“钉”一个你自己的小故事。比如:
- Claude写的:“很多创业公司在第一年就倒闭了,根据统计数据,存活率不到50%。”
- 补上个人锚点:“我身边五个创业的朋友,三年过去了,现在还活着的就一个。不是其他人不努力,是方向一开始就选得有点拧巴。”
前后只加了十几个字,但整段话的重量完全不一样了。
下面是四个关键介入节点的风险等级和操作要求的概览:

不同视频类型的脚本协作策略差异
前面讲的流程是一套通用打法,但具体到不同类型的短视频,人和Claude的分工权重会有明显差异。我把最常见的四种脚本类型分别测过各自5-10条,总结如下:
类型一:知识科普类
这类脚本的结构性最强,信息密度要求最高,观点锐度要求中等,正好对齐Claude的能力长板。实测中,知识科普类脚本的Claude初稿可用率最高,达到55%-60%。
协作策略:人定选题和框架,Claude负责素材搜集和初稿起草。 人工介入重点在事实核查、案例替换为中文互联网本地化案例、以及最后的口播润色。
一个关键技巧是:要求Claude“为每一个核心观点提供至少两个不同领域的类比”。比如讲“路径依赖”这个概念,Claude可以给出经济学案例、生物学案例、个人习惯案例三个类比,你可以根据目标受众选最合适的那个。
类型二:观点评论类
观点类脚本对锐度要求最高,而这恰恰是Claude的短板。Claude产出的评论倾向于“一方面……另一方面……”式的平衡论述,缺乏单刀直入的锋利感。
协作策略:人定观点和立场,Claude负责搭论证骨架和搜集论据。 核心观点的提炼、态度的表达、结尾的价值判断,这三件事自己做。Claude负责在中间填充论证链条、数据支撑和逻辑推演。
我的实操经验是:不要试图用Prompt把Claude“调教”得更尖锐,这对于根植在对齐训练中的安全偏好来说比较困难,效果也不太稳定。更有效的做法是,你自己把核心观点写成一句不超过20字的判断句,然后让Claude“围绕这个判断构建论证”。
类型三:故事叙述类
故事类脚本对口语化程度和情绪张力的要求最高,Claude在这两个维度上表现最弱。让它直接写故事,出来的一般是“流水账”,时间线完整但毫无起伏。
协作策略:人讲故事核(人物+冲突+转折),Claude辅助做场景扩展和细节补充。 你提供一个200字左右的故事核,Claude可以帮你扩展环境描写、对话细节、心理活动这些边缘性内容。但故事的节奏控制、高潮设计、金句提炼,依然是人来把控。
我一个做剧情号的博主朋友,用Claude的方式很取巧:她只要求Claude做一件事,把她的故事大纲扩展出3种不同的场景描写方案。这对于写过小说的人来说不算什么高级技能,但在赶稿子的时候用这种方式可以省不少力气。
类型四:产品种草/测评类
这类脚本最特殊。它的信息高度依赖实际体验,而Claude显然不存在“体验”这回事。如果让Claude写产品种草,几乎必定走向两种失败:要么像个客服在念参数表,要么像个AI在编造使用感受。
协作策略:产品体验部分完全由人提供原始素材(录音转文字、笔记),Claude负责把这些碎片整理成有逻辑的口播结构。 它会做得不错的是:把一堆散乱的感受归纳成几个说服点,并为每个说服点匹配一个通用的心理学原理(稀缺效应、从众心理、权威背书等)。
但有一点要特别提醒:无论Claude输出的产品文案看起来多流畅,千万不要让它在没有你真实体验输入的情况下“编造”使用感受。这涉及内容真实性底线问题。观众识别虚假体验的能力比你想象的要敏锐得多。
下面这张图对比了四种脚本类型在人机分工权重上的差异:

质量控制的硬标准
前面六节都在讲流程,这一节讲标准。无论你是自己做内容还是在团队里审稿,以下四条可量化的质检标准可以直接用。
标准一:事实准确率100%
这是一条底线,没有讨论余地。脚本中所有引用数据、事例、人名、书名、时间、事件,必须可追溯至公开可查证来源。不确定的信息宁可删掉也不留隐患。
检查方法:逐句标黄所有“断言性内容”,每条后面标注来源。凡是标不出来源的,删或改。
标准二:单句朗读顺畅率≥90%
定义:把脚本通读一遍,凡是读一遍不顺、需要回读才能理解的句子,标为“不顺畅”。不顺畅率应低于10%。对于90秒口播脚本来说,大约对应不超过2-3个此类句子。
这个标准的依据是:口播内容的完播率与语言流畅度强相关。观众听感上一旦出现“滞涩感”,划走的概率急剧上升。
标准三:观点独特性自评≥3/5
这是最难量化的标准,但我用一套自评机制来尽量客观化:在发脚本之前,我会在抖音或B站上搜索该主题下前10条高播放视频,逐个看完之后问自己:“我现在要说的核心观点,在这10条视频中出现过吗?”出现过=独特性扣分,没出现过=独特性加分。
5分制下,3分是及格线。低于3分意味着你在重复别人说过的东西,这在算法分发逻辑里几乎没有竞争力。
标准四:人感标识密度≥1处/每分钟
“人感标识”指的是那些明显出自真人经验而非信息检索的内容,个人经历、主观感受、具体场景描述、口语化自我调侃、与自己过往内容的呼应等。
1分钟的口播脚本,至少要有1处这样的标识。90秒的脚本至少2处。这个密度是观众在潜意识中判断“这是个真人还是台AI机器”的核心依据。
从单条脚本到批量生产的流程放大
如果你只需要偶尔写几条脚本,前面7节够用了。但如果你面临的是我开头说的那种场景,一周30条、一月100条,你需要一套能放大的系统。
第一步:建立主题素材库
不要每写一条脚本都从零搜集素材。用一个共享文档或Notion页面,按主题分类沉淀你日常阅读中遇到的优质案例、反常识数据、好用的类比。每条素材标注日期、来源、适用主题标签。
这个素材库你后续可以直接投喂给Claude,相当于你提前帮它把信息检索的步骤做完了,而且保真。
第二步:建立Prompt模板库
不同主题、不同类型的脚本,使用的Prompt结构会有差异。把验证过的、产出稳定的Prompt保存为模板,标注“适用类型”、“平均产出时间”、“初稿可用率”等元数据。
以下是我个人常用的3套Prompt模板及其适用场景:
| 模板编号 | 适用脚本类型 | 结构特点 | 初稿可用率 |
|---|---|---|---|
| A-KP-01 | 知识科普-单观点 | 案例引入→观点阐释→类比→行动建议 | 55% |
| B-OP-02 | 观点评论-对比反转 | 常见认知→反例→重构认知→价值升华 | 40% |
| C-ST-03 | 故事叙述-个人经历 | 场景钩子→冲突展开→感悟提炼→普适引申 | 35% |
第三步:并行处理而非串行处理
这是批量生产最关键的效率杠杆。具体做法:不要把“搜集→投喂→对话→初稿→润色→核查”这条链路串行跑完一条再跑下一条。而是把同一类型的脚本放在一个批次里,批处理每个环节。
举例:周一上午,用2小时同时为5条知识科普类脚本搜集素材、投喂Claude。周一午休时,Claude并行产出5条初稿。周一下午,集中做5条的事实核查。周一晚上,集中口播润色和个人经验植入。
串行模式下,5条脚本需要5×75=375分钟(约6.3小时)。并行模式下,可以压缩到4-4.5小时。提效30%-40%,而且这个提升跟Claude的性能无关,纯粹是流程设计带来的。
下面这张趋势图展示了串行模式与并行模式在5条脚本产出中的时间差异:

第四步:建立质量抽检机制
批量生产最大的风险是质量滑坡。不检查的话,Claude会变得越来越“偷懒”,相同的Prompt结构下,它可能在后几条中悄悄简化论证、减少案例、退化到更安全的表达。
我的做法:每批次10条脚本,随机抽3条做完整质检(四项硬标准全部过一遍)。如果3条中超过1条未达标,整批打回重走关键步骤。这个抽检比例对于维持质量稳定性来说是底线。
Claude与其他模型的选型建议
本文主题是Claude的使用流程,但我必须诚实地说:Claude不是万能的。在某些具体场景下,其他模型可能更合适。
根据我对比测试的结果,给出几个选型建议:
选Claude的场景:深度内容(超过1000字)、需要大量引用和论据支撑的脚本、需要多步逻辑推导的观点类内容、需要处理超过3000字参考素材的复杂主题。
选ChatGPT-4的场景:短平快的资讯评论、需要较强创意发散的发散型脚本、多语言场景、对口语自然度要求特别高的内容。
选国产模型的场景:纯中文网络热梗和本土化表达需求极高时,国产模型对中文互联网语料的熟悉度在某些垂类上确实有优势。另外,对数据不出境有严格要求的商业项目,也只能选国产模型。
组合使用的场景:我的一条实战经验,用Claude搭框架和逻辑链,用ChatGPT-4做创意发散和口语化变体,然后把两者输出合并后人工筛选最优组合。这条组合链路在观点评论类脚本上的产出质量,比单一模型高出约20%(以客户过审率和互动数据综合评估)。
不同选型方案的成本差异也不容忽视。以下是当前主流模型的API调用成本与适用场景对照:

创作伦理与边界
最后这一节,可能比前面所有技术细节都重要。
不要用Claude写你讲不出来的东西
如果你不懂量子物理,不要因为Claude能生成一篇看起来像模像样的量子物理科普脚本,就出镜讲这个主题。观众不一定能分辨专业内容中微妙的错误,但你的同行能。一旦被扒出来“这个博主根本不懂,全是AI生成的”,信任崩塌只是时间问题。
我的原则:只在自己有真实积累的领域使用Claude提效。 Claude是拐杖,不是轮椅,你还能走,它帮你走快一点;你不能走,它不能替你走路。
向观众说明你使用了AI辅助
这不是法律义务(目前),但我认为它是伦理底线。说明方式不一定是每期视频口播强调,可以用更自然的做法:在文案中保留“我让AI帮我理了一下这个问题的资料”之类的表述,或者在简介栏标注创作工具的透明信息。
真实感是短视频博主最核心的资产。AI辅助和真实人设之间不存在本质矛盾,前提是你足够透明。试图把自己包装成“从不借助任何工具的全能天才创作者”,反而容易在某个时刻翻车。
保留你的创作主权
我这篇文章讲的所有流程,都有一个共同的隐含前提:最终决策权在你手里。 Claude给你15个角度,你选哪个?Claude给你三稿文案,你用哪一版?这些选择累积起来,定义了你的内容风格和品牌。
如果你把选择权也外包给Claude,那你会变成AI的分发渠道,而不是创作者。效率是提上去了,但你的不可替代性在归零。
这条路走到极致的结果就是:当平台算法更新、受众口味变化时,你没有任何积累下来的创作直觉可以依靠,因为你从来没有真正思考过“为什么这个选题能火”、“为什么这个角度更锋利”、“为什么这句话有力量”。你只是做了一个“复制粘贴然后稍微改一下”的中间商。
工具的上限,是你自己的上限。
Claude能帮你把3.5小时的工作压缩到1.8小时,但它不能帮你从一个写300字都头疼的新手变成一个能稳定产出深度内容的创作者。那个跃迁,只能靠你自己一篇一篇地写、一条一条地改、一年一年地积累。
如果你刚开始做短视频,我的建议是:前50条脚本,尽量自己写。 不是为了吃苦,而是为了建立你最基础的判断力。50条之后,你对“好脚本长什么样”有了自己的手感,再引入Claude协作,你会知道它产出的哪部分能用、哪部分必须重来。
如果你已经过了这个阶段,那就用好这篇文章里的流程。从信息投喂到角度筛选,从Prompt设计到人工四节点介入,从单条产出到批量放大,把Claude放在它擅长的地方,把人放在人不可替代的地方。
写完这篇文章的时候,我又看了一眼最初那30条脚本项目的文件夹。34条交付稿,客户过审了31条,3条被打回来重写。打回来的3条有一个共同特征:事实核查没做到位,Claude编的两个数据我没有发现。
这不是Claude的问题。这是我没有守住底线。
所以最后再说一句:流程再好,底线不能破。事实准确性、观点真诚度、个人真实感,这三样东西,Claude不会替你负责,只有你自己能。
常见问题解答(FAQ)
1. Claude 和 ChatGPT 在短视频脚本创作上到底差在哪?为什么我坚持用 Claude?
我试过用 ChatGPT 和 Claude 写同一个主题的脚本,但出来的东西感觉完全不一样。Claude 写出来的逻辑更严密,案例更扎实,而 ChatGPT 有时候会跑偏或者写得很泛。我想知道它们具体的差异点,以及到底什么情况下该选 Claude ?
我自己的实测对比是:用同一个 prompt \"写一个3分钟的知识科普短视频脚本,主题:为什么手机电量从20%掉到1%特别快\",ChatGPT 输出的是电池老化、温度影响等常识点罗列,结构松散;
Claude 直接给出了一个‘开头设问 → 中间分三点解释锂离子电池的工作原理和系统校准误差 → 结尾总结并给出建议’的完整三段式脚本。而且 Claude 主动在括号里备注了‘建议此处插入电池拆解动画’,这种镜头语言提示是 ChatGPT 很少给的。
核心判断:Claude 在处理需要‘逻辑递进’和‘长篇幅复杂结构’的内容时明显更强。如果你写的是观点评论、知识科普、产品评测这类需要清晰论证链的脚本,选 Claude ;如果你写的是纯情绪化、金句堆砌的娱乐口播,那 ChatGPT 可能更快。我的第一手教训是,别盲目跟风,先看你的脚本类型。”
2. 用 Claude 写脚本时,哪个 Prompt 技巧最容易被忽略?我踩过的坑。
我刚开始用 Claude 直接说‘帮我写个短视频脚本’,结果出来的东西又长又空,完全不能用。后来朋友教了我一个技巧,但感觉还是不够。我想知道在 prompt 里到底要写清楚哪些关键要素,才能让 Claude 一次生成接近可用的脚本?
很多人只写‘主题’和‘时长’,但忽略了最关键的一个字段:目标人群的‘认知水平’与‘情绪词库’。举个例子,我写一个针对‘宝妈’的育儿知识脚本,如果只在 prompt 里写‘针对年轻妈妈’,Claude 会输出偏学术化的内容。
正确的做法是加上:‘目标人群:25-35岁、轻度焦虑、喜欢刷小红书、语言偏好:温暖、具体、避免吓唬’。
我测试过的‘黄金 prompt 公式’是: 【主题】+【目标人群画像(2-3句)】+【视频时长/平台】+【核心观点(一句话)】+【结构要求(如:三段式+开头悬念+结尾行动号召)】+【需要避开的雷区(如:不要专业术语、不要负面案例)】 另外还有一个容易被忽略的点:给 Claude 提供一个参考样稿。
我把一个自己觉得不错的同领域脚本头几段贴进去,告诉它“风格参考这个”,生成的语调直接对味了。”
3. Claude 生成的脚本质量怎么判断?我总结了4个‘必改点’。
每次 Claude 输出脚本后,我总觉得哪里不对劲,但又说不上来。是直接改还是推翻重来?有没有一套标准来快速判断哪些部分能用、哪些必须改?我特别想了解有经验的人是怎么审核 AI 脚本的。
我踩过最大的坑就是‘无脑用 AI 初稿’,结果粉丝评论‘感觉像机器人写的’。后来我总结了一套‘4 步质检法’: 1. 真实案例缺失:Claude 90% 会编造‘我的朋友小明’或‘据某研究报告显示’这类模糊案例。
必改:替换成你自己或身边人的真实经历,或者至少加上具体数据来源(比如‘根据 Counterpoint 2024年Q1报告’)。2. 节奏感单一:AI 输出的段落长度平均,缺少口语化的‘嗯’、‘然后呢’、‘你猜怎么着’这类停顿和互动。必改:手动加入 2-3 处口语爆发点,打乱句长。
镜头意识缺失:Claude 不会自动标注分镜。必改:把每一段的‘画面’写出来,比如‘这里切到手机屏幕录屏’或‘这里突然放大表情’。4. 结尾缺乏行动号召:Claude 默认结尾温和。必改:强行加入一句‘点击下方链接’或‘点赞收藏’的明确指令。
我做过一个对比测试:修改前脚本平均完播率 23%,修改后达到 41%(数据来自我自己的抖音后台)。这 4 个点改完,基本就能达到‘可用’档。”
4. 用 Claude 写短视频脚本的完整流程到底需要多久?能不能说个真实时间线?
很多教程都说‘5分钟出脚本’,但我实际操作发现从写 prompt 到改完至少半小时。我想知道一套真实可落地的完整流程,每个环节大概花多少时间,以及有没有优化效率的方法。
我自己的真实时间线(以一条3分钟知识科普脚本为例): – 第一步:选题与素材准备(10分钟) , 确定核心观点,搜集 3-4 个真实数据/案例。这一步不能外包给 Claude ,因为 AI 可能编造数据。
- 第二步:撰写 prompt 并生成初稿(5分钟) , 用我上面说的公式写 prompt ,Claude 响应约 30 秒。- 第三步:初稿质检与人工改写(15分钟) , 按 4 步必改点修改,重点替换案例、加口语、加镜头提示、加行动号召。
- 第四步:二次对话优化(5分钟) , 针对某个不满意的段落,单独对话 Claude 要求重写,比如‘把第三段的语气改得更挑衅一些’。- 第五步:终审与模拟口播(5分钟) , 自己念一遍,卡顿的地方再调整。总耗时约 40 分钟。如果熟练后可以压缩到 25 分钟。
我的经验是:永远不要在第一步花超过 10 分钟想 prompt。先写一个粗糙的 prompt 跑通逻辑,再通过多轮对话优化。另外,建议用 Claude 的‘项目’功能保存一套固定 prompt 模板,每次只需改【主题】和【数据】两项,能再省 5 分钟。
核心关键词
文章版权归“万象方舟”www.vientianeark.cn所有。发布者:程, 沐沐,转载请注明出处:https://www.vientianeark.cn/p/597878/
温馨提示:文章由AI大模型生成,如有侵权,联系 mumuerchuan@gmail.com 删除。
读者评论
这篇文章把Claude的角色定位讲得很清楚,不是一键生成爆款的神器,而是结构化初稿引擎和信息检索器。"从0到0.6的效率黑洞"这个比喻太真实了,我之前就是让它直接出稿,结果全是安全但无趣的观点。现在知道了投喂素材和人工润色缺一不可,尤其是口语化改写那一步,准备拿自己的脚本试试。
实操部分最有价值的是那个六步流程和时间占比。我一直以为AI能省一大半时间,结果数据表明人的决策时间占了80%。误区里提到的"跳过信息投喂"和"把生成当交付",几乎每家公司都有人在犯。打算把那张流程进度图分享给团队,提醒大家先喂信息再提问。
终于有人把Claude和其他模型的脚本能力用数据对比了。逻辑结构4.3、观点锋利度才2.1,这个差距一下就让"为什么AI稿总是差口气"有了答案。另外,长文本环境下的组织稳定性这点是关键,我们做深度脚本经常要处理大量素材,Claude这点优势别人确实没讲透。
幸存者偏差那个案例特别有说服力,从案例搜到脚本成型的每一步都展示了人机分工的核心逻辑。Claude负责广撒网和起草,人负责判断案例真实性和改写语感。感觉这才是真正能在商业交付里用的流程,不是那种"一句提示词出十条脚本"的爽文式教程。准备收藏起来下次做方案时照着跑一遍。