Whisper + DeepSeek:把直播变成可读资产的工业流水线
为什么直播一定要沉淀
直播 = 一次性消费品。看完就没了。 但直播里 80% 的内容是可复用的洞察:金句、案例、问答。
流程总览
●Mermaid
123456graph LR A[直播录音 mp3] --> B[Whisper 转文字] B --> C[DeepSeek 分段 + 主题打标] C --> D[人工校对 5 分钟] D --> E[金句卡 / 问答 / 高能切片] E --> F[发布到知识库]
Whisper 配置要点
- 用
large-v3,中文别用turbo - 加
--initial_prompt喂行业术语 - 输出
.vtt带时间戳,方便后面切片
DeepSeek 整理 Prompt(节选)
你是一名内容编辑。
输入:一段直播转录文本(带 [HH:MM:SS] 时间戳)。
请输出三类内容:
1. 金句墙:抽 5-8 句最有冲击力的话,每句不超过 30 字。
2. 问答精选:识别"听众提问 → 嘉宾回答",整理为 Q/A 对。
3. 高能切片:圈出 3-5 段最值得做成短视频的片段,给出时间区间。
要求:原话保留,不要发挥。
一些坑
- 别相信 Whisper 的标点
- 多人对话先做说话人分离再转录
- 时间戳别让 LLM 改,永远从转录文件里拿
最后
把这套流水线跑一遍,你的直播就从「素材」变成了「资产」。 内容资产是 AI 时代最便宜的生产资料。
读完之后…
1 条评论
文希
AI 创业者 × 内容创作者,「AI 搭子圈」社群发起人。相信 AI 时代每个人都该是自己的产品经理。
RELATED 你可能也想读
评论 · 0
登录 后即可参与讨论