大模型
按模态组织能力:文本、图片、音频、视频。具体可用范围取决于你的部署配置。
概览
Hopola 可以在后端配置允许的情况下对接不同模态能力。本节帮助你从“能力”角度理解(文本/图片/音频/视频),而不是 绑定到某一家提供商的型号名称。
按模态划分
能力矩阵
为了让页面更“可交付”,建议你把能力按输入/输出与交付物关联起来。下面是一个常用的梳理方式(可按你们的接入情况删改):
| 模态 | 典型输入 | 典型输出 | 最适合的交付物 |
|---|---|---|---|
| 文本 | 简报、约束、素材清单、参考链接 | 结构化大纲、文案包、检查清单 | PPT 大纲、详情页结构、交付说明 |
| 图片 | 参考图、截图、风格关键词 | 视觉方向、版式建议、问题定位 | 主图风格方案、设计评审建议 |
| 音频 | 会议录音、语音备注 | 转写、要点提炼、修改项列表 | 评审纪要、改版任务清单 |
| 视频 | 视频素材、脚本想法、平台约束 | 分镜表、镜头描述、资产清单 | 短视频分镜、字幕/封面/缩略图需求 |
接入清单
无论接哪家提供商,都建议先把“交付级别的稳定性”定义清楚:
| 项 | 建议做法 | 为什么 |
|---|---|---|
| 模态与能力边界 | 按 Text/Image/Audio/Video 列出可用能力与禁用能力 | 避免页面承诺了能力但实际不可用 |
| 输出格式 | 优先结构化输出(表格/JSON/清单),并固定字段 | 便于自动化处理与回归验证 |
| 质量门槛 | 定义“可交付”的判定:可读性、对齐、合规、命名 | 让评审与验收标准一致 |
| 降级策略 | 模型不可用时,回退到模板/规则引擎或提示用户改为手动 | 避免关键流程被卡死 |
注意事项
- 敏感的 Key 与提供商配置应当只保留在后端。
- 尽量用结构化输出(列表/表格/JSON)降低歧义。
- 想要更可控的结果,优先把模型能力与可复用技能工作流结合。