Hpola
Skill价格文档博客

文档

入门
  • 概览
  • 快速入门
技能
  • 内置技能
  • 创建技能
  • 安装技能
大模型
  • 概览
  • 文本
  • 图片
  • 音频
  • 视频
帮助
  • 常见问题
  1. Docs
  2. Models
  3. Overview

大模型

按模态组织能力:文本、图片、音频、视频。具体可用范围取决于你的部署配置。

概览

Hopola 可以在后端配置允许的情况下对接不同模态能力。本节帮助你从“能力”角度理解(文本/图片/音频/视频),而不是 绑定到某一家提供商的型号名称。

按模态划分

  • 文本:文案、结构化简报、PPT 大纲、检查清单。
  • 图片:视觉方向、参考、图片理解与评审。
  • 音频:会议/语音转写,反馈提炼为可执行修改项。
  • 视频:分镜支持、镜头描述、素材清单与字幕策略。

能力矩阵

为了让页面更“可交付”,建议你把能力按输入/输出与交付物关联起来。下面是一个常用的梳理方式(可按你们的接入情况删改):

模态典型输入典型输出最适合的交付物
文本简报、约束、素材清单、参考链接结构化大纲、文案包、检查清单PPT 大纲、详情页结构、交付说明
图片参考图、截图、风格关键词视觉方向、版式建议、问题定位主图风格方案、设计评审建议
音频会议录音、语音备注转写、要点提炼、修改项列表评审纪要、改版任务清单
视频视频素材、脚本想法、平台约束分镜表、镜头描述、资产清单短视频分镜、字幕/封面/缩略图需求

接入清单

无论接哪家提供商,都建议先把“交付级别的稳定性”定义清楚:

项建议做法为什么
模态与能力边界按 Text/Image/Audio/Video 列出可用能力与禁用能力避免页面承诺了能力但实际不可用
输出格式优先结构化输出(表格/JSON/清单),并固定字段便于自动化处理与回归验证
质量门槛定义“可交付”的判定:可读性、对齐、合规、命名让评审与验收标准一致
降级策略模型不可用时,回退到模板/规则引擎或提示用户改为手动避免关键流程被卡死

注意事项

  • 敏感的 Key 与提供商配置应当只保留在后端。
  • 尽量用结构化输出(列表/表格/JSON)降低歧义。
  • 想要更可控的结果,优先把模型能力与可复用技能工作流结合。