Skip to content

Studio-Chat

Studio-Chat 是 ZenMux 平台提供的智能对话工作台,支持多模型对话、PK 对比、多模态文件输入、Artifacts 生成、联网搜索、图像生成/编辑、语音输入/输出、订阅与按量付费切换等能力。

不同模型、不同 Provider 支持的能力不同,页面会根据当前模型自动启用或禁用对应入口。

Studio-Chat 主界面截图

快速开始

  1. 访问 Studio-Chat
  2. 在输入框中输入问题
  3. Enter 或点击发送按钮发送消息
  4. 等待模型回复;生成过程中可点击停止按钮中断

常用输入方式:

操作方式
发送消息Enter
换行Shift + Enter
停止生成点击输入框右侧的停止按钮
全屏编辑点击输入框右上角展开按钮
粘贴图片复制图片后直接在输入框区域粘贴
拖拽文件将文件拖入输入框区域

从模型详情页进入 Studio-Chat 时,页面会自动带入所选模型。链接中也支持使用 model 参数指定模型;多个模型 slug 用逗号分隔时,会直接创建多个 PK 窗口。

界面结构

Studio-Chat 主要由四个区域组成:

区域说明
左侧边栏新建对话、历史记录、会话分组、置顶、重命名、删除
模型栏选择模型、切换计费方式、查看 API 示例、配置参数、开启同步、添加 PK 窗口
消息区展示用户消息、模型回复、推理内容、引用、用量与日志入口
输入区输入文本、上传文件、选择 Skills、语音录制、发送/停止

移动端会使用更紧凑的侧边栏与历史记录浮层。

空对话中会展示当前模型的详情卡片,方便在发送前确认模型能力、价格和上下文长度。

选择模型

点击模型名称可以打开模型选择器。模型选择器支持:

模型选择器截图

  • 搜索模型名称
  • 按热度/排序规则切换排序
  • 按输出能力筛选:全部、文本、图片
  • 查看模型详情卡片,包括上下文长度、输入/输出模态、价格、Provider、可用状态等
  • 选择普通模型或自动路由模型

模型名称旁会显示当前 Provider。切换模型后,Studio-Chat 会重新计算该模型支持的文件类型、输出类型和 Skills。

输入区

输入区支持文本、多模态附件、Skills 和语音录制。不同 PK 窗口的输入区可以独立使用;开启同步后,文本、附件和部分 Skills 会同步到参与同步的窗口。

常用能力:

  • 附件会显示在输入框上方,支持查看文件名、类型并移除
  • 图片可以通过上传、拖拽或粘贴加入
  • 输入较长内容时,可以点击展开按钮进入全屏编辑
  • 发送按钮不可用时,悬停会显示原因,例如输入为空、当前窗口正在生成、浏览器存储已满等
  • 模型正在生成时,发送按钮会切换为停止按钮

Skills

输入框左侧的 Skills 菜单会展示当前模型可用的能力。不可用能力会置灰或隐藏。

Skills 菜单截图

Skill说明
AI 图片生成让支持图片输出的模型生成图片
AI 图片编辑对图片进行基础编辑
AI 图片抠图对图片进行背景移除/主体抠图
AI 音频生成支持音频输出的模型会显示该入口;具体输出以模型能力为准
网络搜索让支持搜索能力的模型联网获取最新信息
Artifacts生成可预览、可复制、可下载的独立内容

Skills 菜单会按模型能力自动判断可用状态。建议一次只开启与当前任务相关的能力;网络搜索可以和文本对话、部分多模态任务一起使用,具体以当前模型能力为准。

Artifacts

Artifacts 适合生成可复用的内容,例如交互式网页、Markdown 文档、SVG 图形、Mermaid 图表代码等。

Artifacts 生成与预览截图1

Artifacts 生成与预览截图2

使用方法:

  1. 在 Skills 中开启 Artifacts
  2. 输入需求,例如“生成一个项目流程图”或“做一个交互式 HTML 页面”
  3. 模型生成 Artifact 后,消息中会出现 Artifact 卡片
  4. 点击卡片或 Preview 按钮,右侧会打开 Artifact 面板;移动端会以抽屉形式打开

支持的 Artifact 类型:

类型MIME Type说明
Markdowntext/markdown文档、报告、结构化文本
HTMLtext/html单文件 HTML/CSS/JS 交互内容
SVGimage/svg+xml矢量图形
Mermaidapplication/vnd.mermaidMermaid 图表代码

Artifact 面板支持:

  • 内容 / 预览切换
  • 复制内容
  • 下载为对应文件
  • 预览全屏
  • 关闭并返回普通对话视图

网络搜索

网络搜索用于让模型在回答时获取互联网信息。

网络搜索开启与引用来源截图

使用方法:

  1. 选择支持搜索的模型和 Provider
  2. 在 Skills 中开启 网络搜索
  3. 发送问题

如果当前 Provider 支持 web_search_options 或 Google Search 工具,网络搜索入口会可用。开启后,模型会在请求中使用对应的搜索工具;来源链接或引用信息以模型实际返回内容为准。

对话记忆

对话记忆用于控制每次请求携带多少历史消息,适合在长对话中减少上下文负担。

对话记忆与上下文设置截图

输入区会显示当前携带的上下文数量,例如 8/∞6/20。点击该入口可以:

  • 打开最大上下文设置
  • 清除当前上下文,在当前位置插入 New Session 分隔线
  • 查看当前设置会发送全部消息,还是只发送最近 N 条消息

也可以在高级参数面板中调整聊天记忆。PK 同步模式下,修改同步窗口的上下文设置会同步应用到其他参与同步的窗口。

图像生成与编辑

支持图片输出的模型会显示图片相关 Skills。

图像生成

AI 图片生成模式截图

  1. 在 Skills 中选择 AI 图片生成
  2. 输入图片描述
  3. 发送后等待图片生成
  4. 生成结果可预览、下载,也可继续用于后续编辑

部分 Google / Nano Banana 类图像模型支持图片配置:

图片宽高比与分辨率设置截图

参数可选值
图片宽高比默认包括 1:12:33:23:44:34:55:49:1616:9,实际以模型配置为准
图片分辨率默认包括 1K2K4K,实际以模型配置为准
图片质量仅在模型提供 Quality 配置时显示

图像编辑

AI 图片编辑模式截图

  1. 上传图片,或使用上一轮生成的图片
  2. 在 Skills 中选择编辑模式
  3. 输入编辑要求
  4. 发送后查看编辑结果
模式状态说明
基础编辑已支持修改图片内容、风格或局部元素
抠图已支持移除背景或进行主体抠图

文件上传

点击输入框左侧的附件按钮可以上传文件。也支持拖拽上传和粘贴图片。

文件上传菜单与附件预览截图

文件能力由当前模型决定,Studio-Chat 会自动过滤当前模型不支持的附件类型。

类型格式
图片.jpg.jpeg.png.gif.webp
PDF.pdf
文本/代码.txt.md.csv.json.xml.html.htm.markdown.ts.java.c.cpp.cs.go.php.rb.swift.sql.yaml.ini.css
音频.mp3.wav
视频.mp4.avi.mov.mpeg.webm

文件上传后会在输入区或消息中显示附件卡片:

  • 图片:显示缩略图,支持查看大图
  • 音频:发送后以播放器展示
  • 视频:发送后可点击预览播放
  • PDF、文本和代码文件:显示文件名与类型,并随消息发送给模型分析

语音输入与输出

语音输入

当模型支持音频输入时,输入框右侧会显示录音按钮。

语音输入录制截图

  1. 点击录音按钮开始录制
  2. 再次点击或停止后,录音会上传为音频附件
  3. 发送消息时音频会随问题一起提交

在 PK 同步模式下,录音状态会同步到开启同步的窗口。

语音输出

当模型支持音频输出时,Skills 中会显示 AI 音频生成 入口。模型返回音频文件后,消息中会显示可播放的音频控件。

PK 模式

PK 模式用于同时比较多个模型的回答。

PK 模式多模型对比截图

  1. 点击模型栏中的 PK 添加按钮
  2. 新窗口会复制当前最后一个窗口的模型配置
  3. 每个窗口可以单独选择模型、Provider、参数和计费方式
  4. 最多支持 10 个窗口

每个窗口都有同步开关:

状态行为
Sync On在任一同步窗口发送消息时,所有开启同步的窗口都会收到同一问题、文件和 Skills 设置
Sync Off该窗口独立输入和发送,不参与同步发送

点击窗口上的移除按钮可以关闭对应 PK 窗口;当只剩一个窗口时,会自动回到单窗口对话。同步窗口中只要有一个窗口正在生成,其他同步窗口会进入等待状态,避免重复提交。

API 调用示例

点击模型栏中的代码图标可以打开代码集成弹窗。

API 调用示例弹窗截图

弹窗中会根据当前模型和协议展示可复制的调用示例,例如:

  • OpenAI Chat Completions
  • OpenAI Responses
  • Anthropic Messages
  • Gemini / Vertex AI
  • Imagen / Images
  • 自动路由模型调用示例

弹窗底部可以复制代码,也可以跳转到 Pay As You Go 页面创建 API Key。

高级参数

点击模型栏中的设置图标可以配置模型参数。

高级参数配置弹窗截图

参数说明
Protocol选择模型使用的 API 协议;仅在当前模型支持多个协议时显示
Endpoint选择当前模型使用的 Provider / Endpoint;仅在当前模型有多个可用 Endpoint 时显示
系统提示词设置模型角色、语气和行为约束
聊天记忆控制每次请求携带全部历史,或只携带最近 N 条消息
Reasoning Effort设置推理强度,例如 low、medium、high、xhigh
Thinking Budget设置思考预算 token 数;部分模型会默认或强制启用
最大输出控制 Max Tokens 或 Max Completion Tokens
随机性调整 Temperature、Top P
惩罚项调整 Frequency Penalty、Presence Penalty、Repetition Penalty
Seed设置随机种子,便于获得更稳定的输出
Stop Sequences设置停止序列
Logprobs返回 token logprobs,支持时可设置 Top Logprobs
Response Format选择文本或 JSON Object 等响应格式

高级参数会根据当前模型、Protocol、Endpoint 的 supported_parameters 自动显示、启用或禁用。某些模型必须启用推理,此时相关开关会被锁定;Google 协议下的 Reasoning Effort 与 Thinking Budget 会按模型能力自动互斥。

计费方式

Studio-Chat 支持两种计费方式:

计费方式切换菜单截图

模式说明
订阅模式使用订阅计划额度;仅适用于当前订阅覆盖的模型
按量付费模式使用账户余额,按实际请求计费

切换方式:

  1. 点击模型栏中的计费图标
  2. 选择 订阅模式按量付费模式

计费菜单会显示当前订阅额度使用情况、重置时间,以及按量付费余额。用量或余额接近不足时,对应数值会高亮提醒。

如果当前模型不在订阅计划内,订阅模式会不可用或自动切换到按量付费。选择更高等级订阅模型时,页面会提示升级订阅。

当订阅额度用尽时,页面会提示可以切换到按量付费;非免费订阅用户还可以前往开启 Extra Usage。按量付费余额不足、免费模型限流或高级模型需要余额时,页面会提示充值。

快速导航

当桌面端单个窗口内有 3 条及以上用户消息时,消息区右侧会显示快速导航。

快速导航截图

  • 导航项使用用户消息内容作为标题
  • 点击导航项可快速跳转到对应轮次
  • 滚动消息区时,当前所在轮次会自动高亮
  • 手动向上查看历史消息时,页面会显示回到底部按钮

消息操作

消息下方会显示常用操作。模型正在生成时,当前生成中的消息会隐藏操作按钮;同一窗口的其他消息操作会暂时置灰,生成结束后恢复。

消息操作与用量信息截图

操作说明
复制复制消息文本;用户消息和模型回复都支持复制
编辑编辑已发送的用户消息,并基于修改后的内容继续生成
Fork从当前消息节点派生对话,支持 Fork to New Chat;PK 未满 10 个窗口时也支持 Fork to PK
重试使用同一问题和配置重新生成模型回复
下载下载生成的图片、Artifact 等文件结果
删除删除该轮消息;删除时会同时处理对应的用户消息与模型回复
日志详情打开本次请求的日志详情,并可复制 Request ID

用户消息较长时会自动折叠,可展开查看完整内容。编辑用户消息时,可以修改文本、移除或补充附件,然后重新发送。

模型回复下方会显示延迟、总耗时、输入 token、输出 token 等用量信息。支持推理的模型会显示“深度思考”区域,可展开或收起。请求失败时,消息中会展示错误状态码、错误类型、Request ID 和响应详情。

会话管理

左侧边栏展示历史会话,并按时间分组:

会话历史与管理操作截图

  • 已置顶
  • 今天
  • 昨天
  • 最近 7 天
  • 更早

支持的会话操作:

  • 新建对话
  • 切换历史会话
  • 双击会话名称重命名
  • 置顶 / 取消置顶
  • 删除会话
  • 展开 / 收起侧边栏
  • 查看本地、云端或同步中的会话状态

新会话会在首次发送消息时保存到服务器,会话名称默认使用第一条消息内容。若在隐私设置中配置了聊天标题自动总结模型,系统会在对话有足够内容后自动生成更合适的会话标题。切换会话时,模型栏会尽量恢复该会话最近一次回复使用的模型和 Provider。

如果当前会话正在生成,切换会话前会出现确认提示。打开不属于自己的对话链接时,系统会提示是否复制到自己的历史记录。

常见问题

Q: 为什么某些 Skills 或上传类型不可用?

A: Studio-Chat 会根据当前模型的输入/输出模态和 Provider 参数自动判断能力。不支持的功能会置灰、隐藏或在发送前被过滤。

Q: PK 模式最多支持几个模型?

A: 最多支持 10 个模型窗口。

Q: 为什么我选择不了订阅模式?

A: 当前模型可能不在您的订阅计划内。可以切换到按量付费,或升级到覆盖该模型的订阅计划。

Q: 网络搜索为什么没有入口?

A: 只有当前模型和 Provider 支持搜索参数或 Google Search 工具时,网络搜索才会可用。

Q: 图像编辑必须上传图片吗?

A: 通常需要上传图片。如果上一轮已有生成图片,部分图像模型会默认使用上一轮图片作为编辑输入。

Q: 文件上传有大小限制吗?

A: 有。具体限制取决于上传服务、文件类型和当前模型能力。若文件类型不被模型支持,发送时会被过滤。

获取帮助

邮箱

技术支持: [email protected]

商务合作: [email protected]

X / Twitter
Discord