模型API服务-新功能发布记录
2025年7月
上线Qwen3-Coder模型:
Qwen3-Coder-480B-A35B-Instruct 是由 Qwen 团队开发的混合专家 (MoE) 代码生成模型。该模型针对函数调用、工具使用以及基于存储库的长上下文推理等代理编码任务进行了优化。该模型总共包含 4800 亿个参数,每次前向传递有 350 亿个活跃参数(160 位专家中的 8 位)。
上线GLM-4.5模型:
GLM-4.5 是Z.AI最新的旗舰基础模型,专为基于代理的应用构建。它采用混合专家 (MoE) 架构,支持高达 128k 个 token 的上下文长度。GLM-4.5 在推理、代码生成和代理对齐方面提供了显著增强的功能。
上线Kimi-K2模型:
上新开源模型Kimi-K2,是一款具备超强代码和 Agent 能力的 MoE 架构基础模型,总参数 1T,激活参数 32B。在通用知识推理、编程、数学、Agent 等主要类别的基准性能测试中,K2 模型的性能超过其他主流开源模型。
2025年6月
上线Flux系列图像生成模型:
包含Flux Dev、Flux Kontext Pro、Flux Kontext Max、Flux Kontext Pro Multi、Flux Kontext Max Multi、Flux Kontext Pro-Text to Image、Flux Kontext Max-Text to Image 共6款模型,支持文生图、图生图、多图编辑等多种功能,按调用次数计费。
上线阶跃Step 1模型:
开放源代码的多模态图像编辑模型,接近 GPT‑4o 与 Gemini2 Flash 性能,支持自然语言驱动的区域修正与风格变换。
上线文心4.5系列模型:
包含ERNIE 4.5 Turbo、ERNIE 4.5 Turbo VL、ERNIE X1 Turbo,具备更强的理解、规划、反思与进化能力,适用于中文问答、写作、文案等场景。
2025年5月
模型API服务正式上线,提供多种大模型调用能力,包括DeepSeek-V3、DeepSeek-R1、Qwen3-235B、QwQ等,支持Chat API、文本生成等功能。
产品包含以下子模块:
- 模型广场: 提供可调用的模型列表,包括DeepSeek-V3(64K上下文)、DeepSeek-R1(推理优化)、Qwen3-235B(开源大模型)等,支持不同场景需求;
- 模型体验: 用户可在控制台直接体验聊天对话,测试模型效果,支持流式与非流式输出;
- API Key管理: 支持创建和管理API Key,用于鉴权调用,采用标准OpenAI兼容格式,方便开发者迁移;
- 调用统计: 提供API调用次数、延迟、费用等数据监控,帮助用户优化使用策略。
使用说明:
- 接口地址(URL):https://api.modelverse.cn/v1/chat/completions (opens in a new tab)
- API Key: 需在控制台申请,用于身份验证;
- 模型ID: 和HuggingFace保持一致,如deepseek-ai/DeepSeek-R1-0528、deepseek-ai/DeepSeek-V3-0324。
价格与计费:
- 按Token计费: 不同模型的输入/输出价格不同(如DeepSeek-V3-0324输入2元/百万Token,输出8元/百万Token)。