◈
文本推理
大语言模型推理,覆盖对话、问答、代码生成、文本创作等场景。
deepseek-v3deepseek-r1Qwen-Plus
▣
视觉识别
图像理解与视觉分析,支持物体识别、场景理解、OCR 文字提取。
MiniMax-VLQwen-VL
◆
语音合成
高质量文本转语音,支持多种音色、语速和情感调节。
MiniMax-TTSCosyVoice
●
图像生成
基于文本描述的 AI 图像生成,支持多种风格和尺寸。
MiniMax-ImageSDXL
◎
音乐生成
AI 音乐创作,支持歌词生成、旋律谱曲、多风格编曲。
MiniMax-Music
▶
视频生成
即将上线:AI 视频生成平台,支持文生视频、图生视频、数字人。
◑
人物建模
即将上线:3D 人物建模,支持图片转模型、姿态驱动、数字人。