文本、图像和音频等多模式输...
BuboGPT是一种先进的大型语言模型 (LLM),它结合了文本、图像和音频等多模式输入,具有将其对视觉对象的响应作为基础的独特能力。无论是对齐还是未对齐,它在理解任意图像和音频数据方面都表现出卓越的聊天能力。
全球首个多模态图文音预训练模型
西湖大模型西湖心辰开发的多...
面壁露卡Luca是面壁智能最新...
以 Project AI2.0 之名入局大...