visual ChatGPT:为 ChatGPT 添加图片能力

TaskMatrix连接 ChatGPT 和一系列 Visual Foundation Models 以实现在聊天过程中发送接收图像。

请参阅我们的论文:Visual ChatGPT:使用 Visual Foundation 模型交谈、绘图和编辑

https://github.com/microsoft/TaskMatrix

洞察力和目标:

一方面,ChatGPT(或 LLM)作为一个通用界面,提供对广泛主题的广泛和多样化的理解。另一方面,基础模型通过提供特定领域的深入知识来充当领域专家。通过利用一般知识和深度知识,我们的目标是构建一个能够处理各种任务的人工智能。

演示

visual ChatGPT:为 ChatGPT 添加图片能力

系统架构

标识