嗨热线网 > 科技 > 智能 >

挑战GPT-4V,浙大校友推出开源版多模态大模型

2023-10-13 14:58

GPT-4的视觉能力还没全量放开测试,开源对手就隆重登场了。

浙大竺院的一位校友,与微软研究院等机构合作推出了新版多模态模型LLaVA。

LLaVA在11个测试数据集上都成为了SOTA,在GitHub上更是斩获6k+星标。

挑战GPT-4V,浙大校友推出开源版多模态大模型,获GitHub 6k+星标

开发者提供的数据显示,LLaVA的综合能力已经达到了GPT-4V水平的85%,在复杂推理任务上更是超过了96%。

挑战GPT-4V,浙大校友推出开源版多模态大模型,获GitHub 6k+星标

读验证码、判断狗的品种,甚至根据图像生成网页代码……都难不倒LLaVA。

 

郑重说明:网站资源摘自互联网,如有侵权,麻烦通知删除,谢谢!

联系方式:hiholiday12399@gmail.com