跳动百科

多模态检索新突破智源开源多模态向量模型BGE-VL

庾进紫   来源:网易

【多模态检索新突破】:北京智源研究院近日宣布,成功开源了其自主研发的多模态向量模型BGE-VL(Broadly Grounded Embedding for Vision-Language),标志着在跨模态信息检索领域取得了重要进展。

BGE-VL模型融合了图像和文本信息,能够实现高效、准确的跨模态检索。该模型基于深度学习技术,通过大规模多模态数据训练,使计算机具备理解并关联视觉与语言信息的能力。相较于传统单一模态检索方法,BGE-VL不仅提升了检索精度,还显著提高了搜索效率,为图像搜索、智能问答等应用场景提供了强有力的技术支持。

目前,BGE-VL已开放源代码,供全球科研人员和开发者免费使用。这将极大促进相关领域的研究与发展,推动人工智能技术在更多场景中的应用落地。未来,智源研究院将继续深化多模态研究,探索更广泛的应用前景,助力构建更加智能化的信息检索体系。

对于希望利用最新AI技术进行创新的企业和个人而言,BGE-VL无疑是一个值得尝试的重要工具。我们鼓励大家积极下载并测试这一模型,共同推进人工智能技术的进步。