让 LLM 既能“看”又能“推理”！-369IT编程

admin管理员组
文章数量:1034127

让 LLM 既能“看”又能“推理”！

DeepSeek-R1 会推理，GPT-4o 会看。能否让

1 LLM既能看又能推理？

DeepSeek-R1取得很大成功，但它有个问题——无法处理图像输入。

1.1 DeepSeek模型发展

自2024.12，DeepSeek已发布：

DeepSeek-V3（2024.12）：视觉语言模型（VLM），支持图像和文本输入，类似 GPT-4o
DeepSeek-R1（2025.1）：大规模推理模型（LRM），仅支持文本输入，但具备更强的推理能力，类似 OpenAI-o1

我们已领略视觉语言模型（VLM）和大规模推理模型（LRM），下一个是谁？

我们需要视觉推理模型（VRM）——既能看又能推理。本文探讨如何实现它。

2 现有模型的问题

当前VLM 不能很好推理，而 LRM 只能处理文本，无法理解视觉信息。若想要一个既能看懂图像，又能深度推理的模型？

物理问题示例

我是一个学生，向 LLM 提问物理问题，并附带一张图像。

就需要一个模型能同时：

理解图像内容
进行深度推理（如分析问题、评估答案、考虑多种可能性）

就需要

让 LLM 既能“看”又能“推理”！

DeepSeek-R1 会推理，GPT-4o 会看。能否让

1 LLM既能看又能推理？

DeepSeek-R1取得很大成功，但它有个问题——无法处理图像输入。

1.1 DeepSeek模型发展

自2024.12，DeepSeek已发布：

DeepSeek-V3（2024.12）：视觉语言模型（VLM），支持图像和文本输入，类似 GPT-4o
DeepSeek-R1（2025.1）：大规模推理模型（LRM），仅支持文本输入，但具备更强的推理能力，类似 OpenAI-o1

我们已领略视觉语言模型（VLM）和大规模推理模型（LRM），下一个是谁？

我们需要视觉推理模型（VRM）——既能看又能推理。本文探讨如何实现它。

2 现有模型的问题

当前VLM 不能很好推理，而 LRM 只能处理文本，无法理解视觉信息。若想要一个既能看懂图像，又能深度推理的模型？

物理问题示例

我是一个学生，向 LLM 提问物理问题，并附带一张图像。

就需要一个模型能同时：

理解图像内容
进行深度推理（如分析问题、评估答案、考虑多种可能性）

就需要

本文标签：让 LLM 既能“看”又能“推理”！

版权声明：本文标题：让 LLM 既能“看”又能“推理”！内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://it.en369.cn/jiaocheng/1748121359a2256561.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

369IT编程

让 LLM 既能“看”又能“推理”！

让 LLM 既能“看”又能“推理”！

1 LLM既能看又能推理？

1.1 DeepSeek模型发展

2 现有模型的问题

物理问题示例

让 LLM 既能“看”又能“推理”！

1 LLM既能看又能推理？

1.1 DeepSeek模型发展

2 现有模型的问题

物理问题示例

更多相关文章

让 LLM 既能“看”又能“推理”！

发表评论

推荐文章

Arthas trace （方法内部调用路径，并输出方法路径上的每个节点上耗时）

崩溃后的顿悟：从数据丢失到铁威马备份中心的救赎之路，NAS的备份“哲学”

AI 技术在英语学习中的应用

活动目录（Active Directory）域故障解决实例

用Cursor重构Go项目，只需7步！

热门文章

群晖挂pt 路由器虚拟服务器设置,设置远程唤醒NAS要几步？用群晖路由只要4步！...

这个AI插件，想让你体验在浏览器上开挂的感觉。

JDBC获取数据库列名

沉没成本模型

Java面试题及答案20232024

PHP 判断是否是有效的 xml

CRRG

数据中台项目建设的深度剖析与实践分享

WebGL软件系统的性能优化方法

WinForm 自动更新升级程序开发指南

最新文章

XSharp(X#)的编译器选项(五)

X#(XSharp)中的调用约定

大模型层出不穷：创新浪潮与产业变革的深度洞察

DeepSeek+PyTest+Browser Use：新一代UI自动化解决方案

AI技术变革下的职场生存指南

程序员刚毕业，先去大厂镀金还是先去小厂攒经验？

万象2008清空boss账户密码

【Tools】GitBook简明教程

oracle exadata celldisk 闪存盘受损导致性能下降

SDUT 2138 图结构练习——BFSDFS——判断可达性

javascript - Type &#39;undefined&#39; is not assignable to type &#39;menuItemProps[]&#39; - Stack Overflow

javascript - VS 2015 Angular 2 import modules cannot be resolved - Stack Overflow

javascript - Get the JSON objects that are not present in another array - Stack Overflow

javascript - How to dismiss a phonegap notification programmatically - Stack Overflow

c - Solaris 10 make Error code 1 Fatal Error when trying to build python 2.7.16 - Stack Overflow

javascript - Type 'undefined' is not assignable to type 'menuItemProps[]' - Stack Overflow