首页单机游戏网络游戏电视游戏手机游戏

资讯攻略下载找游戏专区

网页游戏

1.76原始传奇
|

鬼服高爆版
|

盗墓笔记
|

霸者天下
|

传奇打金猪
|

微微三国
|

权利的游戏
|

道士三条狗
|

云中诀
|

神兵奇迹MU
|

开天西游
|

新不良人
热门单机

生化危机4RE

|

博德之门3

|

文明7

|

剑星

|

最后生还者2

|

王国之泪

|

只狼

|

羊蹄山之魂

|

无双起源

|

荒野大镖客2

|

巫师3

|

黑神话悟空

暗黑破坏神4

|

双影奇境

|

光与影

|

战神5

|

赛博朋克2077

|

丝之歌

|

宝可梦朱紫

|

艾尔登法环

|

上古卷轴5

|

明末渊虚之羽

|

仁王2

|

刺客信条影
近期新作

乐高蝙蝠侠

|

深海迷航2

|

地平线6

|

今古群侠

|

权游国王大道

|

英雄无敌

|

识质存在

|

异环

|

红色沙漠

|

怪猎物语3

|

生化9

|

杀戮尖塔2
即将上市

007新作

|

薛定谔电话

|

千年奇谭

|

轮回之兽

|

哥特王朝Re

|

漫威斗魂

|

命运石之门

|

艾恩葛朗特

|

AC4重制

|

沃德灵共生

|

影之刃零

|

空轨2nd

正文内容评论(0)

游民星空 > 资讯中心 > 科技频道 > 正文

清华推出新一代图像理解大模型：可识别《原神》等

2023-12-27 16:17:28 来源：微博作者：转载编辑：动次哒次KDS　浏览：loading

清华KEG实验室近日和智谱AI合作，联合推出了新一代图像理解大模型CogAgent。

该模型基于此前推出的CogVLM，通过视觉GUI Agent，使用视觉模态（而非文本）对GUI界面进行更全面直接的感知，从而作出规划和决策。

CogAgent可以接受1120×1120的高分辨率图像输入，具备视觉问答、视觉定位（Grounding）、GUI Agent等多种能力，在9个经典的图像理解榜单上（含 VQAv2，STVQA, DocVQA，TextVQA，MM-VET，POPE 等）取得了通用能力第一的成绩。

例如，用户输入一张关于CogVLM项目的GitHub的图片，然后询问如何给这个项目点“Star”，然后CogAgent就会反馈出结果。

例如用户输入一张原神游戏的截图，可以询问“当前任务中的队友是谁？”，CogAgent会给出相关的回答。

人喜欢

游民星空APP

随时掌握游戏情报

分享

新浪微博 QQ 微信

举报| 收藏|

标签：
科技

休闲娱乐

综合热点资讯

单机游戏下载

《刮个爽》官方中文版下载

《红色沙漠》官方中文版下载

好物推荐

"星际3"能玩了!3A级RTS《零度空间》参加6月新品节

发布时间：2026-05-22
印尼版“生化危机”！邪教入侵，沉浸式心理恐惧

发布时间：2026-05-22
疑因“太难”而被P社解约?史上最硬核的太空挖矿游戏

发布时间：2026-05-22

游民星空联运游戏