阿里巴巴开源能理解图像的 AI 模型 Qwen-VL

软件科技1年前 (2023)发布 botnews

3.6K 0 0

阿里巴巴开源能理解图像的 AI 模型 Qwen-VL

阿里巴巴周五开源了能理解图像和完成更复杂对话的 AI 模型 Qwen-VL 和 Qwen-VL-Chat。阿里巴巴称，Qwen-VL 基于 Qwen-7B，可以以图像、文本、检测框作为输入，并以文本和检测框作为输出，它使用了约 1.5B 的图文数据训练。在四大类多模态任务的标准英文测评中上，Qwen-VL 均取得同等通用模型大小下最好效果；支持英文、中文等多语言对话，端到端支持图片里中英双语的长文本识别；支持多图输入和比较，指定图片问答，多图文学创作等；相比于目前其它开源 LVLM使用的 224 分辨率，Qwen-VL 是首个开源的 448 分辨率的 LVLM 模型。更高分辨率可以提升细粒度的文字识别、文档问答和检测框标注。Qwen-VL 和 Qwen-VL-Chat 使用名为 Tongyi Qianwen LICENSE AGREEMENT 的许可证，有限制条件，如果商业使用，则需要从阿里巴巴获得授权。

阿里巴巴开源能理解图像的 AI 模型 Qwen-VL

来源：QwenLM/Qwen-VL: The official repo of Qwen-VL (通义千问-VL) chat & pretrained large vision language model proposed by Alibaba Cloud. (github.com)

# 软件科技 # Qwen-VL # Qwen-VL-Chat

© 版权声明

本站专栏文章版权归作者所有，未经允许请勿转载。

相关文章

正版软件五月活动，Fences / Start11 / KeyCue 折扣来袭，会场软件 6 折起！

cansnow

7.9K

小米汽车现阶段电池供应商已敲定

botnews

2.6K

"佛州小丑"向R星索要200万美元：GTA6用了我的外形!

botnews

3.5K

Firefox浏览器推广马甲邮箱功能，用以保护用户的个人信息

botnews

5.2K

OpenAI 驳斥 ChatGPT 的回复是衍生作品的主张

botnews

2.6K

发布新的收费模式后，Unity收到死亡威胁而暂时关闭办公室

botnews

5.6K

司马阅(SmartRead)，是一款AI文档阅读分析工具

暂无评论

暂无评论...

热门书籍

海王2：失落的王国 Aquaman and the Lost Kingdom (2023)

在上一次试图击败海王（杰森·莫玛 Jason Momoa 饰）未果后，黑蝠鲼（叶海亚·阿卜杜勒-迈丁 Yahya Abdul-Mateen II 饰）依然不甘放弃为父报仇，誓要消灭海王。这一次，他找到了传说中的黑暗三叉戟，释放出古老的邪恶力量，比以往更来势汹汹。

产品经理手册（原书第4版）（白金版）

产品领域的专家沉淀20余年的研究成果，汇总几千名产品经理的实践经验，卓越思想领导力奖获奖作品

周鸿祎作为知名的产品经理之一，一手打造了众多国民级的产品。他关于打造爆款的理念，比如刚需、高频、“小白”思维等，已成为网络热词而被广泛接受。

家庭计划 The Family Plan (2023)

讲述一个住在郊区的父亲（马克·沃尔伯格饰）在他隐藏的过往即将揭秘时、如何带领家人逃亡的故事。

无耻之徒(美版) 第十一季 Shameless Season 11 (2020)

该剧最后一季，Gallagher一家和邻里糟乱、热闹，丧又不乏温暖的生活故事将走到尽头。

万物生灵第一季 All Creatures Great and Small Season 1 (2020)

聚焦一个年轻的兽医去乡间的经历，有许多好笑、温馨、可爱的小事，哈利笔下的动物和人都充满灵性，给人春风拂面般的感触。1970年代曾被拍成多部影视作品。

自媒体导航，集各行业所需优选网址、资讯、工具于一体的导航，简约优雅的设计风格，全面的前端用户功能，简单的模块化配置，欢迎您的体验！

Copyright © 2022 个人的笔记浙ICP备14038291号-6

本站由酷盾安全提供高防CDN安全防护服务

由 OneNav 强力驱动

网址设置

网址样式切换

详细简洁

网址卡片按钮

显示隐藏

布局设置

左侧边栏菜单

展开隐藏

页面最大宽度

1700px

搜索框设置

搜索框背景上下位置

仅对图片背景生效

50%

自定义搜索框背景

静图
4K壁纸
视频
随机动态

自定义搜索框高度

聚焦
信息
默认

设置