阿里发布Qwen3.7 阿里不仅能看懂图片和视频
新浪科技讯 6月2日上午消息,阿里阿里巴巴发布千问3.7系列多模态大模型Qwen3.7-Plus,发布宣布实现多模态混合智能体新突破:文本和视觉能力均大幅提升,阿里不仅能看懂图片和视频,发布还能深度推理、阿里自我编程、发布调用工具、阿里验证测试并自主迭代,发布将“看、阿里想、发布写、阿里做、发布验”整合进统一的阿里智能体工作流,轻松完成一键复刻手机App应用、发布桌面端专业软件等复杂长程任务。阿里
目前,Qwen3.7-Plus已上线阿里云百炼,对外提供API服务。据悉,在全球视觉大模型榜单Vision Arena中,Qwen3.7-Plus据全球前五、国内第一。
据悉,此次发布的Qwen3.7-Plus是千问3.7系列的最新模型,性能较上代Qwen3.6-Plus进步显著,纯文本能力甚至可接近旗舰模型Qwen3.7-Max的水平,涌现出Plus级别模型最强的编程、Agent、推理及通用能力。在编程实测Terminal Bench 2.0-Terminus、科学问题编程SciCode等评测中,新模型较Qwen3.6-Plus大幅提升约9分,媲美Claude-Opus-4.6Max;在评估通用Agent能力的Skillbench评测中,大幅提升10.2分,展现出强大的智能体能力;在数学推理Apex评测中,Qwen3.7-Plus取得了近3倍于上代模型的性能评分表现。
变得更聪明的Qwen3.7-Plus,还“睁开了眼睛”,并基于智能体的实际需求系统性增强了视觉能力:在纯视觉推理BabyVision评测中,Qwen3.7-Plus得分从上代的37.4大幅提升至64.7,超过了Gemini3.1-Pro,实现了泛化能力的飞跃;在搜索增强知识问答的SimpleVQA、MMSearchPlus、MMBC等权威评测中,新模型较Qwen3.6-Plus性能得分提升最高2倍多,表现大多优于Claude-Opus-4.6 Max、Gemini3.1-Pro,解决开放问题会更可靠、更准确。
文本与视觉能力的双重提升,也激发出Qwen3.7-Plus崭新的多模态混合智能体能力,可自主闭环执行复杂任务。比如,Qwen3.7-Plus基于强大的GUI感知能力,模拟人与示例股票应用自主交互,并据此自动生成代码;同时,千问3.7还调用工具获取实时数据,自主执行和通过了10项核心测试,一比一复刻了这一桌面端的复杂应用。(文猛)

海量资讯、精准解读,尽在新浪财经APP 责任编辑:江钰涵
相关文章

华擎推出N250M/D5主板:集成N250处理器 无风扇被动散热
快科技6月2日消息,华擎最新推出了N250M/D5主板,板载代号为“Twin Lake”的英特尔N250处理器,并采用无风扇被动散热设计,运行极为静音。该主板采用M-ATX规格,尺寸为22.6 x 12026-06-04
快科技6月2日消息,今日,腾讯云发布调价公告,旗下DeepSeek-V4系列两款大模型将于次日起下调调用价格,调价范围涵盖推理输入、推理输出、缓存命中三类计费项目。定价细则显示,DeepSeek-V42026-06-04
专题:第十九届国际太阳能光伏和智慧能源上海)大会6月2日消息,在今天举行的第十九届2026)国际太阳能光伏和智慧能源上海)大会开幕式上,中国电力建设企业协会会长,国际金融论坛IFF)能源转型与发展委员2026-06-04
快科技6月1日消息,据韩国进口车协会KAIDA)6月1日披露数据显示,4月在韩新注册登记的进口车中,中国产汽车以2023辆排名第三,史上首次超越日本产汽车的1974辆。4月韩国进口车总注册量约3.4万2026-06-04
2027年度国家自然科学基金委员会与日本学术振兴会合作交流与双边研讨会项目指南根据国家自然科学基金委员会NSFC)与日本学术振兴会JSPS)签署的合作协议及后续达成的共识,双方将在2027年继续共同资2026-06-04
加州通过“停止杀死游戏”法案,要求厂商结束运营提供离线模式或全额退款
来源:游戏研究社5月27日,美国加州众议院以43票赞成、16票反对的结果通过了“保护我们的游戏法案”Protect Our Games Act)。简单来说,这项法案主要针对买断制数字游戏,要求厂商在停2026-06-04

最新评论