华为昇腾 0day 支持阿里 Qwen3
时间:2025-10-11 23:47:28 来源:孤云野鹤网
IT之家 10 月 5 日消息,昇腾“华为计算”公众号昨日(10 月 4 日)宣布,昇腾昇腾 0day 支持 Qwen3-VL-30B-A3B 模型适配。昇腾
昨日,昇腾阿里云通义千问 Qwen3 系列模型发布并开源其新一代多模态模型:Qwen3-VL-30B-A3B-Thinking 和 Qwen3-VL-30B-A3B-Instruct。昇腾Qwen3-VL 是昇腾一个多模态视觉语言模型系列,基于其前代产品,昇腾Qwen3-VL 在视觉理解方面实现了显著提升,昇腾同时保持了强大的昇腾纯文本处理能力。
主要增强功能:
视觉代理:操作 PC / 移动端图形用户界面 — 识别元素、理解功能、昇腾调用工具、昇腾完成任务。昇腾 视觉编码增强:从图像 / 视频生成 Draw.io/ HTML / CSS / JS。昇腾 高级空间感知:判断对象位置、昇腾视角和遮挡;提供更强的 2D 基础,并为空间推理和具身人工智能实现 3D 基础。 长上下文与视频理解:原生 256K 上下文,可扩展至 1M;能够处理书籍和数小时长的视频,具有完整回忆和秒级索引功能。 增强的多模态推理:在 STEM / 数学领域表现出色 —— 能够进行因果分析和提供基于逻辑与证据的答案。 升级的视觉识别:通过更广泛、更高质量的预训练,能够 " 识别一切 "—— 名人、动漫、产品、地标、动植物等。 扩展的 OCR 功能:支持 32 种语言(此前为 19 种);在低光、模糊和倾斜情况下表现稳健;更好地处理罕见 / 古文字和专业术语;改进了长文档结构解析。 与纯 LLMs 相当的文本理解能力:无缝的文本-视觉融合,实现无损、统一的理解。
IT之家注意到,此前昇腾一直同步支持 Qwen 系列模型,此次 Qwen3-VL-30B-A3B-Thinking 和 Qwen3-VL-30B-A3B-Instruct 模型一经发布开源,即在 LLaMA Factory 和 vLLM 中开箱即用,实现模型的 0Day 适配。
值得一提的是,DeepSeek-V3.2-Exp 于 9 月 29 日发布并开源,引入稀疏 Attention 架构。华为当晚便宣布昇腾已快速基于 vLLM/SGLang 等推理框架完成适配部署,实现 DeepSeek-V3.2-Exp 0day 支持,并面向开发者开源所有推理代码和算子实现。
相关内容
- ·充电还是难题:1734.8万个充电桩,满足不了1400万辆新能源车
- ·向太太卑微!曝婚姻幸福秘诀:支持向华强一夜情,但绝不能碰女明星
- ·泉州首张交通运输罚没电子票据开出
- ·给演技最好的10位金鸡影后排名,宋佳第8,巩俐第5,第1没争议
- ·迪士尼宣布 Hulu 首次走出美国,计划 2026 年整合 Disney+ 应用
- ·高圆圆:中年这道坎儿我们都夸大了
- ·贝林厄姆主动要求落选三狮?
- ·高圆圆:中年这道坎儿我们都夸大了
- ·李悦洲真是宝贝!热身展全能数据,若2隐患补强将更强!
- ·清华大学博士生来泉开展社会实践
- ·方媛疑似否认三胎出生,称不能坐飞机,无法飞成都看郭富城演唱会
- ·泉州中小学7月3日起放暑假 2021—2022学年度校历安排出炉
- ·秋天外套不需要买太多,这几款提前准备好,百搭经典又不挑人
- ·110个观众,首日票房仅3757元,2025年国庆档第一惨案诞生了
- ·连续4天逆跌,票房破5亿?击败陈凯歌夺冠,国庆档诞生了大黑马
- ·上海主持人赵若虹:创业当老板,住400平老洋房,47岁坚持不生娃
最新内容
推荐内容