阿里云开源了100多个新发布的AI模型,统称为Qwen 2.5。该消息是在该公司的年度云栖大会上宣布的。
阿里巴巴集团的云计算部门还推出了经过改进的全栈基础设施,旨在满足对强大人工智能计算的不断增长的需求。这一新基础设施包括创新的云产品和服务,可增强计算、网络和数据中心架构,旨在支持人工智能模型的开发和广泛应用。
阿里云智能董事长兼首席执行官吴忌寒表示:“阿里云正以前所未有的力度投入人工智能技术的研发和全球基础设施建设。我们的目标是建立未来的人工智能基础设施,服务于我们的全球客户,释放他们的商业潜力。”
新发布的 Qwen 2.5 模型的参数规模从 5 亿到 720 亿不等,拥有更丰富的知识和更强大的数学和编码能力。这些模型支持超过 29 种语言,可满足从汽车、游戏到科学研究等各个领域的各种边缘和云端 AI 应用。
阿里云开源人工智能模型受到广泛关注
自 2023 年 4 月首次亮相以来,Qwen 模型系列获得了巨大的关注,在Hugging Face和ModelScope等平台上的下载量超过 4000 万次。这些模型还启发了仅在 Hugging Face 上就创作了超过 50,000 个衍生模型。
阿里云智能首席技术官周敬人表示:“这一举措旨在赋能各种规模的开发者和企业,增强他们利用人工智能技术的能力,并进一步促进开源社区的发展。”
除了开源模型外,阿里云还宣布升级其专有旗舰模型 Qwen-Max。据报道,增强版在语言理解、推理、数学和编码等领域的表现与其他最先进模型相当。
该公司还扩展了其多模式功能,推出了一款新的文本转视频模型,作为其统一万象大型模型系列的一部分。该模型可以根据中文和英文文本说明生成各种视觉风格的高质量视频,从逼真的场景到 3D 动画。
此外,阿里云还推出了 Qwen2-VL,这是一种更新的视觉语言模型,能够理解超过 20 分钟的视频并支持基于视频的问答。该公司还推出了一款 AI Developer,这是一款由 Qwen 驱动的 AI 助手,旨在支持程序员自动执行需求分析、代码编程以及错误识别和修复等任务。
为了支持这些人工智能的进步,阿里云宣布了几项基础设施升级,包括:
- CUBE DC 5.0,一种可提高能源和运营效率的下一代数据中心架构。
- 阿里云 Open Lake,一种最大化生成式 AI 应用数据效用的解决方案。
- PAI AI Scheduler,一款专有的云原生调度引擎,用于增强计算资源管理。
- DMS:OneMeta+OneOps,跨多云环境的元数据统一管理平台。
- 第九代企业弹性计算服务(ECS) 实例,为各种应用程序提供更出色的性能。
阿里云的这些更新——包括发布 100 多个开源模型——旨在为客户和合作伙伴提供全面支持,以最大限度地利用最新技术的优势,构建更高效、可持续、更具包容性的人工智能应用程序。