4家央国企的创新故事,背后都有“云”

图灵汇官网

9月25日,阿里云发布了通义千问系列中的140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,并宣布这两款模型将对外开放,免费且可用于商业用途。在多项权威测试中,Qwen-14B的表现优于相同规模的其他模型,在某些指标上甚至接近了Llama2-70B。在此之前,阿里云已开放了70亿参数模型Qwen-7B,其下载量在短短一个月内就超过了100万次。

Qwen-14B是一个支持多种语言的高性能开源模型,它采用了更多高质量的数据进行训练,总训练数据量超过3万亿Token,这使得该模型在推理、认知、规划和记忆方面的能力更加出色。Qwen-14B能够处理最长8000个Token的上下文。

Qwen-14B-Chat则是在Qwen-14B的基础上进一步优化得到的对话模型。得益于Qwen-14B的强大性能,Qwen-14B-Chat在生成内容时的准确性有了显著提升,同时更贴近人类的语言习惯,内容创作也更加丰富多彩。

Qwen模型具备出色的工具调用能力,使开发者能够更快地创建基于Qwen的智能体。例如,开发者可以通过简单的指令教会Qwen使用复杂工具,如Code Interpreter工具来执行Python代码,从而完成复杂的数学计算、数据分析和图表制作等工作。此外,还可以开发出具有多文档问答和长文写作功能的高级数字助手。

目前,用户可以从魔搭社区直接下载Qwen-14B和Qwen-14B-Chat模型,也可以通过阿里云的灵积平台访问和调用这些模型。阿里云为用户提供全面的服务,包括模型训练、推理、部署和微调等。

今年8月,阿里云开源了70亿参数的通义千问基座模型Qwen-7B,迅速登上HuggingFace和GitHub的热门榜单。在短短一个多月的时间里,Qwen-7B的下载量就突破了100万。开源社区中涌现出50多个基于Qwen的模型,许多知名工具和框架也集成了Qwen。

阿里云CTO周靖人表示,阿里云将继续坚持开源开放的理念,推动中国的大模型生态建设。阿里云相信开源开放的力量,率先开源自研大模型,旨在让大模型技术更快地普及到中小企业和个人开发者。

此外,阿里云还发起了AI模型开源社区魔搭ModelScope,集结全行业的力量,共同推进大模型技术的普及和实际应用。在过去两个月里,魔搭社区的模型下载量从4500万激增至8500万,增长了近100%。

阿里云副总裁、公共与客户沟通部总经理张启指出,单一的技术并不足以推动整个行业的发展,只有多样化的技术和合作才能实现共赢。无论是闭源大模型还是开源大模型,自研大模型还是第三方大模型,大规模参数模型还是小规模参数模型,通用大模型还是行业专属大模型,阿里云都持开放态度,并积极支持。阿里云致力于打造一个开放的大模型市场,让所有大模型都能在阿里云平台上运行得更快、更经济、更安全。因此,阿里云率先开源了7B和14B模型,并将继续开放,为开源社区做出贡献。

本文来源: 图灵汇 文章作者: 数据中心运维管理
    下一篇

[标签:内容]