10月31日,阿里云正式发布千亿级参数大模型通义千问2.0。在10个权威测评中,通义千问2.0综合性能超过gpt-3.5,正在加速追赶gpt-4。当天,通义千问app在各大手机应用市场正式上线,所有人都可通过app直接体验最新模型能力。
过去6个月,通义千问2.0在性能上取得巨大飞跃,相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。目前,通义千问的综合性能已经超过GPT-3.5,加速追赶GPT-4。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
图:通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4
Voicepods
Voicepods是一个在线文本转语音平台,允许用户在30秒内将任何书面文本转换为音频文件。
142
查看详情
在MMLU、C-Eval、GSM8K、HumanEval、MATH等10个主流Benchmark测评集上,通义千问2.0的得分整体超越Meta的Llama-2-70B,相比OpenAI的Chat-3.5是九胜一负,相比GPT-4则是四胜六负,与GPT-4的差距进一步缩小。
中英文理解能力是大语言模型的基本功。英语任务方面,通义千问2.0在MMLU基准的得分是82.5,仅次于GPT-4,通过大幅增加参数量,通义千问2.0能更好地理解和处理复杂的语言结构和概念;中文任务方面,通义千问2.0以明显优势在C-Eval基准获得最高得分,这是由于模型在训练中学习了更多中文语料,进一步强化了中文理解和表达能力。
在数学推理、代码理解等领域,通义千问2.0进步明显。在推理基准测试GSM8K中,通义千问排名第二,展示了强大的计算和逻辑推理能力;在HumanEval测试中,通义千问得分紧跟GPT-4和GPT-3.5,该测试主要衡量大模型理解和执行代码片段的能力,这一能力是大模型应用于编程辅助、自动代码修复等场景的基础。

图:通义千问2.0发布
通义千问更成熟了,也更好用了。通义千问2.0在指令遵循、工具使用、精细化创作等方面作了技术优化,能够更好地被下游应用场景集成。通义大模型官网上线了多模态和插件功能,支持图片输入、文档解析等细分任务。
与此同时,基于通义大模型训练的8大行业模型组团上线,他们分别是通义灵码-智能编码助手、通义智文-AI阅读助手、通义听悟-工作学习AI助手、通义星尘-个性化角色创作平台、通义点金-智能投研助手、通义晓蜜-智能客服、通义仁心-个人专属健康助手、通义法睿-AI法律顾问。8大行业模型面向当下最受欢迎的多个垂直场景,使用领域数据进行专门训练。用户可以在官网直接体验模型功能,开发者可以通过网页嵌入、API/SDK调用等方式,将模型能力集成到自己的大模型应用和服务中。

图:通义大模型家族全面升级,8大行业模型组团上线
截至10月,阿里云已与60多个行业头部伙伴进行深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。
周靖人透露,阿里云计划近期开源通义千问72B版本,此前,阿里云已先后开源7B和14B版本模型,模型累计下载量超过100万。阿里云将持续支持千行百业的开发者基于通义千问开源模型进行模型和应用创新。

图:通义千问72B即将开源
以上就是阿里云发布通用问答2.0,性能超越GPT-3.5,加速追赶GPT-4的详细内容,更多请关注其它相关文章!
# 仁心
# 大连网站建设外包价格
# 装饰网站建设制作方案
# 抖音推广营销运营分析
# 怎么找营销号推广自己
# 优化网站推广排名公司
# 小程序代替网站建设
# 如何做网站推广自己公司
# 吕梁国产网站推广技术指导
# 福泉网站推广公司
# 忻州seo公司选1火星
# 下载量
# 阿里云
# 新能源
# 价位
# 榜上有名
# 多个
# 华为
# 官网
# 达摩
# 开源
# llama
# 通义灵码
# 通义千问
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
优化推广96088 】
【
技术知识133117 】
【
IDC资讯59369 】
【
网络运营7196 】
【
IT资讯61894 】
相关推荐:
走进首家“元宇宙”未来工厂,卡奥斯探知工业之旅出发!
人工智能如何与智能家居集成
7/8上海 | 2025世界人工智能大会分论坛:科技与人文-共筑无障碍智能社会
全球首款AI裸眼3D平板 国产的售价破万
AI证件照生成器:实际测试中AI软件展现了绝无仅有的强大效能
360发布数字安全和人工智能的强大结合:360安全大模型
借力AI!PCB全球巨头,有爆发潜质吗?
独家视角:首次展示有人与无人协同打击的7000米高空察打一体无人机
美图设计室2.0使用教程
BLIP-2、InstructBLIP稳居前三!十二大模型,十六份榜单,全面测评「多模态大语言模型」
小米发布CyberDog2 - 他们的第二代仿生四足机器人展示
图像生成过程中遭「截胡」:稳定扩散的失败案例受四大因素影响
华为将于 7 月发布面向 AI 大模型的新款存储产品
人工智能赋能无人驾驶:商业化进程再提速
Meta 开源 AI 语言模型 MusicGen,可将文本和旋律转化为完整乐曲
常见的五个人工智能误解
联想戴炜:以全栈AI加速CT与IT融合,共建高质量算力网络
机构:边缘AI或是当前预期差最大的AI方向
腾讯TRS之元学习与跨域推荐的工业实战
苹果2万5的AR遭遇砍单95%:不及预期
《共同的演化》展览启幕,重新思考人类与人工智能关系
软银、淡马锡、沙特阿美突击入股,“协作机器人第一股”节卡股份:强敌环伺,持续失血是常态
靠游戏更靠AI 英伟达成唯一首季度两位数增长的公司
郭帆导演成功利用AI技术制作的《流浪地球3》预告片在央视热播,引发巨大反响
当TS遇上AI,会发生什么?
田渊栋新作:打开1层Transformer黑盒,注意力机制没那么神秘
探索AI前沿理念 2025全球人工智能技术大会在杭州开幕
WHEE网页地址入口
微软Xbox称VR和AR还需要时间 先玩大的
世界人工智能大会上,科大讯飞宣布与华为联手
飒智智能机器人核心技术与应用论坛暨一体化控制器发布会成功举办
如何用Transformer BEV克服自动驾驶的极端情况?
智能机器人与话剧的完美结合:宇树四足机器人B1助力《骆驼祥子》重现经典
一图速览 | 十大脑机接口关键技术发布
利亚德加码AI战略,与光年无限图灵机器人全面开展AI研发业务合作
Transformer六周年:当年连NeurIPS Oral都没拿到,8位作者已创办数家AI独角兽
“智能体动作生成技术”现身WAIC:游戏AI技术为机器人科创注入新动力
小米首次曝光 64 亿参数的 MiLM-6B AI 大模型,或将应用于小爱同学
苹果AR头显商标与华为撞车,在中国或改名
谷歌旗下 DeepMind 开发出 RoboCat AI 模型,能控制多种机器人执行一系列任务
MiracleVision视觉大模型
报道称亚马逊正在测试AI生成产品评价摘要
2025世界人工智能大会(上海)开幕式纪要
DreamAvatar数字人在哪里下载
字节团队提出猞猁Lynx模型:多模态LLMs理解认知生成类榜单SoTA
午报 | 字节跳动要造机器人;东方甄选首次启动自有APP|直播|
微软推出人工智能模型 CoDi,可互动和生成多模态内容
国家发改委组织工业机器人产业高质量发展现场会
参议院司法听证会:AI 不易管控,有可能被恶意分子利用来研发生化武器
比尔盖茨:AI确实存在风险,但可控
2023-10-31
运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。