阿里发布AI新模型 称性能全球领先

时间:2025-02-01 08:12内容来源:联合早报 新闻归类:中国聚焦

阿里发布AI新模型 称性能全球领先

(杭州综合讯)中国科技巨头阿里巴巴本周发布旗下人工智能(AI)大模型通义千问升级版,称这个新模型性能全球领先,在多项测试中得分优于ChatGPT创始者美国OpenAI、美国脸书母公司Meta、中国初创公司深度求索(DeepSeek)等新发布的模型。

阿里巴巴旗下的云计算和人工智能公司阿里云,大年初一星期三(1月29日)凌晨在微信公众号发布通义千问最新的旗舰版模型Qwen2.5-Max,并称新模型展现出极强的综合性能。利好消息带动阿里在美股价上涨6.7%。

阿里云说,通义团队分别对Qwen2.5-Max的指令模型和基座模型两版本性能进行评估测试。

指令模型方面,阿里AI新模型在多个基准测试中比肩美国的Claude-3.5-Sonnet模型,并几乎全面超越OpenAI最新的GPT-4o模型、Meta最新的Llama-3.1-405B模型,以及DeepSeek去年12月发布的DeepSeek-V3模型。

AI大模型主要分为基座、对话、指令等版本,三者功能不同。基座模型通常用于处理广泛的自然语言任务;指令模型则在基座模型上微调,并更擅长遵循人类指令。对话模型专门用于处理对话,能进行高质量的对话交流。

在基座模型方面,阿里AI新模型在11项基准测试中,全部超越DeepSeek-V3、Llama-3.1-405B。

路透社分析,阿里选择大年初一发布Qwen 2.5-Max是较为特殊的时间点,显示DeepSeek过去三周迅速崛起,给中国境内外竞争对手带来压力。

不过,阿里云并未将Qwen 2.5-Max,与1月20日问世的深度求索最新模型DeepSeek-R1进行对比。

与腾讯、百度等一样,阿里近年投入大量资源到云服务领域,积极招募AI开发员来使用其工具。这些云服务提供商近月纷纷下调价格以争取更多用户,DeepSeek加入战局预计将导致这波价格战更加激烈。

热度: ° | 返回联合早报首页 可查看更多内容。
赞一下
(0)
0%
赞一下
(0)
0%
相关栏目推荐
推荐内容