中国云计算及人工智能科技公司阿里云发布聊天机器人通义千问2.5大模型,并称该模型性能全面赶超GPT-4。
据第一财经报道,阿里云星期四(5月9日)正式发布通义千问2.5。该公司说,与通义千问2.1版本相比,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%;与GPT-4相比,中文语境下,通义千问2.5文本理解、文本生成、知识问答及生活建议、闲聊及对话、安全风险等多项能力赶超GPT-4。
阿里云称,随着通义千问2.5的发布,在权威基准OpenCompass上,该模型得分追平GPT-4 Turbo,是中国国产大模型首次在该基准取得该项成绩。
GPT-4 Turbo是人工智能聊天机器人ChatGPT的研发公司OpenAI推出的最新大型语言模型。
此前,中国人工智能巨头商汤科技4月也发布全新升级的日日新SenseNova5.0大模型。澎湃新闻报道,该模型采用混合专家架构(MoE),超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右,综合能力全面对标GPT-4 Turbo。