中国语音智能公司科大讯飞董事长刘庆峰说,公司推出的大模型产品“星火认知大模型”在中文长文本生成、医疗领域的知识问答、数理能力等方面已经超过了ChatGPT,而在语言理解等方面还落后ChatGPT。
据财新网报道,刘庆峰星期六(5月6日)在合肥举行的“星火认知大模型”成果发布会上说,“大模型都还在快速迭代过程中,即便是GPT-4很多问题仍然回答的不好,所以只是找单点例子来证明哪个系统强是没有意义的”。
他并说,科大讯飞牵头设计的大模型评测体系覆盖了七大类和481个细分任务类型,七大类即长文本生成、语言理解、知识问答、逻辑推理、数学能力、代码生成、多模态输入和表达能力。
科大讯飞研究院院长刘聪在发布会现场演示了“星火认知大模型”在这七大方面的能力。报道称,在演示中,该模型可以写文案、编故事,可以根据场景含义理解成语意思并给出针对性分析,并根据上下文逻辑推理;也可以解决基础的数学问题、生成简单代码;该模型还具备图片、语音等多模态的输入、输出能力。
刘庆峰称,“星火认知大模型”在中文长文本生成、医疗领域的知识问答、数理能力等方面已经超过了ChatGPT,而在语言理解等方面还落后ChatGPT。他同时公布,将于6月9日升级该模型在开放式问答、多轮对话、数学能力,并于8月15日升级代码能力、多模态交互能力。
刘庆峰说,“星火认知大模型”10月24日将在中文通用大模型上超过ChatGPT现有水平,英文和ChatGPT现有水平持平。
另据报道,在此次发布会上,科大讯飞还公布了大模型能力带来的对于教育、办公等领域现有产品的功能升级。在教育领域,科大讯飞学习机借助该模型实现了批改作文、中英文口语对话的能力。在现场展示中,学习机产品可以通过拍照自动批改小学水平的中文作文及高考英语作文,可以实现指出错别字、语句修订、评分等功能。
刘庆峰说:“我们也将把星火大模型的能力开放给开发者,我们会根据国家有关管理部门的要求严格的把控,而本次发布的各个领域的落地都是马上能用的,也是国家部委特别支持的。”