“商汤科技引领创新:国内首屈一指的GPT-4Turbo级大模型「日日新5.0」震撼发布
中国首个GPT-4 Turbo级别的大模型商汤「日日新 5.0」正式发布!
国产AI领域迈向全球顶尖的里程碑时刻到来了。2024年4月23日,商汤科技推出了全新升级的「日日新 5.0」大模型,该模型在知识、数学、推理和代码能力上都迈入了一个新的高度,整体性能达到甚至超过了GPT-4 Turbo,并且在多项主流客观评测中表现出色。
「日日新 5.0」的能力提升主要归功于以下几个方面:
- 采用混合专家架构(MoE):通过少量激活的参数实现复杂推理,推理时上下文窗口达到约200K。
- 大规模数据支持:模型基于超过10TB的语料训练,覆盖数千亿逻辑型合成思维链数据。
- SenseCore算力与算法调优:商汤AI大装置SenseCore算力设施与算法设计的联合调优,为模型性能提供强大支持。
在核心测试集上,「日日新 5.0」几乎所有指标均与或超过GPT-4 Turbo的水平,展现了其在多个领域的强大能力。
具体来看,「日日新 5.0」在自然语言能力、文生成能力、多模态和数据分析能力等方面都有显著提升:
- 自然语言能力:「日日新 5.0」在创意写作、推理和总结能力方面表现突出,能够以更开放式的方式进行创作,融合通用和新知识,为教育和内容产业提供有力支持。
- 数学推理能力:在数学推理方面,「日日新 5.0」展现出对复杂问题的理解能力,能够正确回答包括推理和逻辑问题在内的挑战性数学题目。
- 文生成能力:模型的文生成能力也得到了显著提升,特别是在人物生成和场景建模方面,展现出了非常好的技术和美感。
- 多模态和数据分析能力:「日日新 5.0」在多模态感知和数据分析能力方面位居领先地位,能够处理高清长图的解析和理解,并支持复杂的跨文档知识抽取和总结问答展示。
总体来说,商汤「日日新 5.0」的发布标志着中国在AI技术领域的重要进步,不仅提升了自然语言处理和文生成的能力,还在多模态感知和数据分析领域取得了重大突破。