商汤发布日日新5.0大模型体系,直逼GPT-4 Turbo

商汤科技举办技术交流日,发布了行业首个覆盖“云、端、边”全栈的大模型产品矩阵,旨在满足不同规模场景的应用需求。同时,他们全新升级了“日日新SenseNova 5.0”大模型体系,其综合能力已经全面对标GPT-4 Turbo。

人工智能发展的基本法则——尺度定律(Scaling Law)的指导下,商汤科技不断寻求最优数据配比,并建立了数据质量评价体系。这一举措不仅推动了他们自身大模型研发的进程,还为行业伙伴提供了大模型训练、微调、部署以及各类生成式AI的能力和服务。

商汤科技董事长兼CEO徐立表示:“在尺度定律的指导下,商汤将持续探索大模型能力的KRE三层架构(知识-推理-执行),致力于不断突破大模型能力的边界。”

自去年4月首次亮相以来,商汤科技的“日日新SenseNova”大模型体系已经历了五次重大版本迭代,正式推出了“日日新SenseNova 5.0”(以下简称:日日新5.0)。这一最新版本基于超过10TB的tokens训练数据,并广泛涵盖了合成数据,采用了混合专家架构,使得在推理时的上下文窗口能够有效扩展至约200K。

本次更新着重于增强知识、数学、推理及代码能力,旨在全面对标GPT-4 Turbo。在主流客观评测中,日日新5.0已经达到了或超越了GPT-4 Turbo的水平,展现了其在人工智能领域的强大实力和先进技术。

在文科领域,“日日新5.0”显著提升了创意写作、推理和总结能力。在相同的中文知识输入后,该版本能够更好地理解和总结信息,并能够回答问答问题,为教育、内容产业等垂直应用场景提供强大的辅助功能。

举例来说,在解答趣味推理问题时,“妈妈给圆圆冲了一杯咖啡,圆圆喝了半杯后,将它加满水,然后她又喝了半杯后,再加满水,最后全部喝完。问圆圆喝的咖啡多,还是水多?”这类问题,“日日新5.0”能够准确作答,并表现出了高水平的推理能力和逻辑思维能力。

在理科领域,“日日新5.0”在数理能力、代码能力和推理能力方面均达到了业内领先水平,为金融、数据分析等专业场景的实际应用奠定了坚实的基础。

此外,“日日新5.0”在多模态能力方面也取得了显著成就。商汤科技的多模态大模型在图文感知能力上达到了全球领先水平,在多模态大模型的权威综合基准测试MMBench中,其综合得分位居榜首。同时,在多个知名的多模态榜单如MathVista、AI2D、ChartQA、TextVQA、DocVQA和MMMU上,“日日新5.0”也取得了领先的优异成绩,展现了其在多模态理解和处理方面的卓越能力。

商汤科技的“日日新SenseNova 5.0”在应用产品层面展现了卓越的多模态能力,能够支持高清长图的解析和理解,以及文生图交互式生成。此外,它还能实现复杂的跨文档知识抽取和总结问答展示,并具备丰富的多模态交互能力。

商汤率先完成了“云端边”全栈布局,预见并响应了中心化算力向端侧扩展的未来趋势,以及企业级在边缘侧AI需求的增长。他们首次推出了包括“商汤端侧大模型”和面向金融、代码、医疗、政务等多领域的边缘产品“商汤企业级大模型一体机”的“云、端、边”全栈大模型产品矩阵。

今年被称为端侧大模型应用的元年,商汤推出了“日日新·端侧大模型”,其性能达到了同等尺度下的最优水平,并在跨级尺度方面处于全面领先地位。商汤还推出了端云协同解决方案,通过智能化判断实现端云协同,有效降低推理成本,部分场景的端侧处理占比超过80%。

在技术方面,“日日新·端侧大语言模型”的推理速度业内最快,中端平台可实现平均每秒18.3字的生成速度,旗舰平台更达到每秒78.3字。扩散模型在端侧同样实现了业内最快的推理速度,某主流平台上的推理速度小于1.5秒,比云端应用快10倍,并支持高清图像处理和编辑功能。

商汤还推出了面向金融、医疗、政务和代码等领域的企业级大模型一体机,实现了千亿模型加速和知识检索硬件加速的本地化部署,大幅降低了企业应用大模型的门槛,推理成本节约达80%。

此外,商汤还与金山办公、海通证券、小米、阅文集团、华为等多位生态伙伴深度合作,共同探索大模型技术在办公、金融、出行等不同领域的应用及前景。这些合作不仅推动了行业的技术创新,还加速了大模型技术在实际应用中的落地和推广。

商汤科技董事长兼CEO徐立强调,通过智能算力中心的持续赋能,他们不断推进大模型在自然语言处理、视频生成和深度学习优化等领域的创新。商汤始终秉持“坚持原创,让AI引领人类进步”的愿景,致力于突破数据与算力的限制,推动大模型技术的进步与应用,以应对各行业的实际挑战和需求。