【打印】
【进入博客】
【推荐给朋友】
【CMIC讯】近日,中国移动宣布推出自主研发的“九天深度思考大模型”,通过模拟人类思维过程的进阶处理方式,在复杂任务推理、精准意图理解和专业领域知识应用等方面展现出显著优势。
据了解,“九天深度思考大模型”具备严谨的数学推理能力、文字组织能力及丰富的行业知识。与传统语言大模型不同,“九天深度思考大模型”在处理问题时并非直接生成答案,而是通过多次迭代的“慢思考”过程,确保每个结论均经过严谨推演,在提升复杂任务准确性的同时,还显著增强了答案的可解释性。测试结果显示,“九天深度思考大模型”在代码理解、数学计算、生成内容逻辑、专业知识全面性和准确性等方面效果显著提高,并在奥林匹克数学考试题、GPQA两个数据集中表现优异。
中国移动表示,九天大模型的技术优势体现在四大核心领域:一是实现全链路自主创新,覆盖数据集构建、预训练、微调、强化学习及推理等关键环节;二是完成全栈国产化支持,基于国产万卡算力集群与算法框架,完成17款国产AI芯片的适配验证,实现跨芯片架构的无缝迁移与持续训练;三是打造体系化AI技术体系,凭借算力网络优势实现开放环境下AI能力的智能调度与弹性部署;四是强化复杂系统智能化能力,打造行业智能化引擎,深度解构通信、能源等重点领域业务逻辑,实现AI能力与产业场景的有机融合。
在推出深度思考模型前,“九天”大模型已囊括多模态、语言、视觉、语音及结构化数据等全系列,覆盖从十亿到万亿参数量全规格。记者获悉,“九天”多模态大模型于近日在MVBench视频理解评测榜单上荣登榜首。