首页 > 科普 > 详情

360联合北大震撼发布!5%参数量逼近Deepseek-R1满血性能

2025年2月25日| 浏览:732次| 字体:
分享到: 

       2025年2月24日,由360与北京大学联合研发的中等量级推理模型Tiny-R1-32B-Preview正式亮相,仅以5%参数,逼近Deepseek-R1-671B的性能。

    核心突破:小模型,大能量
▪  数学领域:以78.1分(AIME 2024评测)逼近原版R1模型(79.8分),远超Deepseek-R1-Distill-Llama-70B(70.0分);
▪  综合性能:在编程(LiveCodeBench 61.6分)、科学(GPQA-Diamond 65.0分)领域全面领先最佳开源70B模型Deepseek-R1-Distill-Llama-70B;
▪  效率跃迁:仅需5%参数量,性能达原版R1的95%以上,推理成本大幅降低。  

      技术革新:领域专精+模型融合
      研究团队使用「分治-融合」策略:
▪  基于DeepSeek-R1生成海量领域数据,分别训练数学、编程、科学三大垂直模型;  
▪  通过Arcee团队Mergekit工具智能融合,突破单一模型性能上限,实现多任务均衡优化。  
    开源承诺:推动技术普惠
▪  模型仓库:https://huggingface.co/qihoo360/TinyR1-32B-Preview
▪  即将公开完整技术报告、训练代码及部分数据集;  
▪  践行开源精神,助力AI社区共筑高效推理新生态。  
研发团队表示:「Tiny-R1-32B-Preview是蒸馏技术的里程碑,未来将持续探索更轻量、更强大的通用模型,推动AI技术普惠化进程。」
360 团队: Lin Sun, Guangxiang Zhao, Xiaoqi Jian, Weihong Lin, Yongfu Zhu, Change Jia, Linglin Zhang, Jinzhu Wu, Sai-er Hu, Xiangzheng Zhang
北大团队: Yuhan Wu, Zihan Jiang, Wenrui Liu, Junting Zhou, Bin Cui, Tong Yang


上一篇:“专精特新”!这是硬实力背后的“水”温度

下一篇:信息化赋能车辆管理 数字化提升服务效能

报纸期刊

河南科技报
农家参谋

咨询: 0371-69333566     电话: 136-7336-5366    邮箱: 470363313@qq.com     地址: 河南省郑州市金水区政七街13号2号楼

Copyright 2018-2025 科技新闻网 AII Rights Reserved     科技新闻网版权所有,未经书面授权,不得复制或建立镜像     互联网新闻信息服务许可证《编号: 41120200005》

豫ICP备06011472号-3     网站版本号: v2.2 更新日志     技术支持:全息数字科技