• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

360智脑Tiny-R1-32B:小模型,大能量,逼近Deepseek-R1性能

360智脑Tiny-R1-32B:小模型,大能量,逼近Deepseek-R1性能
元元
2025-02-26 10:53:10

360智脑Tiny-R1-32B模型发布:小参数,高性能

2月24日,由360智脑团队与北京大学联合打造的中等规模推理模型 Tiny-R1-32B-Preview 震撼发布。这款模型凭借仅占 Deepseek-R1-671B 5% 的参数量,成功实现了对其满血性能的逼近,充分展现了小模型在高效推理领域的巨大潜力。

Tiny-R1-32B:关键领域表现突出

Tiny-R1-32B-Preview 在多个关键领域都表现出了非凡的实力。尤其在数学方面,其在 AIME2024 评测中取得了 78.1 分的佳绩,与原版 R1 模型的 79.8 分几乎不相上下,并大幅领先 Deepseek-R1-Distill-Llama-70B 的 70.0 分。 在编程和科学领域,该模型分别在 LiveCodeBench 和 GPQA-Diamond 测试中获得了 61.6 分和 65.0 分,全面超越了当前开源的70B模型 Deepseek-R1-Distill-Llama-70B。这一成果不仅证明了 Tiny-R1-32B-Preview 在性能上的卓越表现,更重要的是,它通过大幅降低参数量,实现了推理成本的显著降低,带来了效率上的飞跃。

360智脑性能测试

“分治-融合”策略:性能突破的关键

这一突破性的成果背后,离不开“分治-融合”这一核心技术的支撑。研究团队首先基于 DeepSeek-R1 生成了海量的领域数据,并分别训练了数学、编程、科学这三大垂直领域的专业模型。紧接着,他们利用 Arcee 团队的 Mergekit 工具进行巧妙的智能融合,从而突破了单一模型的性能瓶颈,实现了多任务的均衡优化。 这种创新的技术路径不仅有效提升了模型的性能,也为未来推理模型的发展方向提供了新的借鉴。

开源共享,推动技术普惠

360智脑团队和北京大学的联合研发团队强调,Tiny-R1-32B-Preview 的成功离不开开源社区的鼎力支持。 该模型得益于 DeepSeek-R1 蒸馏、DeepSeek-R1-Distill-32B 增量训练以及模型融合等先进技术。

为了促进技术的普及和应用,研发团队承诺将全面公开模型仓库,其中包括技术报告、训练代码以及部分数据集。 模型仓库已上线 Hugging Face 平台,方便大家学习使用。

360智脑AI工具地址:【点击登陆】

Hugging Face 平台地址:https://huggingface.co/qihoo360/TinyR1-32B-Preview。

更多AI行业最新资讯新闻信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html

0
0
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关资讯
  • MiniMax Speech 2.5上线:多语种语音生成迎来“天花板”级突破

  • 手机也能跑GPT-4V!面壁智能MiniCPM-V4.0开源,性能碾压一众对手!

  • Higgsfield AI消散特效制作完整教程:一键打造电影级Disintegration视觉效果

  • 360发力AI智能体高阶应用,周鸿祎提出L1 - L5分级模型

  • 秘塔AI重磅升级!搜索API正式上线,3分钱替代微软Bing API

热点资讯

Higgsfield AI消散特效制作完整教程:一键打造电影级Disintegration视觉效果

8天前
Higgsfield AI消散特效制作完整教程:一键打造电影级Disintegration视觉效果

测试文章

7天前
测试文章

FlowSpeech:全球首个“书面语变口语”的TTS,让AI语音更懂人情味

7天前
FlowSpeech:全球首个“书面语变口语”的TTS,让AI语音更懂人情味

测试文章显示1111111

7天前
测试文章显示1111111

每日AI资讯-2025年08月07日

7天前
每日AI资讯-2025年08月07日
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有