DeepSeek:放假是不可能放假的。671B 新模型已上线开发者喜提“五一数学题”!
正当大家纷纷进入“五一”假期模式时,AI 界的 “劳模” DeepSeek 再次证明:放假?不存在的。他们就在这个节骨眼上,悄然向开源社区投喂了一款重量级新模型——DeepSeek-Prover-V2-671B。
模型现已登陆 Hugging Face (链接: ,光看这 6710 亿(671B)的参数量,就足以让不少机器瑟瑟发抖。
这并非一款通用大模型,而是 DeepSeek 专为高难度数学领域,特别是使用 Lean 4 进行形式化定理证明而打造的“专业选手”。
作为 DeepSeek-Prover 系列的第二代产品,大家自然对其能力充满期待。要知道,其前身 V1.5(虽然只有 7B 参数)在去年的高中数学测试 (miniF2F) 中已能达到 63.5% 的成功率,在大学级别测试 (ProofNet) 中也有 25.3% 的准确率。如今参数量暴涨近百倍的 V2,潜力显然不可同日而语,但具体实力如何,还有待验证。
然而,DeepSeek 这次的操作颇有“先把孩子生下来,名字和体检报告稍后补上”的风格。模型权重已经大方开源,但至关重要的 Model Card (模型详细说明书) 和 Benchmark (官方性能成绩单) 却暂时缺席。
这不禁让人猜测,是团队为了赶在假期前“交卷”过于匆忙,还是有意让社区进行一轮“盲测”和探索?
标签: 隐式情感
相关文章
- 详细阅读
- 详细阅读
-
和老妈在荒岛生存安卓版详细阅读
安卓版是一款引人入胜的荒岛角色扮演游戏。在这款游戏中,玩家将扮演一名与母亲意外被困在荒岛上的角色,面对严酷的自然环境和生存挑战,需要运...
2025-08-24 8 隐式情感
-
“学习党的二十大精神”推进全媒体传播体系建设高端论坛·前沿论坛 会议纪实详细阅读
12月18日下午,由西安交通大学新闻与新媒体学院主办,新媒体与社会治理研究中心、西部融媒体研究院、西安交通大学出版社、《西安交通大学学...
2025-08-21 7 隐式情感
-
阿里团队突破多角色动画难题:让静态照片开口说话更自然详细阅读
考虑这样一个场景,在你手机里躺着无数张静态照片,突然有一天它们都能像电影里的魔法画像一样动起来,不仅能眨眼微笑,还能跟着你提供的参考视...
2025-08-21 7 隐式情感
-
推荐你最爱的10部越看越上瘾每部都是情与欲的修罗场详细阅读
韩国电影向来以大胆深刻著称,尤其是艺术片领域,不仅敢于挑战道德边界,更善于挖掘人性的灰色地带。这些电影常常用最日常的情境揭示最复杂的情...
2025-08-11 10 隐式情感
发表评论