五一节DeepSeek仍在“奋战”
正当大家都沉浸在“五一”假期的欢乐中时,AI领域的“勤劳者”DeepSeek又有大动作啦!它在这个时候向开源社区推出了一款超厉害的新模型——DeepSeek-Prover-V2-671B。模型参数惊人
这个模型已经在Hugging Face上可以找到啦。光看那6710亿的参数量,就能知道它有多强大,估计不少机器都得“惊叹”。专为数学领域打造
它可不是普通的大模型哦,是DeepSeek专门为高难度数学领域,特别是用Lean 4进行形式化定理证明设计的。前身成绩不错,V2潜力待察
作为第二代产品,大家对它期望很高。它的前身V1.5虽然参数少,但在测试中也有不错的表现。现在V2参数量大幅增加,潜力肯定更大,但具体实力还得进一步验证。模型说明缺失引猜测
不过呢,DeepSeek这次有点特别,模型权重开源了,可重要的模型详细说明书和官方性能成绩单却没跟上。这让人不禁猜测,是团队太急还是想让社区先探索探索呢?劳动节还得继续忙
反正啊,劳动节看来是没法轻松度过啦,还得继续在相关领域钻研咯。转载请注明来自天津资讯网,本文标题:《震惊!DeepSeek在五一假期竟上线671B新模型,开发者要面对啥难题?》
还没有评论,来说两句吧...