DeepSeek,新消息
3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。据悉,其开源版本模型体积为6850亿参数。
同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验,API接口和使用方式保持不变。

从网友反馈的实测效果来看,V3编码能力已经接近 Claude3.7,数学能力也有提升,能像推理模型一样解题。
此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。

其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。
2025年2月25日,市场上也曾出现DeepSeek-R2模型的发布时间或将提前的消息。路透社称,DeepSeek正在加快推出DeepSeek-R1模型的后续产品DeepSeek-R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。
综合/上海证券报、第一财经微信
来源: 经济日报
相关文章
- 05-03 瓷砖为什么渗酱油(瓷砖地板上黑黑缝隙难去除?)
- 05-03 美法官裁定:特朗普援引战时法律驱逐黑帮“违法”
- 05-02 “五一”昆明旅游新亮点,一顿饭读懂一座城
- 05-02 38.8℃!马上大反转!9级大风+中雨大雨+雷电来了
- 05-02 合肥警方通告:这些道路将采取临时性交通管制
- 05-02 前传万古噬剑体续集:全文+番外独孤博:结局+番外新上热文
- 05-02 电子书+番外篇章+(苏冰顾泽仪)免费版在线阅读
- 05-02 全文免费简惜月陆言泽_简惜月陆言泽全文免费
- 05-02 “五一”国际劳动节 | 致敬每一位伟大的劳动者!
- 05-02 连续20多年节日在岗,科普教师点亮学生科学梦想
热门文章
最新文章
- 03-25 周一滇西南西北多雨,注意防范地质灾害
- 03-26 大成元鸿锦利债券提前结束募集
- 03-25 十四届县委第六轮巡察县属国有企业集中反馈会召开
- 03-26 工业硅:价格波动,供需失衡 1.63%涨
- 03-25 界首通用机场通过验收
- 03-26 京东服饰美妆春季上新发起“绿色时尚计划”,联合品牌推动旧衣循环处理
- 03-25 始终将保护放在第一位(快评)
- 03-26 A股三大指数午后集体翻红
- 03-25 贵阳东部最快出城通道 贵黄高速延伸段通车!
- 03-26 春色有约 浪漫花海