重磅更新!DeepSeek V3低调发布,超越Claude,编程能力提升明显
DeepSeek突然低调发布V3版本,并且已经上线官方网站,开源权重已经上传到HuggingFace,但还没有官方描述。多方测评显示,性能相较V2.5版本有巨大提升,编程领域甚至超越Claude。
地址:
唯一知道的是这是一个超大杯,参数高达685B,采用MoE架构,包含256个专家,每次选取TopK 8专家。
多方测评显示效果卓群。在LiveBench测评中显示DeepSeek V3是最棒的开源LLM,在非推理模型中仅次于gemini-exp-1206,排名第二。
在aider多语言编程测评中超过Claude 3.5 sonnet,仅次于OpenAI o1,相较于V2.5从17.8%完成率爆增到48.4%。
发布者:admin,转转请注明出处:http://www.yc00.com/web/1748221567a4750042.html
评论列表(0条)