site:www.geekpark.net

资讯

22 分钟

DeepSeek 发布 Prover-V2 模型；小米首个推理大模型开源；饿了么宣布超 ...

据悉，DeepSeek-Prover-V2-671B 使用了更高效的 safetensors 文件格式，并支持多种计算精度，方便模型更快、更省资源地训练和部署，参数达 6710 亿，或为去年发布的 Prover-V1.5 ...

9 小时

Qwen3 在推理、指令遵循、工具调用、多语言能力等方面均大幅增强，创下所有国产模型及全球开源模型的性能新高：在奥数水平的 AIME25 测评中，Qwen3 斩获 81.5 分，刷新开源纪录；在考察代码能力的 LiveCodeBench 评测中，Qwen3 突破 70 分大关，表现甚至超过 Grok3；在评估模型人类偏好对齐的 ArenaHard 测评中，Qwen3 以 95.6 分超越 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

资讯

今日热点