AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@ ...
2月6日,据外媒报道,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的费用,使用了16张英伟达H100 GPU,耗时26分钟就完成了训练,成功“打造”出了一个名为s1-32B的人工智能推理模型。
每经记者:宋欣悦 每经编辑:兰素英2月6日,据外媒报道,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的费用,使用了16张英伟达H100 ...
2025 年 2 月,斯坦福大学和华盛顿大学的研究人员宣布,他们成功训练出了一个名为 s1 的人工智能推理模型。据报道,该模型的训练成本极低,仅需不到 50 美元的云计算费用,且仅用了 16 个英伟达 H100 GPU 进行了 26 分钟的训练,就让该模型在数学和编码能力测试中的表现能够与OpenAI的o1和DeepSeek的R1等尖端推理模型相媲美。
证券之星消息,近日欧陆通(300870)新注册了2个项目的软件著作权,包括《欧陆通基于C#的TestDataAnalysis软件V1.0》、《欧陆通基于C#的CE传导自动测试软件V1.0》等。今年以来欧陆通新注册软件著作权2个。结合公司2024年中报 ...
你是否知道《山海情》里的西海固?经过一代代人的耕耘,这里早已不再是“最不适宜人类生存的地区”,但依然地处偏远,相对落后。一个说着英语的青年,从省会回到这里。他在村里东奔西走,声称要做“一件大事”。村民们不解:“马亮,你到底要做多大的事?” ...
新一代 Kaldi 团队是由 Kaldi 之父、IEEE fellow、小米集团首席语音科学家 Daniel Povey ...
图片来源:UnsplashZ Highlights在LoRA中,每一个专家都会被训练;而ESFT会优先微调适合做某个任务的专家,其他专家不会被过拟合,因此相比LoRA会有更强的泛化能力——让专业的人做专业的事。林纳斯说过,Talk is cheap, ...
Modern life makes us tired, right? But research from societies in Africa and South America suggests people in the ancient ...
媒体/自媒体的宣传出现了「一丢丢偏差」,我先结合论文简要说几点最关键的看法帮大家省流,然后还原一下这篇 AI 论文是如何在信息传递的过程中逐渐「被标题党」的。大家可以按需阅读。 下面的讨论主要基于最广为流传且被很多官媒转发的信息: ...
4 小时
来自MSN反应力不够?三步学会科学架枪,手残党也能锁头杀!【本文由小黑盒作者@duruo于02月08日发布,未经许可不得转载!】 瓦友们元宵快乐! 你是否有以下的经历: 👉当敌人闪出掩体的瞬间,你总慢半拍开枪? 👉架枪时总被反杀,怀疑自己「天生手残」? 本期聊一个与天赋反应力相关的话题,如何架枪?
近期,国产AI大模型DeepSeek横空出世,仅以几十分之一的成本,就达到与全球领先的ChatGPT最新o1版本推理模型相当的实力。目前,DeepSeek下载量持续攀升,据研究公司SimilarWeb估计,在短短一周内,DeepSeek网站的用户数量就超过了谷歌的Gemini聊天AI,而后者已经存在了近两年。一时间,各界众说纷纭:DeepSeek为什么这么牛?何以如此?是创新还是蒸馏?……诸如此类 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果