对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一
11月18日消息,对标代推第日前,布新国内人工智能公司月之暗面推出的理模Kimi国产大模型正式发布k0-math。
k0-math是型中Kimi推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,考高考考通过模拟人脑的研全思考和反思过程,大幅提升解决数学难题的对标代推第能力。
据了解,布新在多项数学基准能力测试中,理模k0-math的型中表现能对标OpenAI o1系列可公开使用的两个模型:o1-mini和o1-preview。
根据官方公布的考高考考结果,在中考、研全高考、对标代推第考研以及包含入门竞赛题的布新MATH等4个数学基准测试中,k0-math初代模型成绩超过o1-mini和o1-preview模型,理模拿下第一。
在业界最常使用的数学能力基准测试MATH 中,k0-math模型得分93.8,超过 o1-mini的90分和o1-preview的85.5分。
官方表示,k0-math这一成绩仅次于暂未开放使用的o1完全版94.8分。
据介绍,常规模型的设定目标是尽快提供问题的答案,但k0-math不同,k0-math模型在做题过程中会花更长的时间来推理,包括思考和规划思路,并且在必要时自行反思改进解题思路,提升答题的成功率。
不过,月之暗面坦言,k0-math虽然擅长解答大部分很有难度的数学题,但是当前版本还无法解答LaTeX格式难以描述的几何图形类问题。
另外,k0-math还有一些局限性需要突破,包括对于过于简单的数学问题,例如1+1等于几,k0-math模型可能会过度思考,对于高考难题和IMO题目依然有一定概率做错、猜答案。
月之暗面表示,这些局限性既是机遇,也是挑战,预计将在下一阶段的模型迭代中逐步得到改善。
(责任编辑:知识)
-
中国上市公司协会会长宋志平在媒体采访中对价格战问题发表了看法。他认为,全球制造业历史上都经历了恶性竞争和内卷,但企业竞争理念逐渐成熟。然而,当前的竞争理念出现了问题,表现在集成商对供应商的低价中标和同 ...[详细]
-
外线很准!爱德华兹上半场9中5得到16分3板1助1断 三分6中4
11月5日讯 NBA常规赛,森林狼上半场以57-45领先黄蜂。上半场比赛,爱德华兹出战17分钟,投篮9中5,三分6中4,罚球3中2,得到16分3篮板1助攻1抢断。 ...[详细] -
[流言板]普里查德:我没练过超远三分,这种球能改变势头,球迷也爱
[流言板]普里查德:我没练过超远三分,这种球能改变势头,球迷也爱由篮球资讯发表在篮球资讯 50210月25日讯 凯尔特人以122-102击败奇才,取得两连胜。赛后,凯尔特人球员佩顿-普里查德接受媒体采 ...[详细] -
11月5日消息,根据中国汽车流通协会和精真估联合发布的《2024年10月中国汽车保值率研究报告》,目前各级别车型的保值率存在显著差异。其中,MPV车型因高端化趋势在二手车市场保值率领先。SUV的保值率 ...[详细]
-
[流言板]一人顶一队!约基奇全场砍下56分,其余队友合计得到57分
[流言板]一人顶一队!约基奇全场砍下56分,其余队友合计得到57分由篮球资讯发表在篮球资讯 50212月08日讯 今日NBA常规赛掘金对阵奇才的比赛已经结束。全场比赛,奇才122-113战胜掘金。约基 ...[详细] -
10月28日讯《太阳报》特邀裁判专家、前英超裁判马克-哈尔西今日在其专栏中表示,曼联的点球很不合理。昨晚,曼联在英超联赛中1-2不敌西汉姆,比赛最后阶段,VAR判给了西汉姆一个点球,导致曼联落败。哈尔 ...[详细]
-
加入爱奇艺体育 点击蓝字关注我们北京时间10月24日凌晨,欧冠第3轮剩余9场比赛完赛,马竞主场1-3不敌里尔;巴萨4-1完胜拜仁;利物浦客场1-0险胜莱比锡;曼城主场5球大胜布拉格斯巴达;国米客场1- ...[详细]
-
23.2%!本赛季全联盟出手至少50次的球员中 威少命中率倒数第一
11月3日讯在今天结束的一场常规赛中,掘金以129-103战胜爵士。本场比赛,掘金球星拉塞尔-威斯布鲁克出场31分钟,11投2中,其中三分球4投1中,罚球4罚0中,得到5分3篮板7助攻5抢断。据统计, ...[详细] -
[流言板]马龙谈失利:我们有录像分析会议,会对球员们进行问责
[流言板]马龙谈失利:我们有录像分析会议,会对球员们进行问责由篮球资讯发表在篮球资讯 50212月08日讯 今日NBA常规赛,掘金不敌奇才。赛后,掘金主帅迈克-马龙接受了The Denver Post ...[详细] -
11月5日讯 NBA常规赛,森林狼在主场以114-93击败黄蜂。赛后,森林狼主帅芬奇接受了记者采访。谈到他让迪文岑佐连续打了15分钟,他说道:“好吧,他为锡伯杜效力过。他的油箱里有足够的油。”此役,迪 ...[详细]