网站地图官方微信:
网站首页 东辽县 五站镇 大云镇 筠连镇 青岩镇 风山乡

当前位置: 首页 >

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。

这是第五题的原题,正确答案是A. - 1/2。

这是之前的第三方的测试结果,6个模型…。

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

  • | 1.5万字光刻机超详解:半导体产业中的珠穆朗玛_芯片_晶体管_硅片 |

    尽管同期尼康基于F2光源(157nm)和干式微影技术的90nm产品和电子束投射(EPL)产品样机研制成功,但相对于尼康的全新研发,ASML的产品属于改进型成熟产品,在为半导体芯片厂商节约大量成本的同时实现工艺…...

    查看详情>>
  • | 中美太空竞赛加速:中国航天追赶势头迅猛,美国担忧五年内被超越_发射_星链_航天界 |

  • | 腾讯出手养虾,大厂AI装不下去了_OpenClaw_用户_部署 |

  • | 芯片暴涨之际,三星电子工会决定罢工_人工智能_半导体_斗争 |

  • | 豆包喧嚣,抖音沉默_App_字节_红包 |

  • | AI到岗我下岗:牛马贬值,血洗中层,应届生成了AI助手_公司_工作_剪辑 |

  • | 第一个手机龙虾来了?_OpenClaw_miclaw_模型 |

  • | 营收狂飙巨亏129亿,千亿AI巨头遇“冰火两重天”_MiniMax_公司_亏损 |

  • | 独家|字节叫停豆包 AI 眼镜,大厂 AI 硬件进入祛魅时刻_项目_Meta_入口 |

  • | AWE|那些念念不忘的心愿,都有了回响_海尔家_产品_售后服务 |

  • | 广告垮了、AI救了?李彦宏和百度的“破与立”_搜索_用户_传统 |

  • 家电巨头集体“换挡”,72岁的董明珠越来越低调了?_格力电器_企业_言论...

    2026-02-27
  • iPhoneAir骤降2000元已与iPhone17同价,有消费者投诉刚买不久就遭背刺_用户_差价_购机...

    2026-03-03
  • 对比真正「全能」,连微信收藏都能帮忙找的豆包手机助手(至少在被抵制之前),Gemini 目前的能力还相当局限,聚焦在打车、外卖、杂货这些日常场景,虽说底层技术能力更强,但用户的实机使用效果,跟鸿蒙的小艺、荣…...

    2026-02-27
  • 2025年12月22日,智元机器人与飞阔科技等具身智能企业联合推出“擎天租”开放式租赁平台,***用“共享租赁+平台化调度”模式,让用户可以根据不同使用场景,预定不同品牌的机器人,力图让机器人租赁像“共享充电宝…...

    2026-02-26

关注我们

添加微信好友,关注最新动态