之前没有来L站之前充了个BAI想着先用着,用了几下4.7就看那个余额蹭蹭的掉,但当时没感觉啥。今天想起来算了一下真吓一跳,不多废话上图。 100块钱1M token完了之后还有一大部分是限时的马上还要过期,只能感叹一下孙割这脑子咋这么好使呢 3 个帖子 - 3 位参与者 阅读完整话题
看到过太多人把这个榜单奉为圭臬,说下我的看法,理性交流。 1. 只有60道题目的逻辑测试 相比较humanity’s last exam(HLE)等前沿benchmark,差距巨大。 2. 极度反常的think参数差异 同样的grok4.20,开启think前后是8.94 vs 63.98,一个说胡话的倒数第一模型,开启think模式后立刻暴涨, gemini3-flash 前后是32 vs 68。 3. 测能力变成了“掷硬币”——离谱的得分方差 总共就 60 道题的盘子,模型答题居然能出现 30% 到 40% 的巨大震荡!这说明模型做这套题的表现, 等同于抛硬币闭眼瞎蒙 。稍微运气好蒙对几题,或者运气差错几题,分数就会产生剧烈跳水。 4. 有两个mimo-v2.5 可能是没有正确标注 think模式,mimo默认开启thinking参数 5. 极度反常的mimo得分 真的稍微用过mimov2.5pro和qwen3.6-27B本地版的,都不会觉得这俩模型是一个逻辑水平。在humanity’s last exam(HLE)榜单上,gemma4-31B 和qwen3.6-27B的得分如下 6. 前排模型没有拉开差距 在复杂的数学逻辑题目上,gemini,gpt,claude相对于国产模型都有巨大优势,但是主打 逻辑 的榜单看不出这种差距。 7.思考时间和输出token长度 排名靠后的模型普遍输出token少,思考时间短,对于逻辑题目来说,目前的大模型会普遍产生很长的思维链,这个榜单的数据非常异常。这里给一个例子各位参考下 在离营地100公里的沙漠中有一个宝贝,中间无人烟,开汽车去取。汽车每公里要消耗1升的油,汽车最多可以装100升的油。怎样才能把宝贝取回来? 如何数学建模找到最优解 其他的小问题还有,gemma4 31b的速度非常慢,很奇怪。 总结 虽然主流benchmark会被llm过拟合刷分,但是参考性还是比这种图一乐的榜单强。 3 个帖子 - 2 位参与者 阅读完整话题
如图所示,今天恢复三次之后第四次就变成128个小时了,这也太离谱,重点是每次重置额度根部不够用,一代天才程序员陨落! 7 个帖子 - 2 位参与者 阅读完整话题
今天参加了软考系统架构师的考试,感觉今年选择和案例分析还怪偏的。物联网那方面的真的不知道啊。论文稍微好一点,高并发至少还有话说。 晚上刷刷帖子,发现有人说软考 泄题 。然后就去看,真的,题目一模一样,太离谱了!!! 下面是一个发在微博的帖子,最早泄题的貌似是一个公众号,题灯教育。现在公众号已经删了部分的推文,但是其他的已经被截下来了。我这里转几张。 离大谱啊! 5 个帖子 - 5 位参与者 阅读完整话题
用cpa接了codex pro和 plus,跑了几个生图,平均3分钟,这速度太离谱了,有么有快速模式? 6 个帖子 - 5 位参与者 阅读完整话题
一个 example.com 能耗半小时,都快降到 Gemini 水平了 开了两个 Pro 20x 账号,以为能爽用的,结果半个月就不行了 关闭续费了 真写代码还是只能 Claude
一个 example.com 能耗半小时,都快降到 Gemini 水平了 开了两个 Pro 20x 账号,以为能爽用的,结果半个月就不行了 关闭续费了 真写代码还是只能 Claude
一个 example.com 能耗半小时,都快降到 Gemini 水平了 开了两个 Pro 20x 账号,以为能爽用的,结果半个月就不行了 关闭续费了 真写代码还是只能 Claude
一个 example.com 能耗半小时,都快降到 Gemini 水平了 开了两个 Pro 20x 账号,以为能爽用的,结果半个月就不行了 关闭续费了 真写代码还是只能 Claude
太离谱了吧,还没注册成功就封号了 注册需要手机号,就去站内找推荐的接码平台并充值,正打算注册,结果还没接码呢已经封了 20 个帖子 - 14 位参与者 阅读完整话题
一个 example.com 能耗半小时,都快降到 Gemini 水平了 开了两个 Pro 20x 账号,以为能爽用的,结果半个月就不行了 关闭续费了 真写代码还是只能 Claude
如图:占用,感觉有点太离谱了 !!! 重启一下就正常了,现在就是感觉电脑动画卡卡的,鼠标操作也很卡 ! 每次重启之后能流畅个3天,然后就会开始慢慢变卡,直到特别卡 ! 电脑环境:外接了二个显示屏,一个鼠标,一个键盘 下面是具体配置 , 求佬友解决方案 33 个帖子 - 12 位参与者 阅读完整话题
一个 example.com 能耗半小时,都快降到 Gemini 水平了 开了两个 Pro 20x 账号,以为能爽用的,结果半个月就不行了 关闭续费了 真写代码还是只能 Claude
一个算法题的例子没看明白,问了gpt,我还以为我问的是豆包呢! 3 个帖子 - 2 位参与者 阅读完整话题
codex每天下午3点后准时拉闸,速度慢的离谱,而且降智,有啥办法吗,各位佬们 15 个帖子 - 9 位参与者 阅读完整话题
我写了一个简单的后端,啥也没干就直接丢给反重力 3.5,然后他库库给我干了几千行,然后又给我删了几千行,之后又写了几千行…… 先别管质量和效率,你就说十多分钟内写这么多代码快不快吧.jpg 而且感觉3x3之后额度多了不少,我用半个小时的flash high竟然额度没怎么掉(刚刚看了掉了20%),换以前问一个hi就得掉20%了 6 个帖子 - 6 位参与者 阅读完整话题
1 个帖子 - 1 位参与者 阅读完整话题
这个看似给了你选择,实际上都是600淘金币,莫得任何意义 4 个帖子 - 3 位参与者 阅读完整话题
最近遇到一个很离谱的社交软件事故,写出来给大家当个人类样本观察。 事情大概是这样: 我在社交软件上认识了一个男生,外企工程师,简介写得很认真,工作稳定,会做饭,不抽烟不喝酒,说自己为人热情但是情感压抑。最关键的是,他明确说要找个女朋友,灵魂共鸣拥抱太阳什么的,后来我们加了微信。 我们很快就高频互动了起来。我们整体聊天,连麦听网易云,他给我分享电影,会因为我说“以后一起看”而特别特别高兴,因为有以后。还会说“我怕我太 push 到你”“第一次见面就去你家看猫,对你不太尊重,我们可以先在外面玩”。 当时我确实觉得:这个人还挺有边界感。现在回头看,只能说:小边界做得像个人,大边界直接归零。 后来他跟我讲过一段“前女友故事”。大意是他之前被一个做幼师的女生断崖式分手,自己都不知道算正式男友还是小三,前几天那个女生又回来找他,让他失眠了一晚上。他讲得很细,很受害者,很纯爱,很容易让人觉得他是一个伤害的真诚的人。 然后离谱的来了。我们白天约好了这周末去攀岩。晚上突然,他女朋友发现了我们的聊天记录,直接接管了他的微信告诉我:他其实有女朋友,而且要结婚了。 我:? 更离谱的是,他本人从头到尾没有跟我说一句对不起。 前一天还在“特别特别高兴”“以后会更开心”“你特别特别好看,你走过来的时候我特别心动”,后一天就直接消失,由女朋友负责处理事故现场。 后来我又从另一个和他聊过的女生那里听到一个不同版本的故事:他所谓“断崖式分手”的对象,可能不是他讲给我的那个纯爱前女友版本,而是一个炮友版本。他很喜欢那个女生,但对方并不只和他一个人发生关系,do过几次之后就对他冷淡了,他很受伤。 这时候我才意识到:也许他是用一个故事搞了不同的版本。 对我讲的是纯爱受害者版; 对别人讲的是炮友受挫版; 对女朋友甚至都没有讲过前女友的事; 对小红书/社交平台是努力生活的外企工程师版。 我最开始破防的点不是“他有女朋友”,而是他明明表现得像我的舔狗,给一点回应就“谢谢你”“特别高兴”;翻车之后,我突然变成了需要被删除、被清理、被处理掉的痕迹。 这就很恶心。 在521这天发出感慨:成年人交友真的太需要日志审计了。 43 个帖子 - 31 位参与者 阅读完整话题
坐标:苏州 平台沟通 我在某招聘平台(怕对L站不利,就不说哪个具体平台了哈),投了一个python的后端开发,我把在线简历发了,对方一天之后给我回了个 感谢你的关注,很遗憾岗位与你不是很匹配,祝早日找到心仪的工作 我就想着,算了,又被拒一次,继续投别的吧,结果,10分钟后,对方又问我要了附件简历,我就发给他了,后面我们就加了微信 当时我还想着,虽然我简历不算出彩,但是加了微信,聊完之后,基本上对我的技术有一定的了解,应该还是机会比较大的 电话沟通 对方问我要了手机号,跟我打了个电话 对方问了我一些基本情况,然后 问了我期望薪资 对方问了我一些工作经验,然后 又问了我期望薪资 对方问了我一些项目经历,然后 又又问了我期望薪资 对方问我还有没有别的问题,我就问了社保、福利相关的问题,然后 又又又问了我期望薪资 (刚开始没想到写成这种形式,写完之后回头一看,感觉这么写好笑程度+100) 第一次电话结束,我转头就跟我爸妈吐槽这也太离谱了,结果,对方又来了个电话 我就说,咱们是不是刚刚通过电话了?对方说,哦,是哦,然后 又又又又问了我期望薪资 重点是, 从头到尾,我给他的期望薪资都没变过,而且在他们的薪资范围内 面试 第一通电话,我们就约了两天后的上午的线下面试,对方也没说是什么时候,我就问了上班时间,对方说 8点 ,我就想着,那我到时候 8:30 、 9:00 左右的时候去吧 面试当天 7:45 左右,对方给我打了个电话,说要不面试改到线上吧,面试时间约在了 11:30 ,我想那正好,不用我跑一趟了 11:20 ,我收拾好地方,放好电脑,测试好了摄像头和麦克风,坐在桌子前面等面试了 11:30 ,我看了对方微信、招聘平台,都没有给我发会议号,我就想着,是不是有点什么事情要处理,那就稍微等一下吧 11:35 ,我给对方发了个消息,内容是 您好,请问面试还没有开始嘛 ,对方没有回复 11:40 ,我给对方打了电话,未接通 至此,这个hr就和人间蒸发了一样,再也没有了消息 后续 要是完全消失了还好,但是我还没有删除对方的微信,就经常能看到对方在视频号又点赞了视频 听说过烂尾楼,第一次经历烂尾面试 22 个帖子 - 13 位参与者 阅读完整话题