WWW.AIZHUSHOU.SHOP
标签聚合 离谱

/tag/离谱

LinuxDo 最新话题 · 2026-05-24 01:48:28+08:00 · tech

看到过太多人把这个榜单奉为圭臬,说下我的看法,理性交流。 1. 只有60道题目的逻辑测试 相比较humanity’s last exam(HLE)等前沿benchmark,差距巨大。 2. 极度反常的think参数差异 同样的grok4.20,开启think前后是8.94 vs 63.98,一个说胡话的倒数第一模型,开启think模式后立刻暴涨, gemini3-flash 前后是32 vs 68。 3. 测能力变成了“掷硬币”——离谱的得分方差 总共就 60 道题的盘子,模型答题居然能出现 30% 到 40% 的巨大震荡!这说明模型做这套题的表现, 等同于抛硬币闭眼瞎蒙 。稍微运气好蒙对几题,或者运气差错几题,分数就会产生剧烈跳水。 4. 有两个mimo-v2.5 可能是没有正确标注 think模式,mimo默认开启thinking参数 5. 极度反常的mimo得分 真的稍微用过mimov2.5pro和qwen3.6-27B本地版的,都不会觉得这俩模型是一个逻辑水平。在humanity’s last exam(HLE)榜单上,gemma4-31B 和qwen3.6-27B的得分如下 6. 前排模型没有拉开差距 在复杂的数学逻辑题目上,gemini,gpt,claude相对于国产模型都有巨大优势,但是主打 逻辑 的榜单看不出这种差距。 7.思考时间和输出token长度 排名靠后的模型普遍输出token少,思考时间短,对于逻辑题目来说,目前的大模型会普遍产生很长的思维链,这个榜单的数据非常异常。这里给一个例子各位参考下 在离营地100公里的沙漠中有一个宝贝,中间无人烟,开汽车去取。汽车每公里要消耗1升的油,汽车最多可以装100升的油。怎样才能把宝贝取回来? 如何数学建模找到最优解 其他的小问题还有,gemma4 31b的速度非常慢,很奇怪。 总结 虽然主流benchmark会被llm过拟合刷分,但是参考性还是比这种图一乐的榜单强。 3 个帖子 - 2 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-23 22:30:30+08:00 · tech

今天参加了软考系统架构师的考试,感觉今年选择和案例分析还怪偏的。物联网那方面的真的不知道啊。论文稍微好一点,高并发至少还有话说。 晚上刷刷帖子,发现有人说软考 泄题 。然后就去看,真的,题目一模一样,太离谱了!!! 下面是一个发在微博的帖子,最早泄题的貌似是一个公众号,题灯教育。现在公众号已经删了部分的推文,但是其他的已经被截下来了。我这里转几张。 离大谱啊! 5 个帖子 - 5 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-22 15:44:38+08:00 · tech

我写了一个简单的后端,啥也没干就直接丢给反重力 3.5,然后他库库给我干了几千行,然后又给我删了几千行,之后又写了几千行…… 先别管质量和效率,你就说十多分钟内写这么多代码快不快吧.jpg 而且感觉3x3之后额度多了不少,我用半个小时的flash high竟然额度没怎么掉(刚刚看了掉了20%),换以前问一个hi就得掉20%了 6 个帖子 - 6 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-21 16:27:49+08:00 · tech

最近遇到一个很离谱的社交软件事故,写出来给大家当个人类样本观察。 事情大概是这样: 我在社交软件上认识了一个男生,外企工程师,简介写得很认真,工作稳定,会做饭,不抽烟不喝酒,说自己为人热情但是情感压抑。最关键的是,他明确说要找个女朋友,灵魂共鸣拥抱太阳什么的,后来我们加了微信。 我们很快就高频互动了起来。我们整体聊天,连麦听网易云,他给我分享电影,会因为我说“以后一起看”而特别特别高兴,因为有以后。还会说“我怕我太 push 到你”“第一次见面就去你家看猫,对你不太尊重,我们可以先在外面玩”。 当时我确实觉得:这个人还挺有边界感。现在回头看,只能说:小边界做得像个人,大边界直接归零。 后来他跟我讲过一段“前女友故事”。大意是他之前被一个做幼师的女生断崖式分手,自己都不知道算正式男友还是小三,前几天那个女生又回来找他,让他失眠了一晚上。他讲得很细,很受害者,很纯爱,很容易让人觉得他是一个伤害的真诚的人。 然后离谱的来了。我们白天约好了这周末去攀岩。晚上突然,他女朋友发现了我们的聊天记录,直接接管了他的微信告诉我:他其实有女朋友,而且要结婚了。 我:? 更离谱的是,他本人从头到尾没有跟我说一句对不起。 前一天还在“特别特别高兴”“以后会更开心”“你特别特别好看,你走过来的时候我特别心动”,后一天就直接消失,由女朋友负责处理事故现场。 后来我又从另一个和他聊过的女生那里听到一个不同版本的故事:他所谓“断崖式分手”的对象,可能不是他讲给我的那个纯爱前女友版本,而是一个炮友版本。他很喜欢那个女生,但对方并不只和他一个人发生关系,do过几次之后就对他冷淡了,他很受伤。 这时候我才意识到:也许他是用一个故事搞了不同的版本。 对我讲的是纯爱受害者版; 对别人讲的是炮友受挫版; 对女朋友甚至都没有讲过前女友的事; 对小红书/社交平台是努力生活的外企工程师版。 我最开始破防的点不是“他有女朋友”,而是他明明表现得像我的舔狗,给一点回应就“谢谢你”“特别高兴”;翻车之后,我突然变成了需要被删除、被清理、被处理掉的痕迹。 这就很恶心。 在521这天发出感慨:成年人交友真的太需要日志审计了。 43 个帖子 - 31 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-21 11:00:10+08:00 · tech

坐标:苏州 平台沟通 我在某招聘平台(怕对L站不利,就不说哪个具体平台了哈),投了一个python的后端开发,我把在线简历发了,对方一天之后给我回了个 感谢你的关注,很遗憾岗位与你不是很匹配,祝早日找到心仪的工作 我就想着,算了,又被拒一次,继续投别的吧,结果,10分钟后,对方又问我要了附件简历,我就发给他了,后面我们就加了微信 当时我还想着,虽然我简历不算出彩,但是加了微信,聊完之后,基本上对我的技术有一定的了解,应该还是机会比较大的 电话沟通 对方问我要了手机号,跟我打了个电话 对方问了我一些基本情况,然后 问了我期望薪资 对方问了我一些工作经验,然后 又问了我期望薪资 对方问了我一些项目经历,然后 又又问了我期望薪资 对方问我还有没有别的问题,我就问了社保、福利相关的问题,然后 又又又问了我期望薪资 (刚开始没想到写成这种形式,写完之后回头一看,感觉这么写好笑程度+100) 第一次电话结束,我转头就跟我爸妈吐槽这也太离谱了,结果,对方又来了个电话 我就说,咱们是不是刚刚通过电话了?对方说,哦,是哦,然后 又又又又问了我期望薪资 重点是, 从头到尾,我给他的期望薪资都没变过,而且在他们的薪资范围内 面试 第一通电话,我们就约了两天后的上午的线下面试,对方也没说是什么时候,我就问了上班时间,对方说 8点 ,我就想着,那我到时候 8:30 、 9:00 左右的时候去吧 面试当天 7:45 左右,对方给我打了个电话,说要不面试改到线上吧,面试时间约在了 11:30 ,我想那正好,不用我跑一趟了 11:20 ,我收拾好地方,放好电脑,测试好了摄像头和麦克风,坐在桌子前面等面试了 11:30 ,我看了对方微信、招聘平台,都没有给我发会议号,我就想着,是不是有点什么事情要处理,那就稍微等一下吧 11:35 ,我给对方发了个消息,内容是 您好,请问面试还没有开始嘛 ,对方没有回复 11:40 ,我给对方打了电话,未接通 至此,这个hr就和人间蒸发了一样,再也没有了消息 后续 要是完全消失了还好,但是我还没有删除对方的微信,就经常能看到对方在视频号又点赞了视频 听说过烂尾楼,第一次经历烂尾面试 22 个帖子 - 13 位参与者 阅读完整话题