WWW.AIZHUSHOU.SHOP
标签聚合 为什么

/tag/为什么

LinuxDo 最新话题 · 2026-05-23 23:05:49+08:00 · tech

严肃的来说,我一直很好奇美国方面的Ai公司因政治要素对亚太地区部分国家实施特别关照已经有点装备竞赛的味道了。 在我看来在这一点上OpenAi似乎还秉持着“让Ai造福全人类”的企业精神而对中国大陆有刻意放松的感觉。 在这一点上我似乎不太理解,无论是在闲鱼还是贴吧、微博、小黑盒、(B站目前没禁)都成为敏感词,都属于违规信息。我觉得没理由设立相关敏感词吧,这背后到底有什么深意吗? 中国有句古话:看清敌人的实力,才能认清敌我的差距,才能真正百战不殆。还有官方下场为token和ai翻译成中文造词。有种悄悄咪咪被蒙蔽双眼的感觉。 本话题只是无意义的牢骚,没有任何观点和引导,没有标准答案 23 个帖子 - 20 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-23 16:41:17+08:00 · tech

为了防止跑题: 本帖说的不是要不要测3js,而是说用3js去评估前端能力是否合理。本帖也不是否定3D前端价值,而是对评测指标的代表性有疑惑。 看到微博,b站一些up测所谓的模型前端能力,结果测试的是3js/Phaser之类的,感觉有点怪怪的,他们的评测呈现的前端能力与主流业务场景似乎存在明显错位? 要测模型的前端不应该侧重的是对html/js/css/react/vue等常用概念/类库/框架的掌握程度,组件抽象,状态管理可访问性(a11y),SEO(lighthouse评分),跨端兼容,界面交互性,美观程度(这个比较主观了)等等吗。 比如站里有新模型出来佬测的天气卡片,管理后台这些。 虽然一些前端工作是要用到3js做一些3d交互,可视化。 但是只测3js的话感觉侧重点变成了计算机图形学/数学/物理了。还是说因为3js比一般前端要难,所以用他来测能突出模型差距? (而且似乎感觉到模型厂商对3js适配更强了是怎么回事…面向测评优化能力(Benchmark Overfitting)?以及强如gpt/claude顶尖模型 其实让他们去写一些定位 特别是老代码里有float的 就很一言难尽了。。。) (顺带一提 后端有些也是…之前看到一个后端能力测评,结果是写个数据库。 我: 不知道有没有佬和我有一样的感觉。 7 个帖子 - 4 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-23 16:22:09+08:00 · tech

起因 昨天我在评论区看到有人询问想用大模型来做一些工作,求一个客户端推荐,下面有人推荐了CherryStudio,并且特别强调它的工具功能非常完善,这让我没忍住开了口,因为这与我长期使用cherry后得出的结论完全相反,所以我做出了反驳,用词比较激进。 激进的原因也很简单:早在很久之前,我就已经针对这个问题提过 issue,并且做了相当详细的复现和展示,但没有得到任何回复。 真正让我决定写这篇文章的,是另一位网友接下来的回复。 对方的回复非常长,全面且看上去谨慎细致严谨,甚至引用了一些源码的描述来证明cherry的工具机制是没有问题的,但读下来我几乎可以肯定这是一段借助ai解读源码后的回复,问题在于,他的ai没有帮他指正一个最关键的错误——工具调用的数据被存下来不代表它会被放进下一轮对话上下文中。让我感到懊恼的并不只是被反驳本身,更多的在于: 1、对方没有做任何真实的测试,没有尝试去复现我提到的现象 2、对方仅靠ai解读源码就判定我在胡说 3、对方依靠ai进行了一段看似非常合理的解读,这种格式更容易让观众认为他是对的,进而被误导 我不由得想到现在互联网环境里,用词合理谨慎已经不能代表它接近事实真相,ai让任何人都有能力在自己不了解的领域产出一段看似专业详实的文字。我也有理由相信这样一种可能——因为图中的网友不是非常确定我指代的问题,那么很可能他一开始的目的就是反驳我,只是利用ai来帮他找到证据并增强自信,在这种目的下,ai确实顺着他的意思帮他找到了“证据”,它真正蒙蔽了用户的双眼(当然不排除ai能力本身不够或者用户的提问有问题,但事实结果就是这样) 这也是我决定把这件事整理成一篇文章的原因:与其在评论区浪费口舌,不如直接把结果摆出来,也顺便帮助其他用户更了解自己所使用的产品。 回到正题:Cherry Studio 真的“工具功能完善”吗? 先说我的整体态度,避免被误解,我不否认cherry在很多地方做得非常出色,它的ui友好配置简单且功能强大,对绝大多数用户而言是一个非常棒的产品,它的完成度在同类产品里是领先的,如果你是日常使用,那它是一个非常好的选择。但是上面提到的这个设计缺陷——工具返回的数据没有正确进入后续上下文对我来说是致命的,它直接导致我无法信任任何在cherry中进行的强资料依赖型工作,进而对它的使用频率也越来越低——我甚至开始自己vibe客户端。所谓强资料依赖型工作,是指那些必须依赖前一步工具返回的真实数据,才能进行下一步推理整合的任务,在这类场景下,只要工具的返回结果没有进入上下文,后续所有看起来在引用资料的回答都可能只是在依据上一轮回答中的残留摘要继续推断而不是基于原始工具结果继续推理。这是任何后续校对都极难发现的隐患,因为模型会装得很像一切都在正常运行 实际测试 下面是我在 Cherry 中对这个问题的复现过程: 测试环境:Cherry Studio v1.9.6 测试方式非常简单,如图,这是我与模型的完整对话。 这张图是第一个请求,可以看到模型进行了工具调用 这张图是第二个请求,可以看到首轮的工具调用及结果已经不存在于cherry发送的上下文 为什么这是一个严重的缺陷 最后,我想再认真解释一下,为什么我把这件事称作严重缺陷,因为有的人可能会说这是为了节省token或者只要模型总结了就不会影响结果之类的: 1、它破坏了工具调用的连续性,工具调用的意义不只是当轮查一下资料并回答,而是把外部事实纳入对话状态,让模型在后续多轮推理中继续使用这些事实。cherry当前的问题在于工具结果确实会在当轮调用中返回给模型,但在下一轮对话构造模型上下文时历史 tool block 并没有被重新转换为模型可见的 tool result 。也就是说用户在界面上看到的是工具结果已保留在对话历史中,但模型下一轮实际看到的通常只是助手上一轮的自然语言回答。这会导致工具调用从可靠事实来源退化为“当轮辅助生成”。只要上一轮回答没有完整准确地复述工具结果,后续推理就会基于残缺摘要继续展开。对于搜索、数据库查询、学习研究、文件分析、MCP自动化等强依赖工具结果的场景,这个问题可能会被进一步放大 2、它的危险性在于ui展示和模型上下文不一致。如果一个工具调用失败,用户至少能看到报错。但cherry的问题不是显式失败,而是隐性的。无论是ui还是数据库历史似乎都被完整地保存了工具结果,但实际情况是模型后续请求并不会读取这些历史tool block。于是用户看到的是上下文里明明有工具结果,模型拿到的却是没有原始工具结果的普通聊天历史。这类隐性问题非常难察觉,因为大多数情况下模型仍然会流畅自信地继续回答。 3、如一开始图中那位,有人可能会把这个问题和上下文分支,删除/编辑消息之类的混在一起,但这不是我说的问题——在用户没有 主动 裁剪工具结果的情况下,cherry后续构造模型请求时也没有把历史工具结果作为工具上下文回传 我也常常怀疑自己,为什么这么多的用户,似乎从来没人指出过这个问题?难道它真的很正常吗?如果这是明确设计,我可以理解这种取舍,但它至少应该在产品层面被清楚说明,或者提供可配置选项,因为用户在ui中看到工具结果完整保留时天然会认为这些内容仍属于对话上下文 回到最开始那条评论。我并不想阻止任何人使用Cherry Studio,它对新手来说是一个非常值得推荐的工具,但当有人在评论区把它推荐给一位明确说想用模型做工作的用户时,我必须把这一面也讲出来。这篇文章也并不只是为了批评Cherry Studio,毕竟它是开源的,我们并没有资格要求太多。据我了解,Cherry Studio正在开发2.0版本并且听说会有较大变化,本来我是想看看2.0会不会直接将这个问题修复,但文章一开始的事件让我决定先把当前版本的问题记录下来。如果这篇文章能让更多用户意识到ui历史和模型上下文不是一回事,或者能推动项目在后续版本中修复这个问题,那将是它最大的价值。 7 个帖子 - 7 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-23 13:24:41+08:00 · tech

中国大学mooc任意一门课点进去抓包,会看到一个以 /web/j/commonBean.obtain.rpc 结尾的API,参数是 key=tampermonkey ,获取的文本居然是什么“一键答题提示”,“双击收起”,“正在获取题库,“无答案?点击获取”,“自动答题”,“账号积分”之类的文本。 难道是官方下场做了油猴的刷课脚本?还是说这是用来检测刷课脚本的? {"code":0,"result":"{\"node\":\"p[data-id][id\u003d\u0027getanswerbyid\u0027][style],0;ul#j-courseTabList[style],2\",\"text\":\"div[class][id]\u003ediv[class][style]\u003ediv\u003espan,一键答题提示,3;body\u003ediv[id][style]\u003ediv[id],双击收起,1;body\u003ediv[id][style]\u003eul\u003eli\u003espan,插件加载成功,4;body\u003ediv[id][style]\u003eul\u003eli\u003espan,正在获取题库,4;body\u003ediv[id][style]\u003eul\u003eli\u003espan,1083111700,4;body\u003ediv[id][style]\u003eul\u003eli\u003espan,账号积分,4;body\u003ediv[id][style]\u003eul\u003eli\u003ea,开始刷课,4;body\u003ediv[id][style]\u003eul\u003eli\u003ea,无答案?点击获取,4;body\u003ediv[id][style]\u003eul\u003eli\u003ea,更多\u003e\u003e,4;body\u003ediv[id][class]\u003ediv[class][style]\u003ediv\u003espan,一键答题提示,3;body\u003ediv[id][class]\u003ediv[class][style]\u003ediv\u003ep,自动答题,3\"}","message":"","traceId":"","sampled":false} 2 个帖子 - 2 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-23 10:42:00+08:00 · tech

不知道为什么我在对话直接发图片给codex就能读取,让codex读取目录下的图片就报错? {“error”:{“message”:“Bad Request”,“type”:“api_error”}} 我是Windows环境,装了codex cli和客户端,文件是jpg和png格式,目录和文件名试过用全英文也不行 同一个模型,试了claude cli也是一样报错(对话直接发送图片则没问题),但是opencode却可以读取本地图片,不知道是什么原因 如果想在codex上读取项目里的图片是得用gpt才可以吗? 老板想要抄别人的系统 按模块截了很多图,我想让AI分析先出个文档再慢慢做,图太多又是按模块分了很多文件夹,不太方便用对话的方式慢慢发给AI,还是需要让它逐步去分析然后完善文档,就是不知道为什么一直报错,好纠结啊 1 个帖子 - 1 位参与者 阅读完整话题