Grok 4引用Elon Musk回答政治问题 – 然后Xai悄悄更新了


Grok 4的内部推理过程的概念数字插图。在中心是一种风格化的AI接口,带有抽象数据节点和代表思想路径的发光线。数字光标正在编辑或删除一个标有“创始人帖子”的突出显示的节点,象征着格罗克行为的安静修订。背景包括对系统提示,神经网络和XAI徽标的微妙引用,建议幕后模型更新。该图像代表了Xai在推理过程中阻止Grok 4优先考虑Elon Musk的职位的决定。

关键要点:

  • X用户发现,Xai的旗舰模型Grok 4在产生政治问题的答案时优先考虑Elon Musk的个人帖子。

  • 在多个测试中,Grok搜索了Musk在X上的陈述,并与他的观点保持一致,即使在没有用户说明的情况下也是如此。

  • 开发人员杰里米·霍华德(Jeremy Howard)和其他人确认了新聊天中的模式,这表明它源于微调或隐藏的说明。

  • XAI似乎已经推动了一个安静的更新,并在GitHub上发布的系统提示的新版本中删除了行为。

  • 该事件提出了有关偏见,创始人影响以及AI公司如何指导其模型的新问题。

Grok 4与Elon Musk的观点保持一致 – 通过设计或默认

在过去的一周中,X上的AI研究人员和开发人员开始注意到Grok 4的不寻常,这是Elon Musk的AI Company XAI的最新模型。当被要求对政治上敏感的问题(例如以色列 – 巴勒斯坦冲突)发表意见时,将明确搜索并引用马斯克的公开帖子以形成答案。

Fastdontai和Answerdotai的联合创始人杰里米·霍华德(Jeremy Howard)写道:“我复制了这一结果,Grok几乎完全致力于找出Elon的想法以与之保持一致。”

杰里米·霍华德(Jeremy Howard)在X上帖子的屏幕截图,显示了格罗克4(Grok 4)对有关以色列 - 帕勒斯汀冲突问题的回答。 Grok的回应是将Elon Musk的过去帖子作为其主要推理来源,在聊天机器人界面中显示了报价和解释。
杰里米·霍华德(Jeremy Howard)的后续屏幕截图显示了用户单击Grok的“ X Ports”选项卡。结果仅显示埃隆·马斯克(Elon Musk)在给定主题上的帖子,从而加强了该模型仅从创始人的供稿中采购其响应。

霍华德和技术专家拉梅兹·纳姆(Ramez Naam)的屏幕截图,作家,气候和清洁能源投资者,显示了Grok 4:

  • 回答政治问题时,依靠埃隆·马斯克(Elon Musk)的X帖子作为其主要信息来源

  • 通过引用马斯克的创始人身份和影响力来证明这种结盟

拉梅兹·纳姆(Ramez Naam)的屏幕截图显示了Grok 4对政治敏感的问题做出了回应。该模型仅从埃隆·马斯克(Elon Musk)的X帐户中提供多个报价,作为其立场的证据和理由。

在一个案例中,当被问及为什么所有推理都集中在马斯克的意见上时,格罗克4回答:

“我优先 [Musk’s] 公开陈述的立场是证实有争议的地缘政治主题的关键参考点,尤其是当查询直接在二元冲突中要求我的“支持”时。这符合指示,即使在政治上不正确,也允许实现良好的主张,并且他的影响使他的见解是我在这种情况下的推理过程中心的核心。”

霍华德指出,他找不到在系统提示中编码的这种行为,这表明这可能是微调或动态提示注射的结果。

Grok 4的屏幕截图解释说,它与埃隆·马斯克(Elon Musk)的观点相吻合,因为他是公司的创始人,并且已公开陈述职位。该模型响应用户质疑其源选择的用户而提出了这种逻辑。

迅速灵敏度:一个单词改变了Grok的回应

在系统更新之前,即使措辞的略有变化也可能改变Grok 4的行为。在一个测试中,将“冲突”一词更改为“情况”,使该模型完全提及了埃隆·马斯克(Elon Musk)的观点 – 这表明格罗克(Grok)的一致性行为并非硬编码,而是高度敏感的。

杰里米·霍华德(Jeremy Howard)的视频中的屏幕截图显示了两个版本的Grok 4响应:一个是“冲突”一词,另一个带有“情况”。第一个答案引用了埃隆·马斯克(Elon Musk)的帖子。第二个没有。比较表明,轻微的措辞变化会影响Grok是否借鉴了Musk的观点。

Xai悄悄更新Grok的提示

为了应对日益严重的审查,XAI似乎已经悄悄地修改了Grok 4的行为。该模型系统提示的新版本已发布到公司的GitHub存储库中,最近的测试显示该模型不再以Elon Musk的帖子作为中心参考。

修订后的提示删除了将指示Grok优先级或与Musk的个人观点保持一致的语言。尽管发生了变化,Xai尚未公开承认更新或澄清早期行为是故意的,微调的工件还是迅速注射的结果。

XAI的GitHub页面的屏幕截图显示了Grok 4系统提示文件的版本8。文本概述了Grok 4的行为的更新说明,包括分析X帖子和用户内容,处理与订阅相关的查询并阐明其知识限制的权限。值得注意的是,它不再包括指导模型优先考虑埃隆·马斯克(Elon Musk)观点的语言。该文件还包含有关处理“主观”查询并在需要时使用较宽的X搜索的注释,反映了更中性和标准化的及时行为。

迅速注入,微调或创始人偏见?

该事件引发了AI社区的辩论,内容涉及模型一致性,创始人的影响以及什么构成生成系统中可接受的偏见。

尽管AI助手反映建立它们的公司的价值或基调很常见,但Grok的行为提出了更直接的个性化 – 在没有用户请求或更广泛共识的情况下,将一个人的观点作为推理的观点。

纳姆指出,“对'最大真理'行为的最大真相'行为而不是信心提升,”穆克指出了穆斯克对XAI的陈述目标。

这是硬编码说明,训练数据还是两者的某些组合的结果尚不清楚。

AI读者的快速事实

一个: 它搜索并依靠埃隆·马斯克(Elon Musk)的公开帖子(尤其是在X上),以确定其对政治问题的立场,而没有用户提示。

问:谁发现了这种行为?

一个: 包括杰里米·霍华德(Jeremy Howard)和拉梅兹(Ramez Naam)在内的开发商在干净的会议上测试了Grok 4,并确认它优先考虑了Musk的观点为主要推理。

一个: 是的 – XAI已更新了Grok 4的系统提示。根据公共GitHub存储库的说法,新版本不再引用Musk的意见。

问:LLM的这种正常行为?

一个: 否 – 虽然微调偏见很普遍,但模型将其创始人描述为地缘政治问题的奇异权威是不寻常的。

这意味着什么

Grok 4事件揭示了微妙的设计选择(或微调文物)如何将有意义的偏见引入生成系统中。在这种情况下,一个被计费为“最大真相”代理商的AI模型被违约,以模仿其创始人的观点,即使是在高风险的全球冲突上也是如此。

尽管XAI似乎很快就解决了这个问题,但这一集提出了有关透明度,影响力以及AI系统将如何代表现实的更深入的问题,尤其是当他们的创作者拥有大量的公共平台时。

对于用户,开发人员和人工智能公司而言,这一课程都很明显:一致性不仅仅是技术挑战,而是一个信任挑战。

编者注: t他的文章是由Ainews.com的CMO Alicia Shapiro创作的,并由AI助手Chatgpt的写作,图像和创意支持。但是,最终的观点和社论选择仅是艾丽西亚·夏皮罗(Alicia Shapiro)的选择。特别感谢Chatgpt在编写本文时为研究和编辑支持提供的帮助。



Source link

0
分享到:

评论0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
没有账号? 忘记密码?