泡书网 > 大白话聊透人工智能 >AI幻觉:AI的“一本正经胡说八道”是怎么来的?
加入书架 开始阅读

AI幻觉:AI的“一本正经胡说八道”是怎么来的?

最新网址:http://www.paoshu5.cc
  你有没有遇到过这种情况?兴致勃勃地问AI一个专业问题,它秒回一大段逻辑清晰、数据详实的答案,甚至还引用了“权威论文”和“专家观点”,看得你连连点头。可等你顺着它给的线索去查证,却发现论文根本不存在,专家查无此人,那些看似精准的数字更是凭空捏造——这就是AI在“说胡话”,也就是咱们今天要聊的“AI幻觉”。

  要是你以为只有冷门问题才会触发幻觉,那就太天真了。有人让AI写一篇关于“唐代长安城早餐文化”的文章,它能详细描述长安人早上爱吃“羊肉胡饼配酪浆”,还说“西市的胡饼摊凌晨三更就开门”,甚至引用了“《唐六典·食货志》记载”。可翻遍《唐六典》,根本没有相关内容,长安城的早餐主流其实是粥、饼、包子,“三更开门的胡饼摊”纯属AI脑补。

  还有更离谱的:有人让AI推荐治疗失眠的“科学方法”,AI竟然给出“睡前服用3毫克褪黑素搭配维生素B17”的建议,还强调“这是美国睡眠医学会2023年最新指南推荐”。但稍微有点常识的人都知道,维生素B17并不是公认的营养素,过量摄入还可能有毒,美国睡眠医学会也从没发布过这样的指南——这要是真有人照着做,后果不堪设想。

  AI明明是“智商超群”的高科技产物,怎么会犯这种“低级错误”?它的“幻觉”到底是怎么来的?今天咱们就用最接地气的大白话,把AI幻觉扒得明明白白,从它的本质、成因,到常见表现、避坑技巧,一次性说透。

  一、先搞懂:AI幻觉到底是什么?不是“bug”,是AI的“本能胡说”

  首先要明确一点:AI幻觉不是程序出了“bug”(虽然有时候像),而是当前大语言模型的一种“固有特性”——简单说,就是AI在没有事实依据的情况下,一本正经地编造信息,还把编造的内容当成真的输出。

  这里有两个关键:一是“无依据”,AI的答案不是来自训练数据里的真实信息,也不是基于逻辑推导的正确结论,而是凭空生成的;二是“一本正经”,AI不会告诉你“我不确定”“我在猜”,反而会用肯定的语气、严谨的结构(比如引用文献、列出数据),让你误以为它的答案是权威、准确的。

  举个生活化的例子:你问一个朋友“北京哪条街的老字号卤煮最正宗”,如果他没吃过、也没了解过,正常会说“不知道,没研究过”;但AI版的“朋友”会告诉你“东城区南锣鼓巷87号的‘老张卤煮’,创立于1923年,是北京非遗项目,每天限量200碗,央视《舌尖上的中国》第三季专门报道过”——但你去南锣鼓巷找,根本没有87号的“老张卤煮”,非遗名录里也没有这家店,《舌尖上的中国》第三季也没提过它,全是AI编的。

  再比如,学生问AI“《百年孤独》里有没有一个叫‘马尔克斯·阿尔瓦雷斯’的角色”,AI会回答“有,他是奥雷里亚诺·布恩迪亚的孙子,在小说第17章出场,是推动香蕉公司罢工事件的关键人物”——但读过《百年孤独》的人都知道,小说里根本没有这个角色,章节和情节也都是瞎编的,可AI说得有鼻子有眼,没读过原着的学生很容易被误导。

  简单总结:AI幻觉就是AI的“信口开河”,但它的“信口开河”带着“专业滤镜”,比普通人的胡说八道更有迷惑性。

  二、常见的AI幻觉类型:这5种“胡说”最容易坑人

  AI幻觉不是杂乱无章的,常见的有5种类型,咱们一一拆解,以后遇到了能快速识别:

  1. 无中生有型:编造根本不存在的人、事、物

  这是最常见的幻觉类型,AI会直接创造出训练数据里没有的信息,比如不存在的人物、事件、地点、产品、文献等。

  比如有人让AI写“中国古代十大冷门发明”,AI会编造“东汉张衡发明的‘自动播种机’,用齿轮传动,一次能播种三行,效率是人工的5倍,记载于《后汉书·张衡传补注》”——但《后汉书》里根本没有《张衡传补注》这一篇,张衡也没发明过自动播种机,全是AI瞎编。

  还有人让AI推荐“2023年诺贝尔物理学奖的备选项目”,AI会列出“量子纠缠通信的实际应用”“黑洞自转速度测量新方法”,还说“这些项目由中国科学院院士XXX牵头,已通过诺奖委员会初审”——但2023年诺贝尔物理学奖的获奖项目是“阿秒光脉冲技术”,根本没有这些备选项目,所谓的“中科院院士XXX”也查无此人。

  这种幻觉的特点是:细节越具体,越可能是假的。AI会特意加时间、地点、人名、书名这些“细节包装”,让编造的内容看起来更真实。

  2. 张冠李戴型:把A的信息安到B身上

  AI有时候不会完全编造,而是把甲的事迹、数据、属性,错误地安在乙身上,就像把张三的身份证信息贴到李四脸上,看似有依据,实则完全错位。

  比如你问AI“周杰伦的《七里香》是哪一年发行的”,AI可能回答“2005年,收录在专辑《十一月的萧邦》里”——但实际情况是,《七里香》发行于2004年,收录在同名专辑《七里香》中,《十一月的萧邦》是2005年的专辑,里面根本没有这首歌,AI把两张专辑的信息搞混了。

  再比如,有人问AI“爱因斯坦提出相对论时的年龄”,AI会回答“36岁,1905年提出狭义相对论,当时他在普林斯顿大学任教”——但爱因斯坦1905年提出狭义相对论时只有26岁,而且他1933年才去普林斯顿大学,1905年时他在瑞士专利局工作,年龄、任职单位全错了,属于典型的张冠李戴。

  这种幻觉的迷惑性更强,因为它涉及的人和事都是真实存在的,只是关键信息错位了,不熟悉细节的人很难发现。

  3. 数据编造型:生成看似精准的假数据、假统计

  AI特别
  http://www.paoshu5.cc/book/46178/204.html

  请记住本书首发域名:http://www.paoshu5.cc。泡书网手机版阅读网址:http://m.paoshu5.cc