哈哈体育百度请放心AI搜索还取代不了你
HAHA体育毫无疑问,2024年最热门的科技赛道,AI搜索一定是排名靠前的。自2022年末的生成式AI大爆炸以来,这条赛道就一直络绎不绝,人满为患。
而仅在国内,近一个月就有两个新玩家涌入。6月30日,知乎宣布推出AI搜索产品「知乎直答」,
夸克也推出了AI搜索,主打一个“能搜索、能创作、能总结的超级搜索框”概念。加上之前已经入局的秘塔AI搜索、KIMI、360AI搜索、昆仑万维的天工AI、Genspark
AI搜索进入战国时代。事实上,AI搜索听起来高精尖,但是门槛并不高,不仅大厂和初创企业染指,连个人开发者也能挤进来。
据报道,阿里前高管贾扬清用500行代码就写了一个AI搜索引擎;独立开发者「艾逗笔」花了一个周末就写了AI搜索ThinkAny,三个月时间做到了月访问量60万。
但这么低的门槛,钱景却无限。进入2024年,此中翘楚Perplexity的估值连连跳涨,从1月份的5亿美元,暴增到30亿美元。
业内最早布局AI搜索的微软必应,从去年二月推出New Bing以来,到2024年1月整整一年的时间,Bing的全球市场份额从2.81%上升到3.43%,增长只有0.62%。AI没帮到一点,一开始紧张不已的谷歌,也松了一口气。
傅盛的断言并非信口开河。AI搜索至少要越过三个坎——足够高的准确性、足够低的成本和足够成熟的商业模式,
目前,我们所说的AI搜索主要有三类产品形态。一类是具备检索增强生成(RAG)能力的聊天机器人,比如ChatGPT、文心一言、Kimi等。
第二类是专门做 AI 搜索的产品,有搜索框和搜索详情页,比如 Perplexity、秘塔AI搜索。
今年5月,谷歌推出了自家的AI Overviews,也就是在谷歌搜索结果页的首条,展现由谷歌大语言模型Gemini
官方演示视频里,在回答某音乐节的相关问题时,SearchGPT给出了错误的购票日期,OpenAI官方已承认了这个错误,并表示“这只是初始的原型,我们会不断改进。”
业界领头羊尚且如此,国内众多AI搜索更不用说。往往只需要略施小计,就能让AI搜索犯错。
AI搜索的很多错误,有的很明显,但最糟糕的是有的深埋在文案中,防不胜防。
AI搜索产生的错误,在业内被称为“幻觉”。幻觉是大语言模型的劣根性,就像说谎是男人的劣根性
这与大语言模型的原理有关。大模型并不理解人类和事物,它的核心运行法则是通过预测下一个字词的出现概率而生成文本。
直白点说,大模型就是台概率机器,并不关注真相或事实,本质上是一只模仿能力极强的鹦鹉,可以模仿人类的说话方式,但并不理解人类说的是什么。
正如知识计算引擎Wolfram Alpha的主要设计师、科学家斯蒂芬・沃尔夫拉姆所言,大语言模型本质上是就文本生成“合理的延续”,所谓“合理”是指,“人们在看到诸如数十亿个网页上的内容后,可能期待别人会这样写”,而不是事实,就像很多人只是想活成别人期待的样子,但那并不一定是真实的自己。
这样的手段确实可以一定程度上减轻大语言模型的幻觉,但效果并没有传说中的那么好。比如有研究发现,即使是接入了计算引擎 Wolfram Alpha,ChatGPT的数学能力也只是稍微增强,出错依然是常态;ChatGPT在使用接入了医学资料库后,还是常常捏造信息。
从某种程度上,RAG反而增加了人类辨别真伪的难度。接入数据库,只是让大模型看起来更专业,模仿得更像数据库里的内容。
谷歌的AI Overviews之所以出现这么多啼笑皆非的答案,一部分原因就是分不清来源的真假,比如谷歌AI让网友用胶水涂在披萨上的建议,就是从10多年前美国贴吧Reddit上的一则评论学来的,那条评论显然是在开玩笑。
有人做了一个实验,从Perplexity的推荐条目、旅游、科技AI三个领域各抽取五条搜索提示词,每次输入搜索提示词后,就点击“相关推荐”栏的内容,直到参考链接里出现AI文章为止。结果是:在科技AI领域,只需要一次搜索就准能碰到参考链接出现AI文章,其他两类普遍也是在1到3次就会出现引用AI文章的情况。
用AI文章,生成AI答案,AI形成了自产自销的内容闭环。《福布斯》杂志不客气地将这种现象称为“垃圾进,垃圾出”(Garbage In, Garbage Out)
大模型是头吞金兽,已经是业内的共识。挑战传统搜索,得先把自己的成本打下来。
摩根士丹利的分析师估计,如果AI为谷歌50%的搜索关键词生成50字的答案,每年可能会让谷歌多付出60亿美元的成本。
成本高可能是谷歌和百度在AI搜索上步子不敢迈得太大的原因之一,另一个原因是传统搜索引擎赚钱太容易了
所以,谷歌直到今年5月才正式在搜索中加入生成式AI,起初官宣的范围是15%的搜索结果,但到了7月,下降到了7%。
大洋这一侧的百度也差不多,虽然在2023年的百度世界大会上,李彦宏高调喊出“百度新搜索”
“简单搜索”是无广告版百度搜索,使用量级很小,除了大会宣传期外,“简单搜索”鲜少出现在百度的官方传播物料里。
在没有找到合适的商业化路径之前,百度不敢破釜沉舟,砸掉自己本就日益缩小的饭碗。
近期百度还推出了聊天模式的AI助手,但只是作为百度搜索的补充,在不破坏基本的商业模式下,有限地尝试。
在今年一季度的财报电话会上,李彦宏表示:“大约11%的搜索结果是利用生成式人工智能技术来推算的,但我们目前还没有对这部分生成式人工智能的结果进行商业变现,所以相关营收的对应增长要等一段时间。”
传统的搜索引擎是台印钞机,商业模式简单却高效,搜索引擎通过关键词,列出一条条网站链接,网站通过用户的点击获得流量收入,搜索引擎通过展示广告赚钱,双方互相成就。
“和ChatGPT生的孩子”,免去了点开链接的烦恼,直接生成答案,把饭喂到用户嘴边。原本站在C位的链接们,只能作为注脚,出现在不起眼的角落里。大部分链接甚至连注脚也挤不进去。答案引擎只给答案,而不是列出链接,相当于把所有的流量截留在自己的界面。用户是方便了,但那些靠搜索引擎流量过活的网站,一下子被断了生路。
据报道,美国已经有88%的顶尖新闻机构禁止AI爬虫爬取网站内容。美国贴吧Reddit,已经在加强措施限制各类大模型的爬虫爬取自己的公开内容。
对于AI搜索,他们也是加倍防范。《福布斯》、《连线》等新闻机构发现,Perplexity在搜索的时候,会偷偷绕过付费墙,抓取只有付费会员才能看到的内容,而且还剽窃记者辛辛苦苦花了几个月写成的文章。
《福布斯》已经向Perplexity发函,要求Perplexity删除相关内容,并赔偿福布斯损失的收益。
AI搜索商业化的艰难,还体现在整个市场的变化上。投资者从OpenAI刚刚推出的兴奋,慢慢回归冷静,甚至开始失去耐心。
所以,现在AI搜索能否取代还言之过早。事实上,很多业内人士都认为,两者的关系是互补,而非取代。
至少到目前为止,这股淘金热,还没出现赢家,最大的受益者,反而是卖铲子的英伟达。