哈哈体育景鲲要再造一个百度?生成式AI颠覆搜索为时尚早
哈哈体育这一轮生成式 AI 引发的浪潮可以说愈演愈烈,几乎每隔一段时间就会有新的 AI 公司和 AI 产品出现在我们的面前,也能看到很多已经功成名就的人选择投身 AI 创业热潮。
就在昨天,前小度 CEO 景鲲公布了离职百度后的新动态,宣布和前小度 CTO 朱凯华联合创立了 AI 创新产品公司 MainFunc,旗下首款 AI Agent 搜索产品 Genspark 已经 Beta 上线。
此外,MainFunc 还拿到了 6000 万美元(约合人民币 4.35 亿元)的种子轮融资,投后估值直接来到了 2.6 亿美元(约合人民币 18.87 亿元)。
此时距离他辞任百度集团副总裁和小度 CEO,刚刚过去 8 个月。耐人寻味地是,他在离开百度后选择的领域恰恰是百度的核心业务——搜索。
不留在百度的体系内做 AI 搜索,而是选择和前小度 CTO 一起自己做,这在一定程度上说明了百度面对 AI 搜索这个全新领域存在一些问题。但更重要的可能还是,景鲲的选择再次证明了很多人相信的一点:
但这种「前途」会彻底改变我们获取信息的方式吗?又会打破现有的搜索市场格局吗?
和所有 AI 搜索一样,Genspark 也采用了以对话为主要交互方式的设计,用户提出问题后,Genspark 会生成相关的简短回答,直接给你你可能需要的信息,而不是给你你可能需要点击、浏览、判断的「十个蓝色链接」。
此外,MainFunc 官方相信,Genspark 可以提供更高质量的搜索结果——也是回答。按照官方的说法,Genspark 使用多个专门的人工智能模型,每个模型都旨在处理特定类型的查询。
在底层,Genspark 依靠内部训练的模型以及来自 OpenAI、Anthropic 等的第三方模型来对用户的搜索查询进行分类,并确定如何组织和呈现结果。比如我们搜索「OpenAI 什么时候推出的 AI 搜索?」(实际没有推出):
Genspark 的每个搜索结果页面首先会呈现 AI 生成的结果摘要,后面是指向更详细的 Sparkpage 的链接,基本上可以理解为针对问题生成的一篇完整回答。最后还有一些推荐链接,这部分就相当于传统搜索引擎的结果页面。
而 Sparkpage,也是 Genspark 区别于其他任何 AI 搜索的独特互设计。除了生成一个类似的详细回答,用户还可以在 Sparkpage 右侧的对话窗口,继续与 AI 进行对话,不管是针对回答的疑惑进行展开,还是针对部分内容进行深入。
针对大模型的「幻觉」问题,AI 搜索一般都采用 RAG(检索增强生成)技术降低「幻觉」的出现概率。景鲲则在 TechCrunch 的采访中另外表示,Genspark 的 AI 模型偏爱具有高权威性和流行度的网页,对过滤掉更多「外面」的信息有很大帮助。
「我们非常重视数据质量,我们相信数据质量是赢得这场比赛的关键,」景鲲强调。但现实是,在这场 AI 搜索的比赛中,重视数据质量的不仅是他们,参加比赛的对手也是层出不穷。
曾几何时,以谷歌和百度为代表的搜索引擎可以说是整个互联网最重要的「入口」,基于搜索引擎,谷歌一直以来的使命就是:「整合全球信息,供大众使用,让人人受益。」
但在很长的时间内,搜索引擎的产品形态和商业模式并没有发生质的变化,甚至体验还有所退步。
在传统的搜索体验中,用户通常是脑中存在一个或模糊或清晰的问题和需求,然后需要将这种需求转化成一个或几个相关的关键词。
接着,搜索引擎根据关键词、索引库找出相关的网页链接,再通过算法排序的方式呈现相关程度最高的网页链接。同时,在搜索结果中还往往穿插着几个「伪装成搜索结果」的广告。
与之相对的,得益于大语言模型实现了强大的自然语言理解能力,用户可以用最自然的自然语言进行搜索,AI 搜索也能够更准确地理解用户的提问意图。
此外,虽然 AI 搜索同样需要匹配超大规模的索引库来找到相关的网页,但在呈现上彻底改变了过去信息的组织和设计,没有「信息排序」,直接给出答案,不需要用户点击排在前的最相关链接,再找出自己真正需要的信息。
简而言之,相比传统的搜索体验,AI 搜索是一种交互和效率上质的变化,也被很多人视为搜索的未来。所以即便 AI 搜索严重挑战了现有的搜索广告商业模式,谷歌也还是推出了 AI 搜索。
今年 5 月 15 日,谷歌在 Google I/O 开发者大会上宣布将在谷歌搜索上线基于 Gemini 大模型的 AI Overviews 功能,简单来说,就是根据用户问题在搜索结果页直接生成一个简短的回答,然后才是以网页链接为主的传统搜索结果。
用过 New Bing 的读者一定不陌生这种形式,事实上这也意外着谷歌搜索终于也迈出了通往「AI 搜索」的一步。
相比之下,作为全球第一大中文搜索引擎,百度同时还是国内最早推出自主训练大模型,虽然旗下也有主打 AI 搜索的「简单搜索」,但百度搜索却取消了 AI 搜索功能(文心一言推出早期有上线过)。
而与此同时,由前 OpenAI 研究科学家 Aravind Srinivas 联合几位合伙人共同创办的 Perplexity,已然成为了当下最具代表性和影响力的 AI 搜索。截至今年 1 月,Perplexity 的月活跃用户就超过了 1000 万,访问量超过 4500 万次,总搜索量超 5 亿次。
加上转型 AI 搜索的传统搜索公司,以及一大批新涌现的 AI 搜索初创公司,AI 搜索似乎已经到了「万马奔腾」,一举取代传统搜索的局面。
坦白讲,从去年开始小雷就尝试过将浏览器的默认搜索引擎换成「AI 搜索」,主要是用连英伟达 CEO 黄仁勋都在用的 Perplexity,今年还尝试过将之前中文搜索体验还不错的秘塔 AI 搜索设置成默认搜索引擎。
但现实是,我其实都用不了多久就会换回谷歌,理由并不复杂,核心是 Perplexity、秘塔 AI 搜索以及其他 AI 搜索都:
作为科技编辑,小雷几乎每天都需要使用搜索引擎,也严重依赖通过搜索来获取信息,同时信息的准确性也非常重要。这一点应该很好理解。
但 AI 搜索本质上是能联网的 AI,同时基于 RAG 技术,大模型会结合用户提问和相关检索信息作为 Prompt 输出回答。虽然不少观点认为 RAG 技术是当下缓解大模型幻觉的最佳解决方案,但不仅远谈不上解决,实际缓解的效果也有限。
具体到 AI 搜索体验中,小雷看到有些回答会明显怀疑一些信息的真实性,这个时候又不得不需要通过谷歌等传统搜索引擎进行检索、查证,因为 AI 搜索的来源链接也充满了幻觉。
但我又不可能每个信息都重新进行搜索、查证,否则就与「使用 AI 搜索提高搜索效率的初衷」背道而驰了。
更大的问题是,如果一些信息错得并不离谱,我对一些特定领域也并不了解,很可能不会意识到错误,甚至会直接使用了错误的信息,从而产生错误的理解和观点。
简单来讲,作为能联网的大模型,目前的 AI 搜索很多时候是存在幻觉的黑箱,我很难信任 AI 回答里面的各种信息,所以宁愿退回传统的搜索体验,使用关键词找到相关的网页,再人工寻找和判断我需要的信息。
首先,大模型的流行注定会改变互联网的内容生态,我们很早就在文章中表达过对生成式 AI 内容充斥互联网的担忧,今年你甚至还可以看到字节跳动、掘金等公司通过 AI 生成了海量中文网页「污染」搜索引擎。
而不同于传统搜索引擎的机制和交互方式,AI 搜索理论上相对更容易绕开这种「污染」,同时对话式的交互也能避免了大量无价值内容,提高效率。
其次是在「What」之外,我们经常需要向搜索引擎提出的问题还有「Why」和「How」,这方面对信息的准确性要求较低,更强调整合梳理能力,而这恰恰是大模型极其擅长的,这是小雷需要的。
同时从更长远的角度来看,大模型和生成式 AI 技术还处在快速发展的阶段,当下幻觉的问题并不意味着在不远的将来会有更好的解决方案。
AI 搜索的出现无疑给我们提供了一种全新的信息获取方式,也带来了不少新的思考和挑战。但在使用 AI 搜索过程中,我们能明显发现了其在准确性和可靠性上的不足带来的困扰。但这并不意味着 AI 搜索毫无价值。
相反,AI 搜索在整合信息、提升搜索效率以及避免无价值内容方面展示了巨大的潜力。随着技术的进步,生成式 AI 的能力将会更加完善,或许就能解决当前存在的问题。
所以比起一种取代传统搜索的「救世主」,我更愿意把 AI 搜索看作一种新的选择。我们在使用中需要不断探索和适应,找到最适合自己的使用方式。在这个过程中,传统搜索引擎和 AI 搜索并不是互相排斥的,而是可以相辅相成,共同改进我们的搜索体验。
或许在不久的将来,AI 搜索能够解决目前的不足,比传统的搜索方式更能「整合全球信息,供大众使用,让人人受益」,成为人类获取信息的主要方式。
2024年5月20日-6月30日,618年中大促来袭,淘宝天猫、京东、拼多多、抖音、快手、小红书六大电商平台集体“听劝”,取消预售、疯狂杀价!
手机数码、AI PC、智能家电、电视、小家电、空冰洗等热门AI硬科技品类摩拳擦掌,战况激烈。
雷科技618报道团将全程关注电商平台最新战况,AI硬科技品牌最新动态,电商行业全新趋势,敬请关注,一起期待。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。