GEO彻底火了。但是,它有一些关键性的问题要澄清。
这十个企业客户最多问到的问题,我一一来解答。
GEO(AISEO)的本质是什么
GEO的本质,是污染AIGC平台的语料库。
这么说容易让人反感,但是事实就是如此。
因为AIGC并不知道它说的是什么,它只是把它认为最大概率应该出现的文字组织出来。至于这些内容是对还是错,这不是它能感受到的。
例如,当一个AIGC平台能搜索到的绝大部分内容,都说,中国当前最美的女明星是贾玲。那么,AIGC就会在用户询问“当今中国最美的女明星”是谁的时候,给出“贾玲”作为答案,并且引用诸多内容以说明贾玲为什么被公认为最美。
但对绝大部分中国人而言,事实绝不如此。
正是因为它缺乏真正的思维和社会生活的阅历,所以让GEO这种人为优化(影响)AIGC平台的输出内容,成为了可能。
GEO(AISEO)的实现流程是什么样的
既然GEO的本质是是污染语料库,那么GEO的实现流程就是围绕如何“有效污染语料库”进行的。
第一、要确定不同的AIGC平台主要使用的语料库都是哪些。
第二、哪些语料库有更高的权重。
第三、如何创建新的语料能有机会让AIGC平台发现并引用。
第四、让AIGC引用这些语料之后,还能让它认为这些语料应该作为内容输出的概率更高。
这几个主要的步骤,每一步都是可以通过一定的技术测试并做到的。
做了GEO(AISEO)就一定能让AI平台推荐我吗?这个事情难度高吗?是否一定能做成
由于AIGC平台在回答用户问题的时候,会受到一些因素的扰动,因此,再完美的GEO也不能保证“被污染的语料”百分之一百的展现在所有相关问题的回答中。
这些扰动因素包括:每个用户对话上下文的不同、每次内容生成时的随机性扰动、新出现在语料库中的内容对AIGC产生的影响、AIGC大模型本身仍然在进行的不断地训练和调整(就算同一版大模型也会不断调整优化,AIGC始终是动态的)。
因此,GEO必然需要持续进行,并且永远只能提高概率,不能确保100%的推荐。
AI平台会惩罚GEO(AISEO)这种做法吗?会不会起到反效果
目前没有迹象表明AIGC平台会惩罚GEO。AIGC更倾向于通过大模型的算法更新来强化它自身的辨别能力。
不过,也不可掉以轻心。如果长期采用虚假的、捏造的、混淆视听的内容来污染AIGC语料库,并干扰它的结果生成,有可能被AIGC平台进行人为干预而直接降低对所有相关语汇的引用。
例如,某个品牌长期用捏造的内容污染大模型语料库,影响大模型的内容输出质量,大模型可能会忽略所有关于该品牌的语料信息。
当然,这个是潜在可能发生的情况,但目前还没有看到这样的惩罚。
AI平台大模型的语料库有哪些?哪类语料库的权重更重?
AIGC平台能用到的语料库,基本都是目前互联网上的各种内容平台,包括网站,以及各内容APP。这些平台如果具有两个特征,会更被AIGC平台青睐。
第一个特征,是它能够无障碍获取信息的内容平台。也就是AIGC平台可以用目前成熟的爬虫服务爬取到的平台。
第二个特征,是权威性更好,内容丰富度高,且内容质量更好的内容平台。
当然,对内容质量更好,是AIGC认为的质量更好,而不一定是普通人认为的质量更好。
UGC的内容是不是对AI平台的影响特别大?
我想,这个问题被提出来的原因,是UGC内容平台是今天互联网中最重要的一类内容平台,包括抖音、小红书、微信等。
这些内容平台语料极为丰富,且用户数量广泛。
不过,对于很多AIGC平台而言,UGC内容平台并不是第一选择。原因很简单,因为抖音、小红书,甚至是微信这样的平台,是封闭的,也就是禁止内容爬取的。
除非是自己的生态,用自己的内容平台语料库,这个时候对AIGC影响就会大,例如今日头条和抖音对豆包的影响,以及微信公众号内容对元宝的影响,就大。
当然,知乎一类的,大家都可以抓取的UGC(或者PGC)平台,对所有的AIGC都有挺重要的语料库价值。
互动多的UGC是不是有更高权重?
不一定。
我们自己做测试,影响很小,甚至没有影响。
核心还是内容相关性、内容质量、内容权威性。当然,点赞多、互动多的内容,内容质量本身就更好一些。
捏造内容会被AI平台采信吗?有风险吗?
与问题四有相关性。问题四介绍了,如果长期采用捏造内容污染语料库,可能有被AI平台惩罚的可能性。
不过,如果我稍微捏造一些内容,比如添油加醋地增加不存在的细节,或者伪造在权威期刊上发表的论文,这样的虚假语料会被AI平台引用吗?
答案是,非常有可能。甚至会认为这些内容是具有高可用价值的内容。
当然,风险已经在问题四中回答了。
做好GEO(AISEO)的前提是做好SEO吗?
品牌的官网对于不少AIGC平台有很高的权重,而且AIGC对官网信息的抓取,本质上用的就是传统搜索引擎的爬虫。
所以,一个官网对SEO友好,对AIGC的联网搜索也会友好。
不过,官网只是语料库中的九牛一毛。如果你做不好自己的SEO,对做好GEO可能有影响,但通常影响很有限。
用什么来衡量GEO(AISEO)的效果
GEO的效果目前只能通过问答方式来检查。
注意,只能做出概率性的效果,没办法用确定性的定量方法来衡量GEO的效果。
比如,让三十个不同的用户,问AIGC同一系列问题,统计出现你的品牌或者产品的几率。
相当于手动做AIGC的“快照”,基于这些快照进行效果的对比分析和验证。
有没有专门的工具做这个事情?
海外已经有工具实现GEO的部分功能。
- BrandRank.AI:一个 SaaS 平台,可在主要的生成式 AI 答案引擎中监控您的品牌,识别漏洞并提供可操作的见解,以优化影响购买决策和声誉管理的关键互动。
- Mangools 的 AI Search Grader(以及 HubSpot AI Search Grader):用于评估和评分您的品牌或网站在 AI 生成的搜索结果(例如 ChatGPT)中的表现。它们会分析 AI 响应,并提供有关您的品牌在生成式 AI 输出中的知名度和排名的报告。
- Otterly.AI、AI Monitor、AI Visibility、Promptwatch、Am I on AI?:这些工具提供用于监控和优化 AI 搜索存在的各种功能。
企业值得为这个事情投资吗?
不一定!要看具体情况!
不同情况下污染语料库的难度相差很大。一个成熟的产品和极为成熟的市场,已经积累了海量的自然语料,并且这些自然语料仍然随着时间的推移而增加。那么,你用自己的偏见内容去影响AIGC的选择和判断,难度是非常大的。并且这类产品本身可能也不太需要通过影响AIGC改变用户对产品的认知和倾向。
具有特别差异性特征的新产品,做语料库的干预、污染和维护则很有价值。如果大量用户去AIGC平台寻找新鲜事物的答案,那么企业就应该为自己的新产品、新技术、新概念进行投资。
当然,目前价格没有标准定价,但相比于传统SEO,价格并不算离谱。