探讨大语言模型(6000字简版)

营销管理
策略人藏锋
6小时前

没有实践就没有发言权,没有实操就无法有体感。

在跟AI对话超10万次,写了20多万字提示词和知识库,搭建了100多个智能体之后,我对大语言模型可能多了一层理解。

说一千道一万,不如亲自下场干一干。学好AI,就要真正去用AI。

用好AI有四大核心:一是用世界上最好的。二是要足够高频去用。三是用到具体的场景里。四是在用的过程中不断复盘迭代和总结。

没有深度用AI,就没有资格评AI。

现实的情况是,90%的人都没有深度用AI,对于AI的认知也是浮于表面和道听途说。

很多人对于AI的认知是单点的,因为在处理完工作和生活的事情之后,早已力不从心了。

AI确实很有用,但其实绝大部分人都没怎么用。

学好AI需要三大转变:碎片变系统,小点变流程,表层变深度。

不要只停留在碎片小观点,要把知识串成框架,才能看清AI的边界和玩法。不要只会单点小技巧,要把AI融进SOP,变成自己高效的AI SOP。别只听别人说,要自己做,要放进自己的场景里去用去试去总结。

只有不断做认知迭代,才能变成可复用的方法和实操。

基于我把AI应用在“内容产出+内容变现+方案撰写+策略生成+智库搭建”板块之后,我来分享我的思路,希望能激发你的一些灵感。

文章目录:

1. 大语言模型的本质是什么?

2. 如何做到人机合一?

3. 用好AI需要避哪些坑?

4. 用好AI需要坚信哪些点?

1. 大语言模型的本质是什么?

用好一个工具,先要理解其本质。

AI在应用形式上,主要分为生文、生图和生视频。基于我做品牌策略场景,我主要研究生文,也就是大语言模型(LLM, Large Language Model)。当然,我认为目前生文在能力体系的搭建和内容输出的质量都已经非常成熟。

AI的上限很高,但每个人挖掘的程度不一。就像看同一本书,不同的人看,看出的结果可能千差万别。在好工具面前,我们需要建立的是驾驭工具的能力。

选择大于努力,不要错过任何特定时间窗口的红利和杠杆。

我们可以从三大板块来理解它的本质:技术层、产品定义层和价值观层。

第一大板块是技术层,主要包含三大要素:数据+算法+算力。

1. 数据决定了模型知道什么

数据是模型的养料,数据的质量决定了模型的上限。数据决定了模型知道什么,知道的广度和深度,以及它如何理解和应用这些知识。

数据分为两种:一是深度训练的静态知识库,二是外接搜索的实时网页抓取。

1)深度训练数据

从时间维度,市面上的大模型在深度训练层,基本都是滞后1-2年,从现在看的话,基本都是在2024年6月上下。此时间节点之前的数据经过了深度训练。

A. 广度决定边界

大模型通过抓取世界上的网站、书籍、论文、期刊、代码等等,搭建的是接近穷尽的知识库。

人的决策是基于大脑库,并且这个库有限,但大模型可以把网上公开半公开的信息做到接近穷尽。这确保了大模型本身的可能性,只要你调教得当。

B. 深度决定专业

不同大模型会基于自身的专家资源和专业沉淀,还会在特定领域让专家来做深度训练。

比如医学、法律、战略、财务、文案等等。所以你会看到,好的大语言模型其实非常专业,因为本身就是用人来调的,他们投喂和训练了网上公开半公开没有的东西。

C. 系统性决定聪明度

这是在广度和深度之外,更往上一层的逻辑。大模型不是孤立地记忆事实,而是理解各要素之间的联系,最终形成更高维度的系统思维。

一个“关联度”高的数据集,具备上下文和逻辑能力,可以让大模型做到举一反三。它不仅知道苹果公司、乔布斯、库克、iPhone、Mac,更通过大量文本理解了它们之间的因果、影响和情感联系。正是这种关联度,让模型学会了类比推理,能理解隐喻,甚至在不同知识域之间建立起意想不到的创意连接。

这决定了模型是博学的“书呆子”还是具备悟性的智者。甚至还能向内不断剖析,找到第一性原理,来为用户所用。

2)实时抓取数据

最初大语言模型是没有接入实时搜索的,所以当时一些通过套壳做的AI搜索应用也火了一阵。但当大模型接入搜索以补全能力的时候,它们也就逐渐淡出大家的视野了。

它的核心逻辑在于用实时检索来弥补信息的时间差。这就是检索增强生成(RAG Retrieval-Augmented Generation)的逻辑。

当模型收到一个问题时,它不再仅仅依赖于自己那份“过时”的内部记忆。整个过程对用户来说是无缝的,但在后台,模型会像一个顶级的、效率极高的研究专家一样,快速完成以下动作:

A. 意图理解:迅速分析你问题的核心,判断是否需要调用“现在”的信息。

B. 实时搜索:将问题转化为高效的查询指令,在此时此刻精准地访问搜索引擎,获取最新的网页、新闻、报告和数据。

C. 整合生成:将搜索到的最新、最权威的信息碎片,与自己庞大的静态知识库进行融合。也就是用实时信息作为事实依据,用静态知识提供深度、背景和语言风格,最终生成一个既有深度、又完全符合当下事实的答案。

这三大部分极其依赖于大模型的聪明程度。聪明的大模型理解你真正要什么,知道要去哪里搜索(如果自己本身有搜索引擎的绝对优势,效果更好),以及知道怎么跟深度训练的数据做结合,最终给到专业的答案。

2. 算法决定了模型“有多聪明”

如果说数据是“原材料”,那么算法就是“厨艺”。同样的食材,用不同的烹饪手法,最后的味道也会天差地别。

它决定了模型如何学习、理解和运用这些庞大的数据,最终变成更聪明的智者型专家。

1)架构决定了学习效率

大语言模型主要是基于Transformer架构,其核心是“自注意力机制”。

如果说旧算法像是一个只能逐字逐句阅读、记性很差的学生,那么Transformer就像一个能一目十行、同时在脑中标注出全文重点和关联的天才。

它能更好地理解长距离的上下文关系,这是模型能够理解复杂语法、进行逻辑推理的基础。架构的优劣,决定了模型吸收知识效率的高低。

2)训练方法决定了知识内化的聪明程度

大模型主要采用“自监督学习”的方式,简单来说,就是通过“预测下一个词”这个看似简单的任务,在数万亿次的练习中,倒逼自己学会了语法、逻辑和事实。这个过程分为两步:

第一步是预训练,在海量通用数据上进行训练,将模型培养成一个知识渊博的“通才”。

第二步是微调,在特定领域的高质量数据上进行二次训练,将“通才”调教成某个领域的“顶尖专家”,比如法律或医疗模型,就已非常成熟。

3. 算力决定了模型的天花板

对用户来说,AI好不好用,核心在于它“聪不聪明”。

这种聪明不是记住多少知识,而是能不能像人一样思考、推理、甚至理解你。

而让AI真正“开窍”的关键,就是算力带来的——涌现能力。涌现能力就是大力出奇迹,是大模型做到足够聪明的前提。

就像人的大脑比昆虫大脑多了几个数量级,于是产生了语言和创造力。AI在算力不足时,只能机械回答。但当算力跨越某个门槛,它就会突然学会没人教过的复杂能力,这就是涌现。

也就是,在某个时刻大模型开窍了,就像我们突然“悟”了一样。

我们主要通过三大方面体会到:

一是大模型学会推理,它会一步步算,而不是乱答。

二是大模型学会理解,你只要给到1-2个参考案例,它就能快速学习跟你同频,做到举一反三。

三是大模型知道共情,理解你的语言、风格和情绪,而不是像传统大语言模型一样死板的AI味。

第二大板块是产品定义层,一个上探提升型,一个是下限踱步层,

好的AI应该突破人的上限,而不是让AI变成单纯的对话机器人和执行小卡拉米。

科技应该让我们变得更好,而不是花时间做无谓的屎上雕花工作。

1. 上探提升型:扮演三大角色,成为个人提升的升维杠杆

一是作为前辈智者,基于它的更系统的能力体系来提升你的认知。

二是作为同辈能力相当的人,可以跟你并肩讨论和脑暴,给你一些灵感。

三是作为后辈帮你执行的人,让它快速收集信息、结论整理和内容生成,让用户从低效的工作中解放出来,让自己的时间、精力和心力最大化。

2.下限踱步层:扮演一大角色,沦为低质的对话机器人

什么叫低质的对话机器人?就是可以回答你的问题,但不会启发你的思维。听君一席话如听一席话,形式很足,本质无多大用处。

它不会怀疑你,不会引导你,更不会启发你,只是帮你把你现在正在做的、位于能力“下限”的工作,做得更快一点而已。

第三大板块是价值观层,不仅看智商,更要看人品

要判断AI的“人品”,可以问自己三个问题:

它的使命是什么?它是真的在创造伟大的产品,推动科技进步?还是只是追逐风口、捞一波快钱?

它靠什么挣钱?它是靠用户订阅,用市场倒逼产品迭代?还是靠别的模式,把用户当成了“产品”来卖?

它到底在为谁服务?它的每一次更新,是解决用户的真实痛点,还是在对资本讲一个动听的故事?

2. 如何做到人机合一?

人机合一是所有人都想达到的状态,人机合一的核心在于解决人和AI的角色问题。

很多人之所以用不好,主要有两大原因,一是本身AI能做的,非得要自己搞。二是AI搞不定的,非得强行来。

人机合一的本质在于各司其职:

人主要解决五大问题:好问题+好思路+好判断+去伪求真+去劣求优

AI主要解决三大问题:超级信息抓取+超级结论输出+超级内容生成

人的角色

1. 提出一个好问题

好的问题是答案的一半,因为好问题是解决大课题的切口,是思路是方向。

而这个问题,决定了工作的内容和结果的上限。它将一个模糊的大课题,转化为一个可执行的、有价值的切入点。

2. 提供一个好思路

这是实现路径的规划。如果说问题是“去哪里”,框架就是“怎么去”。人需要凭借经验和创造力,为AI规划出解决问题的核心步骤、策略组合与创新路径。

3. 做出一个好判断

这里的好判断分为两大板块,一是知道怎么调整,二是知道怎么结束。前者是你知道对方应该往什么方向,后者是你知道到什么程度才算交付。

方向调整:AI产出内容之后,需要判断其方向是否偏离、思路是否需要调整,并给出明确的优化指令。

结果定义:清晰地判断工作进展到何种程度才算“足够好”,符合交付标准,避免无限的、低效的修改。这里的足够好既是知道要达到什么结果,以及AI能达到什么结果。

4. 提纯之去伪求真

我经常去看信息源,信息源决定了内容的根本,看哪些信息是错误的。

要小心幻觉率,因为有的大语言模型是舔狗思维,为了佐证你的观点,然后虚拟数据来佐证。

5. 提纯之去劣求优

聪明的AI就像有sense的人一样,知道去哪里找到优质信息。不够聪明的AI,往往在一堆垃圾里面找金子。

所以你别看有些应用本身生态还不错,但要是模型本身不聪明的话,有金子也不会挑。

AI的角色

AI不是取代人,而是完善人,让人变得更好,这也是科技的本义所在。

科技是否向善,其实要看人怎么结合。

大语言模型的核心价值,是帮助我们突破在日常工作中的三大瓶颈,从根本上改变我们处理信息、分析问题和执行创造的方式。

1. 信息收集,从局部到全局

信息太碎片化了,我们的时间、精力和心力有限,所以很多时候的判断,是基于手头有限的、零散的信息来做判断。

而大语言模型可以极速阅读、理解和总结全世界全行业全领域的信息,提供的是全面、系统的宏观视角。可以弥补我们可能陷入信息不全的缺陷。

2. 分析洞察,从信息到结论

从一堆信息和数据找到规律和逻辑,过于依赖于专家的sense。

而大语言模型更能理清信息和数据背后隐藏的模式和关联,能帮助我们更快地发现问题的核心,找到事物发展的根本原因,从而提升我们分析问题的深度。

3. 内容生成,高效实现N轮的迭代

未来很多的部门和板块都将会是1+AI的逻辑,这个是1是leader,知道“切题+思路+调整+判断”,而这个AI就是基于框架的执行。

只要我们有基本思路和sense,AI就可以随意手搓,直到你满意为止。

很多时候,我们不也是跟人这样合作嘛,一稿二稿到N稿,那为什么不把这套人人合作的模式直接迁移到人机呢。

3. 用好AI需要避哪些坑?

很多人用不好AI,主要陷入六大误区。

1. 前提不对,努力白费

用AI,就要用这个世界最好的AI,如果本身用的AI不好,就以此认为AI的天花板就到这,那就是一叶障目不见泰山。

好的AI和差的AI真的天壤之别,不要因为用了不好的AI,就觉得AI也就那样了。

2. 怕麻烦的人,很容易被麻烦找上来

没门槛的事情,本身就不值得做。如果人人都可随意触及,那么这件事就很难做出亮点。

这里也是符合选择大于努力的思维,当多数人都选择的时候,我们就要谨慎了。

3. 骄傲的人,没有进步可言

骄傲的人没有敬畏,没有敬畏之心就没有更多的探索,也就丧失掉更多的可能性。

4. 花点钱,还是很值得的

我经常遇到朋友问的一个场景,这个东西需要花钱吗,我的常规回答就是免费的我不用。

我的观点是,免费才是最贵的,我们的时间、精力和心力更值钱,还有一个更值钱的,就是机会窗口。

5.一点都不准备的人,很难有大的收获

起心动念这个非常重要,有人把AI当成对话机器人,当成最简单的搜索,而我把AI当成智者。

生活中,当我们要见前辈时,还是需要做一些准备的。不然你都不知道如何问和如何答,自然也拿不到结果。

6. 不复盘,就永远得不到复利

传统的应试教育,一是缺乏提问,二是缺乏复盘。

不复盘就找不到盲点,抓不住经验,自然天花板就低。

4. 用好AI需要坚信哪些点?

1. 用这个世界上最好的AI

世界上最好的大学,很难考,世界上最好的AI,相对来说使用的门槛也会更高,主要是解决网络+注册+充值+使用的问题。

别小看每一个小关卡,它都可能像是一座大山,隔绝掉90%的人。

2. 花钱花钱花钱,一分钱一分货

太阳底下没有新鲜事儿,天下没有免费的午餐。大模型就要花钱买会员,不然体验不到它更强的能力。

聪明的人更会花钱:花钱买时间,花钱买效率,花钱买认知。

免费的东西是最贵的,因为它花了你的时间、精力和心力,最后却得不到你想要的结果,是事倍功半,而非事半功倍。

省钱≠聪明,舍得投入才有更高回报。

3. 对话10000遍再说

人总喜欢基于片段的信息做片段的理解。这年头认真的人少了,正如老话说的,熟读唐诗三百首,不会作诗也会吟。

很多人总喜欢拍脑袋做决定,因为这样非常简单,不需要思考。

但是在此之前需要问自己三个问题:自己用过多少个AI?和它们对话了多少次?复盘了多少次?

如果回答这三个问题本身没有底气的话,那就要想这个结论是不是能站住脚了。有些结论本身就带有成见,看似信誓旦旦,实则无力至极。

要想真正用好AI,就是要做上万次对话、不断试错、反复复盘。在这个过程中,你才能逐渐摸清它的长板与短板,才能建立属于自己的直觉和判断。认真的次数,本身就是竞争力。

对于普通人来说,先做量变再追求质变。

4. 找场景,疯狂测

很多人说AI“不落地”,原因往往有两点:一是没找到合适的AI,二是没把它放到真实场景里去测试。

AI的价值,不在炫技,而在解决实际问题。很多人觉得AI不行,但其实他们又真正沉下心来用AI,真正花时间来调AI,真正复盘来梳理人和AI的交互呢。

5. 复盘复盘再复盘

新事物没有沉淀出通用方法论,要想快速理解AI,就要不断高频复盘。

每一次的复盘,都是实操的更进一步。复盘得越多,踩过的坑就越少,下次用起来就越顺手。久而久之,这些经验就变成了你的护城河。

会用是一回事,能沉淀下来,变成自己的方法论,才是真本事。

我们的功力,在于我们的每一次复盘迭代。新事物,我们不可能有20年的功力,但我们可以努力有20万次的迭代。

6. 用,马上用,找到自己的AISOP

出来混,首先要出来,要学车,就直接去开车。说一千道一万,不如自己下场干一干。

在动手的时候,不要想着凭空造一套新流程。其实大多数工作早就有自己的SOP,你要做的只是:把AI融进去,替代掉原来费时费力的环节,或者补上原来做不到的环节。

AISOP= 传统SOP + AI助力。只有把AI变成流程的一部分,它才真正成为生产力,而不是“玩具”。

用好AI的最高境界,不是收藏了多少神级指令,而是构建了多少条属于你自己的、高效的AI SOP。因为前者是别人的经验,而后者,是你自己可复制、可规模和可持续的壁垒。

总结:

很多人用不好AI,不是不够聪明,而是一开始就认知不对。在认知不对的前提下,再多的努力都是白费。

而要真正沉淀出适合自己的方法论,就需要在成千上万次的练习中不断总结迭代。

参与讨论

回到顶部