很多人让我聊一个气球,通过一个气球去测试美国的含纸量,这个话题没有意义。

你当个热点去讲相声可以,分析什么长久意义,实在是……

近期和美国有关的,真正值得看的话题,是chatGPT,很多人可能还没有用过。

外网用户已经上亿了。

这个东西是什么呢?是聊天器?是人工智能?

很多大V其实自己都没有用过,他就是互联网上随便搜了点素材,人云亦云的胡扯。

于是分为两个极端,一个说就是陪你聊天的,类似天猫精灵,小爱同学;另一种则吹成人工智能的高级形态。

我用过,用了很久,就像沉迷于游戏那样反复测试。我的感觉,它是一个未来能够辅助工作的人工智能搜索引擎。

就我的感觉,假以时日,随着大规模测试,数据的投喂,它有可能取代重复性很高的那些低端白领岗位。

我们讲一下搜索引擎的发展阶段。

第一个阶段是图书馆,你按照书名,按照目录去查索引,这就是我小时候那个时代找资料的方式。

我出生的那个年代,多数同学家里一本课外书都没有,因为再往前一个时代,很多私人藏书都被烧了。

所以那是一个空档期。

我家里不要说此前留下的藏书,民国时期的,清代的,不要说这些,即便是我自己日后买过的各种书,学习相关的,学习无关的,那些书的原价可以在我高三毕业后直接买房了。

一方面固然是那时候房价极低,另一方面是我确实有过很多书。

后来高晓松弄了一个晓书馆,问很多人搜罗了大量曾经有过,又逐渐遗失的书,我去两回,里面的绝大部分的书,我小时候都读过,因为我自己有。

很多很好的书,线状的,限量的,手抄的,90年代末就卖给收破烂的了,早知道有人要办图书馆,该捐给人家。

你今天去看某些教授晒书房,晒书,本质上他在晒什么?晒传统时代的搜索引擎优势。

在一个没有互联网的年代里,有私人图书馆的那个人,是吊打没有的那个人的,信息不对称原理。

没有私人图书馆的那个人,他是需要靠背诵全文的。反过来,如果你有,就不需要背全文,你背个索引就可以了。

就像开卷和闭卷的难度区别。

人脑的价值不在于你能记住多少事实,而在于你能思考。创新源自思考。

这句话在我们传统的死记硬背且没有互联网的时代你未必能真的理解它的价值。

问题是,互联网很快到来了。

从99年开始,一个人的信息获取能力,很大程度上取决于他会不会用互联网。

那个年代,就是2000年初读研的人,教授都会告诉你首先要训练自己查资料的能力,他是特指通过互联网。

会用互联网和不会用,效率差太多。

你想想,我小时候就是索引式学习,刚18岁就有了互联网搜索引擎,所以搜索引擎实际上就变成了我人体器官的一部分了。

它相当于什么?相当于我的数据库。而数据库的索引,我全记住了。

我到今天,提起钢笔,连字都不会写,除了会签名,绝大多数字怎么写都忘记了,只能拿起手机打出来,然后抄。

这就是我大脑的状态,实际上它只剩逻辑段和索引,它必须接入互联网引擎这个数据库,才能正常运行。

再往后,又10年过去,到十几年前,我已经做架构师了。

这个时候,我大脑里的很多逻辑段,都被我模块化了。你可以认为我的大脑逻辑段被拆分成了虚函数和实例化。

那些实例化模块,是由我的下属来做的,换句话说,我的身体上又开始挂钩很多触角,这些触角是人类。

我用自己的大脑去控制这些触角,再关联到互联网这个数据库当中。

如果你是码农,你去观察你们公司的架构师都是这样工作的。

他们不会去填模块,因为填模块是一种重复性劳动,就像建筑师并不会真的去砌墙一个道理。

但这种模式,效率还是很低。因为人类之间的沟通成本太高了。

说白了就是人,远远不如机器好用。

人类之间的沟通损耗极大,3个人的效果绝对不是1个人的三倍,能两倍就很好了。而10个人,也许还不到两倍。人越多,越复杂,瓶颈越明显。

这就是人月神话告诉你的软件工程问题,堆人堆着堆着就到极限了,你跨不过去的,再多人都跨不过去。

一个孕妇10个月能生孩子,10个孕妇没办法1个月就生孩子。

所以需要怎么样?需要把那些能够拆分出去的逻辑段,进一步的训练电脑来完成。

我们需要电脑不仅仅像传统搜索引擎一样是个数据库了,它还得自己能搜索。并且通过搜索的过程不断学习提高自己的搜索能力,以便成为人类的好助手。

chatGPT目前的状态,可以给你写辅助代码,可以给你写周报,可以给你做大量的文书工作。

但是还有缺陷,它无法呈现最终版,你还是需要微操,修改,并且注入亮点。

这已经很牛了,低端白领文员的工作岗位,在它面前,岌岌可危。

你要知道,它会学习的呀,24小时不停的学,上亿人训练它学。玩的人越多,它成长越快。

人类的水平是参差不齐的,两百万白领文员不可能能力一致,而chatGPT就像三体人一样,一旦达到某个水准,从此只高不低。

而且不休息,永无止境的学习进步。

我知道你们要问什么,一个伦理问题。

但是我们不聊这个,没意义,就像海啸来了,你讨论海啸对不对,没意义。

如果你自己是从事重复性工作的,天花板很低的,前景不好的,你自己要有危机感,你要清楚,什么才是未来十年AI暂时还做不了的。

就像那天我说的,即便你不是刚需,你不是改善,有时候为了资产安全,你也得换房子,只是为了换个板块。

我今天关注的重点是产业,国内和国外的这块产业。

我们有两个不利,一个有利。

先说有利的,有利于我们的是,咱人多,网民多。一旦咱们有了这东西,我们的喂养速度可能比西方快。

但是我们有两个不利的,一个在于芯片。

美国铁了心要在这个领域全面卡我们。芯片影响了算力,算力直接影响我们在AI领域的速度。

人类自图灵时代就开始探索AI了,AI和人有个最大的不同在于无论上层算法有多么拟人化,底层的机器语言始终是01。

换句话说,AI是用暴力算力在解决问题。那么芯片就很重要,它是算力的承载。

第二个不利在于资料数据库,你不得不承认,绝大多数搜索的,已知的人类文明的数据库,都是以英文的方式储存的。

那我们的用户如果用AI,自己用的语言是中文。这中间翻来翻去,是有很多文化差异的。

简单问题你感觉不出来,但是专业问题你就会发现文化差异了。美联储讲话里面也许暗含了一个英文素材库里的东西,你让它强翻成中文,没有对应的典故。

就像亢龙有悔翻成英文,字还在,意思不在了。

这两个不利是要尽快克服的,当然我相信我们能够克服。

如果说技术演进是一朵花,那么需求就是浇灌它的水。失去国内这么庞大的市场需求,国际芯片巨头的研发都会受阻。

技术人员不是闭门造车的,是根据需求来的。

这部分转移的需求都到了国内芯片厂商身上,所谓舞台有了,现在就指着他们快速迭代,突破别人的技术限制。

现在数据库都是英文的,这事儿要复杂得多。但是,归根结底,这是一个计算量问题,能用量解决的问题,长期来看,就不是问题。因为AI就是干这个的。

换句话说,AI可以在自学习的过程中,顺便去解决影响它效果的桎梏之一。

那么到了下一个阶段,我们海量网民的优势才能得以发挥出来。

这样才能真正做到无论谁起得头,我们都能成为最后摘桃子的集大成者。