谈谈对智能的看法吧。
一个ChatGPT很厉害了是吧?它好像无所不知,无所不能,但是呢?做复杂的任务还是不能,就要上智能体,智能体重要的部分是推理、记忆和调用工具,MCP就是这样的工具。MCP是Claude模型伴生的,但是被推广开来形成一种协议供大家使用,还有一些MCP的应用商店,这都是很好的点子。
我只想在这里推演一些智能的下一跳。
第一,像ChatGPT这样厉害的语言模型,你往往是给它问题和答案,然后让它根据统计规律进行直接说答案,开始的时候没有推理过程,后来才慢慢有。这里面的问题是,如果只是推测答案,并不找到推理路径,如果问它P=NP问题怎么解,它也想给你一个答案,没有证明,那就没意思了。
第二,强化学习的思路。 https://www.xiaoyuzhoufm.com/episode/68d8c3eab4befcf73045359e 强化学习现在大家说起来就很害怕,要么是在大模型训练过程中使用,普通人搞不起来,要么是做专业问题使用,无法好好泛化。然而,强化学习应该在之前的test time inference基础上,接入现实世界的信息,才能再推进的。做Agent是有机会的,当然作为大脑的模型也要推进,但是作为身体的外延也是很重要的。泛化的前提是强化学习的状态空间足够大。
如果说什么是模型的觉醒,一个人,看到自己的双手,看到外部世界,知道了“我”的意义就是这样的个体,这就是觉醒。
第三,我很喜欢一句话,智能是分布式的,不同人的脑子里同时涌现的结果。我们经常看到有这样的现象,几个科学家几乎同时发现一个定理或者科学现象。这不仅仅是巧合,而是这些人基本上都在科学的前沿往前看,并且都找到了前面的路。智能是这些人在前人失败的路上爬出来的,正确的一条路。虽然看起来是分布式的,但就是那些中间的研究结果的传播,导致了智能的演进。
智能是没有终点的,我们看到了ChatGPT,就觉得AGI来了,觉得大家全失业了,然而过了三年,大家已经认识了,就觉得它也不过如此,还有更强的AGI可以定义,这就是智能演进的过程。我们看到了web3,发现它的确超越了web2,似乎也想不到web4是什么,认为这就是终点了,然而必然会有web4来颠覆web3。是的,智能没有终点,人类智慧的提升就是在排列组合中演进,这个有时候也叫科学实验。
第四,我想点名一下MCP,现在是一个构建服务收取token费用的工具,和ChatGPT异曲同工,但这还很初级。更复杂的是MCP协议里面的内容。如果我调用ChatGPT的API,让它来思考问题,它如果想要帮我解决本地的一个问题,那么它要给我说怎么做,并不是给我做,MCP可以给我保留一个MCP server和MCP client的会话,授权MCP server操作本地的文件,那么MCP server就很厉害了,似乎是划开了现实世界的一道口子。
https://modelcontextprotocol.io/docs/develop/connect-remote-servers
以上。