当前AI的“瓶颈”

  • 现状 (人类数据时代): 现在最厉害的大模型,都是靠“吃”网上能找到的海量人类产生的文字、图片、视频来学习的,就像读别人写的书、看别人画的画。之后还要经过人类的“调教”,告诉它哪些答案更好。
  • 撞墙了:
    • 高质量“食材”快吃光了: 网上真正优质、有用的文本数据快被用完了。新找到的数据,能带来的提升越来越小(边际效益递减)。
    • 只会模仿,不会创造: 这些模型只是学会预测“人类下一个词会说什么”,或者模仿人类的偏好。它们像“复读机”,很难产生真正突破性的新知识或理解世界运行的根本原理。
    • “越大越笨”?: 最近发现,即使模型变得超级巨大,带来的进步也越来越有限了(规模壁垒)。

解决方案:迈向“经验时代”

要突破这个瓶颈,AI需要像婴儿学走路运动员踢球一样学习:

  • 核心转变:从“吃现成”到“自己动手”
    • 与环境互动: AI智能体(可以想象成一个小程序或机器人)需要在真实世界或高仿真的模拟环境主动行动
    • 获取“一手经验”: 通过自己的“感官”(传感器)接收环境的反馈(比如:按了这个按钮,灯亮了;踢了这个角度,球进了),而不是只读人类写的“说明书”。
    • 环境是“老师”: 学习目标不再是模仿人类偏好,而是理解和预测环境的反馈,特别是那些代表“奖励”的信号(比如:游戏得分、完成任务、避免碰撞)。
    • 建立“世界模型”: 在互动中,AI会自己构建对世界如何运作的理解(比如:重力、摩擦力、物体关系),就像婴儿慢慢理解“松手东西会掉”。
    • 数据“越学越多”: 这种学习方式最大的优势是,AI越聪明,它探索世界的能力越强,能获得的经验和数据就越多、质量越高,形成一个良性循环,不像静态的人类数据会枯竭。

技术基础:强化学习

  • 成功案例: AlphaGo下围棋(通过和自己下棋模拟学习)、AlphaZero玩各种棋类、机器人控制。AlphaGo那个著名的“神来之手”(第37步)就是通过模拟大量可能走法(经验)自己“悟”出来的,不是模仿人类棋谱。
  • 未来方向: 需要开发能持续学习、永不停止进步的新算法,让AI能像上面说的那样,不断从与环境的互动中学习提升。

超越技术:社会治理的启示

  • 反对“一刀切”中心化控制:
    • 很多人因为害怕AI失控,呼吁集中控制、设定单一目标、甚至暂停研究。这就像历史上因为恐惧而试图控制人类思想、贸易、行为的思路一样,会扼杀创新和活力
  • 推崇“去中心化合作”:
    • 多元目标: 让不同的AI智能体(以及人类)拥有各自不同的目标(就像不同的人有不同的追求)。
    • 合作共赢: 通过设计好的规则(像市场机制、法律),让这些拥有不同目标的个体能够互动、交易、协作,最终实现互利共赢(双赢),共同促进整个系统的发展。
    • 韧性与活力: 这种模式更灵活、更有韧性(一个地方出问题不会全崩),能更好地抵抗作弊者和僵化,保持创新活力。
  • 人类的“超能力”是合作: 人类文明的伟大成就(经济、科技、文化)都源于成功的合作(虽然也常有战争等合作失败)。未来的AI治理和人类-AI共生,应该借鉴人类合作成功的经验,建立支持多元化目标和去中心化合作的制度框架
  1. AI升级之路: 当前靠“啃老本”(人类数据)的AI已到极限,必须升级到**“自己动手探索世界”**(经验学习)的模式。
  2. 学习的本质: 真正的智能像婴儿或运动员,在**“感知->行动->反馈”** 的循环中,通过第一手经验自我成长。
  3. 技术已证明: 强化学习(如AlphaGo)已展示从模拟经验(下棋)过渡到现实经验(更复杂世界)的可行路径。
  4. 未来靠“内驱力”: 未来AI将依赖环境反馈的自生奖励和自己构建的世界模型,实现永续自我提升
  5. 治理的智慧: 恐惧驱动的集中管控会扼杀创新包容多元目标、鼓励去中心化合作共赢,才是人类与AI共同繁荣的制度根基
  6. 长期主义: 实现超级智能和完美人机共生是场几十年甚至更久的马拉松,成功关键在于持续学习算法开放共享的生态

现在的AI是“纸上谈兵”的书呆子,未来的AI要成为“实践出真知”的实干家,而且世界需要允许和鼓励这些实干家们各有追求、相互合作,才能共同进步繁荣。

你可能感兴趣的:(人工智能)