学习与游戏

John Holland:

对荷兰德来说,进化和学习似乎与游戏非常相似。他认为,在这两种情况中,都有一个作用者在与自己的环境对抗,为自己的继续发展争取足够的条件。在进化中,所获报酬就是生存,一个让作用者将基因遗传给下一代的机会。在学习中,所获是某种奖赏,比如食物、愉悦的感觉或情感的满足。在这两种情况下,所获(或所缺)都是给予作用者的一种反馈,以利于它们改进自我表现:如果作用者想获得使自己“适应”的能力,就不得不采取能够获得丰厚报酬的策略,放弃其它策略。

  荷兰德不禁想起塞缪尔的跳棋下法程序,这个程序正是利用了这种反馈:它可以随着不断吸取经验和更多地了解对方而经常改变战术。但现在荷兰德开始认识到塞缪尔将注意力放在游戏上是多么具有先见之明了。游戏的这一相似性似乎可以解释任何适应性系统。在经济中,所获是金钱,在政治中,所获是选票,等等。在某种程度上,所有这些适应性系统在根本上都是一样的,这反过来又意味着,所有这些系统从根本上就像下跳棋或象棋一样:可能性的空间大得难以想象。一个作用者不断改进下棋技术,这便是适应。但要想寻找到这场游戏的最佳化和稳定的均衡点,就好比下国际象棋一样,你根本就无法穷尽其无限的可能性。

  ……对荷兰德来说,进化的实质是旅程,是无穷无尽地展现出来的惊异。