第1章 引论
1.2 大群体模型和匹配模型
本书研究学习理论,如果要发生学习,参与人必须重复进行相同或者相关的博弈才可能从中学到一些东西。迄今为止,大多数有关学习理论的文献集中研究重复进行的相同博弈,而不是更为复杂的问题,即两个博弈足够相似以至于一个博弈的结果对另外一个博弈有���示作用。我们也将避免讨论这个问题,尽管我们认为关于参与人在他们认为是相似的博弈中类推的假设是学习理论与真实世界相关的重要原因。
为了集中思考,我们从分析两人博弈(two-player games)开始。研究学习模型的一个自然起点是想像两个参与人重复进行两人博弈,并试图通过观察过去的行动学习预测另外一个参与人的未来行动。我们称之为固定参与人模型(fixed—player model)。然而,在这种情况下,参与人不仅应该考虑其对手在未来将如何行动,而且应该考虑他们当前的行动影响其对手未来行动的可能性。例如,参与人可能认为,如果他们是友好的,他们的对手也将采取友好的行动作为回报。或者他们会通过重复采取一个行动“教导”(teach)他们的对手对这一特定行动做出*优反应。
……