新开发的算法教授机器人自主学习_专栏

易百纳社区

南加州大学维特比信息科学研究所的研究人员正在开发一种算法，可以教机器在没有人监督的情况下学习。

南加州大学维特比信息科学研究所（ISI）研究负责人Mohammad Rostami表示：“一般来说，机器学习是一门教机器模仿人类行为的科学。”

Mohammad Rostami解释了机器学习通常是如何完成的：“我们收集由人类注释的数据，然后教机器如何在给定数据的情况下与人类相似。我们遇到的问题是，机器获得的知识仅限于用于训练的数据集。”此外，用于训练的数据集在训练过程完成后通常不可用。

由此带来的挑战是什么？如果机器接收到的输入与它所训练的数据有很大的不同，那么机器就会感到困惑，不会像人类那样行动。

Rostami提供了一个例子，“狗的种类很多，不同类型的狗在视觉上不太相似，而且种类也很丰富。如果你训练一台机器对狗进行分类，那么它的知识仅限于你用来训练的样本。如果你有一种新的狗类别，但它不在训练样本中，那么机器将无法得知它是一种新类型的狗。”

人类比机器更擅长这一点。当给人类一些分类的东西时，如果只给他们一个新类别（即一种新品种的狗）的几个样本，他们就会调整并学习这个新类别是什么。Rostami说，“一个六岁的孩子可以使用两个、三个或四个样本学习一个新类别，而大多数现代机器学习技术需要至少几百个样本才能学习该新类别。”

如果机器在训练中学习了一个类别，然后随着时间的推移，它经历了一些变化（即，添加了一个新的子类别），Rostami希望通过他的研究，机器能够学习或扩展该类别的概念（即，包括新的子类）。

类别的变化本质就是所谓的“概念转变”。类别的概念随着时间的推移而变化。Rostami提供了另一个真实的例子：垃圾邮件文件夹。

他解释说，“你的电子邮件服务有一个模型，可以将你的收件箱电子邮件分类为合法电子邮件和垃圾邮件。它经过训练，可以使用某些功能识别垃圾邮件。例如，如果电子邮件不是发给你个人的，那么很可能是垃圾邮件。”

Rostami继续说道，“这意味着‘垃圾邮件’的定义会随着时间的推移而改变。这是一个依赖于时间的定义。概念是一样的，你有‘垃圾邮件’这个概念，但随着时间的流逝，概念的定义和细节会改变。这就是概念的转变。”

在他的论文中，Rostami开发了一种训练机器学习模型的方法，以解决这些问题。

由于原始训练数据并不总是可用的，Rostami的方法并不依赖这些数据。共同作者兼ISI首席科学家Aram Galstyan解释道，“该模型学习了旧数据在潜在空间中的分布，然后可以生成潜在表示，就像通过学习旧数据的表示来生成合成数据集一样。”

因此，该模型可以保留在初始训练阶段所学的内容，这允许它随着时间的推移适应和学习新的类别和子类别。

重要的是，这也意味着它不会忘记原始训练数据或从中学习到的内容。这是机器学习中的一个主要问题。Galstyan解释道，“当你训练一个新模型时，它会忘记以前有用的一些模式。这就是所谓的灾难性遗忘，”Galstyan说。

通过本文提出的方法，Galstyan表示“灾难性遗忘被隐式解决，因为我们引入了旧数据分布和新数据分布之间的对应关系。因此，我们的模型不会忘记旧数据分布。”

新开发的算法教授机器人自主学习