新开发的算法教授机器人自主学习

新开发的算法教授机器人自主学习 tomato 2023-03-14 13:50:59 397

易百纳社区

南加州大学维特比信息科学研究所的研究人员正在开发一种算法,可以教机器在没有人监督的情况下学习。

南加州大学维特比信息科学研究所(ISI)研究负责人Mohammad Rostami表示:“一般来说,机器学习是一门教机器模仿人类行为的科学。”

Mohammad Rostami解释了机器学习通常是如何完成的:“我们收集由人类注释的数据,然后教机器如何在给定数据的情况下与人类相似。我们遇到的问题是,机器获得的知识仅限于用于训练的数据集。”此外,用于训练的数据集在训练过程完成后通常不可用。

由此带来的挑战是什么?如果机器接收到的输入与它所训练的数据有很大的不同,那么机器就会感到困惑,不会像人类那样行动。

Rostami提供了一个例子,“狗的种类很多,不同类型的狗在视觉上不太相似,而且种类也很丰富。如果你训练一台机器对狗进行分类,那么它的知识仅限于你用来训练的样本。如果你有一种新的狗类别,但它不在训练样本中,那么机器将无法得知它是一种新类型的狗。”

人类比机器更擅长这一点。当给人类一些分类的东西时,如果只给他们一个新类别(即一种新品种的狗)的几个样本,他们就会调整并学习这个新类别是什么。Rostami说,“一个六岁的孩子可以使用两个、三个或四个样本学习一个新类别,而大多数现代机器学习技术需要至少几百个样本才能学习该新类别。”

如果机器在训练中学习了一个类别,然后随着时间的推移,它经历了一些变化(即,添加了一个新的子类别),Rostami希望通过他的研究,机器能够学习或扩展该类别的概念(即,包括新的子类)。

类别的变化本质就是所谓的“概念转变”。类别的概念随着时间的推移而变化。Rostami提供了另一个真实的例子:垃圾邮件文件夹。

他解释说,“你的电子邮件服务有一个模型,可以将你的收件箱电子邮件分类为合法电子邮件和垃圾邮件。它经过训练,可以使用某些功能识别垃圾邮件。例如,如果电子邮件不是发给你个人的,那么很可能是垃圾邮件。”

Rostami继续说道,“这意味着‘垃圾邮件’的定义会随着时间的推移而改变。这是一个依赖于时间的定义。概念是一样的,你有‘垃圾邮件’这个概念,但随着时间的流逝,概念的定义和细节会改变。这就是概念的转变。”

在他的论文中,Rostami开发了一种训练机器学习模型的方法,以解决这些问题。

由于原始训练数据并不总是可用的,Rostami的方法并不依赖这些数据。共同作者兼ISI首席科学家Aram Galstyan解释道,“该模型学习了旧数据在潜在空间中的分布,然后可以生成潜在表示,就像通过学习旧数据的表示来生成合成数据集一样。”

因此,该模型可以保留在初始训练阶段所学的内容,这允许它随着时间的推移适应和学习新的类别和子类别。

重要的是,这也意味着它不会忘记原始训练数据或从中学习到的内容。这是机器学习中的一个主要问题。Galstyan解释道,“当你训练一个新模型时,它会忘记以前有用的一些模式。这就是所谓的灾难性遗忘,”Galstyan说。

通过本文提出的方法,Galstyan表示“灾难性遗忘被隐式解决,因为我们引入了旧数据分布和新数据分布之间的对应关系。因此,我们的模型不会忘记旧数据分布。”


声明:本文内容由易百纳平台入驻作者撰写,文章观点仅代表作者本人,不代表易百纳立场。如有内容侵权或者其他问题,请联系本站进行删除。
tomato
红包 点赞 收藏 评论 打赏
评论
0个
内容存在敏感词
手气红包
    易百纳技术社区暂无数据
相关专栏
置顶时间设置
结束时间
删除原因
  • 广告/SPAM
  • 恶意灌水
  • 违规内容
  • 文不对题
  • 重复发帖
打赏作者
易百纳技术社区
tomato
您的支持将鼓励我继续创作!
打赏金额:
¥1易百纳技术社区
¥5易百纳技术社区
¥10易百纳技术社区
¥50易百纳技术社区
¥100易百纳技术社区
支付方式:
微信支付
支付宝支付
易百纳技术社区微信支付
易百纳技术社区
打赏成功!

感谢您的打赏,如若您也想被打赏,可前往 发表专栏 哦~

举报反馈

举报类型

  • 内容涉黄/赌/毒
  • 内容侵权/抄袭
  • 政治相关
  • 涉嫌广告
  • 侮辱谩骂
  • 其他

详细说明

审核成功

发布时间设置
发布时间:
是否关联周任务-专栏模块

审核失败

失败原因
备注
拼手气红包 红包规则
祝福语
恭喜发财,大吉大利!
红包金额
红包最小金额不能低于5元
红包数量
红包数量范围10~50个
余额支付
当前余额:
可前往问答、专栏板块获取收益 去获取
取 消 确 定

小包子的红包

恭喜发财,大吉大利

已领取20/40,共1.6元 红包规则

    易百纳技术社区