人工智能学习可视化广泛的数据集

人工智能学习可视化广泛的数据集 2023-02-01 09:16:22 1033

易百纳社区

使用 Matlab 间谍函数可视化实验数据集的相似性矩阵 P,其中行和列按手动聚类标签排序。蓝点表示矩阵中的 1,白点表示 0。由于分辨率有限,这些数字显示了统一的子样本10%的数据点

芬兰人工智能中心的研究人员开发了一种新的人工智能算法,旨在尽可能清晰地可视化数据集。该项目表明,算法独立选择的解决方案通常非常接近人类最常青睐的解决方案。

人类大脑具有惊人的能力,甚至可以从大量的视觉信息中观察特征。例如,这种能力用于研究大数据,其内容必须压缩成 人类智能可以理解的形式。这种降维问题是可视化分析的核心。

在芬兰人工智能中心(FCAI),隶属于阿尔托大学和赫尔辛基大学的研究人员测试了最著名的可视化分析方法的功能,发现当数据量显着增长时,没有一种方法有效。例如,当观测数量达到数十万时,t-SNE、LargeViz和UMAP方法不再能够区分数据中观测分组的极强信号。该研究发表在《统计与计算》杂志上。

希格斯玻色子数据激发了新算法的创建

例如,与发现希格斯玻色子相关的实验数据集包含超过11万个特征向量。

“从它们中提取的可视化就像一团纱线,没有揭示数据中包含的粒子行为的显着特征,”赫尔辛基大学的统计和概率教授Jukka Corander说。

“这一发现为开发一种新方法提供了动力,该方法利用类似于现代AI方法进行神经网络计算的图形加速。

研究人员设计的人工智能算法旨在可视化,以便数据集群和其他人类易于观察和理解的宏观特征尽可能独特。

在该项目中,几名志愿者测试了该技术。事实证明,算法独立选择的解决方案通常非常接近人类最常青睐的解决方案;在这种情况下,根据个人观念,人类智能清楚地区分了由类似观察组成的数据集群。当将该技术应用于希格斯玻色子数据时,它们最重要的物理特征被清楚地突出了。

“这是可视化分析领域名副其实的巨大飞跃。除了比以前的方法快几个数量级外,我们的技术在具有挑战性的应用中也更加可靠,“Corander说。

在Corander团队的指导下,还设计了一个单独的界面,以便在基因组学应用中尽可能有效地利用该技术。这样,用户甚至可以通过将文件直接上传到 Web 浏览器来交互式分析他们的数据集。这项进一步的研究利用全球细菌和SARS-CoV-2数据集,说明了如何使用新工具快速检查多达数百万个基因组并确定相关特征。

这项研究是FCAI主任Sami Kaski教授和Jukka Corander小组之间的合作。挪威科技大学杨志荣教授担任项目负责人。杨教授拥有阿尔托大学的博士学位,随后在阿尔托大学和赫尔辛基大学担任科兰德教授小组的研究员。

声明:本文内容由易百纳平台入驻作者撰写,文章观点仅代表作者本人,不代表易百纳立场。如有内容侵权或者其他问题,请联系本站进行删除。
红包 1 1 评论 打赏
评论
0个
内容存在敏感词
手气红包
    易百纳技术社区暂无数据
相关专栏
置顶时间设置
结束时间
删除原因
  • 广告/SPAM
  • 恶意灌水
  • 违规内容
  • 文不对题
  • 重复发帖
打赏作者
易百纳技术社区
您的支持将鼓励我继续创作!
打赏金额:
¥1易百纳技术社区
¥5易百纳技术社区
¥10易百纳技术社区
¥50易百纳技术社区
¥100易百纳技术社区
支付方式:
微信支付
支付宝支付
易百纳技术社区微信支付
易百纳技术社区
打赏成功!

感谢您的打赏,如若您也想被打赏,可前往 发表专栏 哦~

举报反馈

举报类型

  • 内容涉黄/赌/毒
  • 内容侵权/抄袭
  • 政治相关
  • 涉嫌广告
  • 侮辱谩骂
  • 其他

详细说明

审核成功

发布时间设置
发布时间:
是否关联周任务-专栏模块

审核失败

失败原因
备注
拼手气红包 红包规则
祝福语
恭喜发财,大吉大利!
红包金额
红包最小金额不能低于5元
红包数量
红包数量范围10~50个
余额支付
当前余额:
可前往问答、专栏板块获取收益 去获取
取 消 确 定

小包子的红包

恭喜发财,大吉大利

已领取20/40,共1.6元 红包规则

    易百纳技术社区