深度学习促进了计算机视觉的发展_专栏

自从人工智能诞生之初，计算机科学家就一直梦想制造出可以像我们一样看到和理解世界的机器。这些努力导致了计算机视觉的出现，计算机视觉是AI和计算机科学的一个广阔领域，致力于处理视觉数据的内容。

近年来，由于深度学习和人工神经网络的进步，计算机视觉取得了巨大的进步。深度学习是AI的一个分支，特别擅长处理图像和视频等非结构化数据。

这些进步为在现有领域中促进计算机视觉的使用以及将其引入新领域铺平了道路。在许多情况下，计算机视觉算法已成为我们每天使用的应用程序中非常重要的组成部分。

关于计算机视觉当前状态的几点说明

在对计算机视觉的发展感到兴奋之前，了解当前AI技术的局限性很重要。尽管取得了巨大的进步，但我们距离计算机视觉算法还远未到，后者可以像人类一样理解照片和视频。

就目前而言，深度神经网络（计算机视觉系统的肉和土豆）非常擅长在像素级别匹配模式。它们在分类图像和定位图像中的对象方面特别有效。但是，当要理解视觉数据的上下文并描述不同对象之间的关系时，它们将惨遭失败。

该领域的最新工作表明了计算机视觉算法的局限性以及对新评估方法的需求。尽管如此，计算机视觉的当前应用显示了仅使用模式匹配可以完成多少工作。在本文中，我们将探讨其中的一些应用程序，但还将讨论它们的局限性。

计算机视觉的商业应用

您每天都在使用计算机视觉应用程序，在某些情况下可能没有注意到它。以下是使生活变得有趣和便捷的计算机视觉的一些实用和流行的应用程序。

图片搜寻

计算机视觉取得了巨大进步的领域之一是图像分类和物体检测。经过足够标记数据训练的神经网络将能够以惊人的精度检测并突出显示各种物体。

很少有公司能够与Google庞大的用户数据存储相匹配。该公司一直在使用其几乎无限（并且正在不断增长）的用户数据存储库来开发一些最高效的AI模型。当您在Google相册中上传照片时，它会使用其计算机视觉算法对场景，物体和人物的内容信息进行注释。然后，您可以根据此信息搜索图像。

例如，如果您搜索“狗”，则Google会自动返回您图书馆中包含狗的所有图像。

Google会使用机器学习和计算机视觉来搜索图像的内容，即使您没有标记它们。

但是，Google的图像识别并不完美。在一次事件中，计算机视觉算法错误地将两张皮肤黝黑的人的照片标记为“大猩猩”，给公司带来了尴尬。

Google还使用计算机视觉从库，云端硬盘和Gmail附件中的图像中提取文本。例如，当您在收件箱中搜索术语时，Gmail还将在图像中查找文本。不久前，我在Gmail中搜索了家庭住址，并收到了一封带有图片附件的电子邮件，其中包含带有我的地址的亚马逊包裹。

图像编辑和增强

现在，许多公司正在使用机器学习来自动增强照片。Google的Pixel手机系列使用设备上的神经网络进行自动增强，例如白平衡，并添加效果，例如模糊背景。

智能计算机变焦是计算机视觉技术的一大进步。传统的缩放功能通常会使图像模糊，因为它们通过在像素之间进行插值来填充放大的区域。基于计算机视觉的缩放不是放大像素，而是着重于边缘，图案等功能。这种方法可产生清晰的图像。

许多初创公司和历史悠久的图形公司已转向深度学习来增强图像和视频。Lightroom CC中的Adobe 增强细节技术利用机器学习来创建更清晰的缩放图像。

Adobe使用深度学习来增强缩放图像的细节。

图像编辑工具Pixelmator Pro运动ML超分辨率功能，它使用卷积神经网络提供清晰的缩放和增强。

面部识别应用

直到不久前，面部识别技术还是一项笨拙且昂贵的技术，仅限于警察研究实验室。但是近年来，由于计算机视觉算法的进步，面部识别已进入各种计算设备。

iPhone X引入了FaceID，这是一种身份验证系统，它使用设备上的神经网络在看到拥有者的脸部时将手机解锁。在设置过程中，FaceID在所有者的脸上训练其AI模型，并在不同的光照条件，面部毛发，理发，帽子和眼镜下正常工作。

在中国，许多商店现在使用面部识别技术，为顾客提供更流畅的支付体验(但代价是他们的隐私)。顾客无需使用信用卡或移动支付应用，只需对着装有电脑视觉系统的摄像头露出脸即可。

尽管取得了进步，但是，当前的面部识别并不完美。AI和安全研究人员发现了多种导致面部识别系统出错的方法。在一个案例中，卡内基梅隆大学(Carnegie Mellon University)的研究人员表明，戴上特制眼镜，他们可以欺骗面部识别系统，让它们误以为自己是名人。

数据高效的家庭安全

随着物联网（IoT）的混乱发展，连接互联网的家庭安全摄像头日益普及。现在，您可以随时轻松地安装监控摄像头并在线监视你的家。

每个摄像机都会向云端发送大量数据。但是，安全摄像机记录的大多数镜头都是不相关的，从而导致网络，存储和电力资源的大量浪费。计算机视觉算法可以使家庭安全摄像机在使用这些资源时变得更加高效。

智能相机保持闲置状态，直到它们在视频源中检测到物体或移动，然后才可以开始将数据发送到云或向相机的所有者发送警报。但是，计算机视觉仍然不能很好地理解物体。因此，不要指望它会在正常运动（例如，球在房间内滚动）和需要注意的事物（例如，小偷闯入您的房屋）之间区分开来。

与现实世界互动

在过去的几年中，增强现实（将现实世界的视频和图像与虚拟对象重叠的技术）已成为一个增长的市场。AR的大部分扩展归功于计算机视觉算法的发展。AR应用程序使用机器学习来检测和跟踪目标位置和放置虚拟对象的对象。您可以在许多应用程序中看到AR和计算机视觉的结合，例如Snapchat过滤器和Warby Parker的Virtual Try-On。

计算机视觉还使您可以通过手机摄像头的镜头从现实世界中提取信息。Google Lens是一个非常出色的例子，它使用计算机视觉算法来执行各种任务，例如读取名片，检测家具和衣服的风格，翻译路牌以及将手机连接到基于路由器的wi-fi网络标签。

计算机视觉的高级应用

由于深度学习的进步，计算机视觉现在正在解决以前计算机很难甚至不可能解决的问题。在某些情况下，训练有素的计算机视觉算法可以与具有多年经验和训练的人类并驾齐驱。

医学图像处理

在深度学习之前，创建可以处理医学图像的计算机视觉算法需要软件工程师和主题专家的大量努力。他们必须合作开发从放射影像中提取相关特征的代码，然后对其进行检查以进行诊断。

深度学习算法提供了端到端的解决方案，使这个过程非常简单。工程师们建立了正确的神经网络结构，然后用x光片、核磁共振成像(MRI)图像或CT扫描对其进行训练，并标注结果。然后，神经网络找到与每个结果相关的相关特征，然后可以诊断未来的图像具有令人印象深刻的准确性。

计算机视觉已进入许多医学领域，包括癌症检测和预测，放射学，糖尿病性视网膜病。

一些AI研究人员甚至说深度学习将很快取代放射科医生。但是，那些在该领域有经验的人会有所不同。诊断和治疗疾病要比查看幻灯片和图像多得多。而且，不要忘了深度学习是从像素中提取图案的，它不能复制人类医生的所有功能。

玩游戏

教计算机玩游戏一直是人工智能研究的热点。大多数游戏程序都使用强化学习，这是一种通过反复试验来发展其行为的AI技术。

计算机视觉算法在帮助这些程序解析游戏图形内容方面发挥着重要作用。但是要注意的一件事是，在许多情况下，图形会被“简化”，以使神经网络更容易理解它们。此外，目前，AI算法需要大量数据才能学习游戏。例如，OpenAI的dota游戏AI需要经历4.5万年的游戏才能达到冠军级别。

无收银员商店

2016年，亚马逊(Amazon)推出了Go，你可以走进这家商店，拿起你想要的任何东西，然后离开，不会因为入店行窃而被逮捕。Go使用了各种人工智能系统来消除收银员的需求。

当客户在商店中走动时，配备了高级计算机视觉算法的摄像头会监控他们的行为，并跟踪他们拾取或返回货架的物品。当他们离开商店时，他们的购物车会自动从他们的Amazon帐户中扣除。

宣布三年后，亚马逊已经开设了18家Go商店，并且仍在进行中。但是，有希望的迹象表明，计算机视觉（借助其他技术的帮助）将有一天使结帐业务成为过去。

自动驾驶汽车

无人驾驶汽车一直是人工智能领域最长久的梦想和最大的挑战之一。今天，我们距离能在各种光照和天气条件下在任何道路上行驶的自动驾驶汽车还很遥远。但是，由于深度神经网络的进步，我们取得了许多进步。

创造自动驾驶汽车的最大挑战之一是使它们能够理解周围的环境。虽然不同的公司正以不同的方式解决这个问题，但有一件事是不变的，那就是计算机视觉技术。

安装在车辆周围的摄像头可以监控汽车的环境。深度神经网络解析镜头并提取有关周围物体和人物的信息。该信息与来自其他设备（如激光雷达）的数据相结合，以创建区域地图，并帮助汽车在道路上行驶并避免碰撞。

令人毛骨悚然的计算机视觉应用

像所有其他技术一样，并非所有有关人工智能的内容都令人愉快。先进的计算机视觉算法可以扩大恶意应用。以下是一些引起人们关注的计算机视觉应用。

监视

对面部识别技术感兴趣的不仅是电话和计算机制造商。实际上，面部识别技术的最大客户是政府机构，他们对使用该技术自动识别安全摄像机镜头中的罪犯有既得利益。

但是问题是，您如何在国家安全和公民隐私之间划清界限？中国表明，前者过多和前者过少都会导致监视状态，从而给政府带来太多控制权。由面部识别技术提供支持的安全摄像机的广泛使用使政府能够密切跟踪数百万公民的活动，无论他们是否是犯罪嫌疑人。

在美国和欧洲，事情要复杂一些。科技公司在向执法部门提供面部识别技术时，遭到了员工和数字权利活动家的抵制。美国一些州和城市禁止公众使用面部识别。

自主武器

计算机视觉还可以将目光投向武器。军用无人机可以使用AI算法识别物体并挑选目标。在过去的几年中，军方对AI的使用引起了很多争议。面对员工的批评，谷歌不得不取消为国防部开发计算机视觉技术的合同。

目前，仍然没有自动武器。大多数军事机构都在有人员参与的系统中使用AI和计算机视觉。

但是人们担心，随着计算机视觉的进步和军事部门的更多参与，我们拥有的武器可以选择自己的目标并在没有人做出决定的情况下触发扳机只是时间问题。

著名的计算机科学家和AI研究员Stuart Russell成立了一个致力于阻止自动武器开发的组织。

声明：本文由易百纳技术社区编写，文章内容来自TNW，版权归原作者所有，转载请注明出处，如有侵权请联系删除。

深度学习促进了计算机视觉的发展

关于计算机视觉当前状态的几点说明

计算机视觉的商业应用

计算机视觉的高级应用

令人毛骨悚然的计算机视觉应用

tomato

审核成功

审核失败