切换马甲
上一页
下一页
TA最新文章
分类专栏
-
246篇
默认分类
文章数:246
文章总阅读量:260.6w
文章总收藏量:1.3k
文章总点赞量:2.2w
按发布时间
按阅读量
按点赞量
-
文章目录 1 常用层 1.1 Dense 1.2 Activation层 1.3 Dropout 1.4 Flatten 2 卷积层 2.1 Cov2D 2.2 Cropping2D层 2.3 Cropping3D层 2.4 ZeroPadding2D层 1 常用层 1.1 Dense keras.layers.Dense(units2021-04-21 17:05:2897 8 5136
-
文章目录 1 池化层 1.1 MaxPooling2D 1.2 MaxPooling1D: 1.3 AveragePooling2D 1.4 深度学习的可解释性|Global Average Pooling(GAP) 2 正则化 2.1 BatchNormalization 3 反卷积层 3.1 UpSampling2D 3.2 循环层(RNN) 3.3 GRU 1 池化层 1.1 MaxPool2021-04-21 17:05:5696 8 5117
-
前言 机器学习的核心即为深度学习,通过不断的模型训练和预测,机器学习的价值越来越得到明显,深度学习技术在当代社会发挥的作用越来越大。目前深度学习被广泛应用于个性化推荐、机器翻译、自动驾驶、商品搜索、人脸识别等多个领域,此外还在向社会各个领域迅速渗透。 当前,社会结构变得复杂化和多元化,各种生态再适应时代的过程中也在不断突破和衍生,深度学习就是一个典型的案例,它孵化出来的应用越来越多样化,随之涌现出2021-04-21 17:06:3395 7 5360
-
文章目录 1 随机梯度下降 1.1 什么是梯度下降 1.2 随机梯度算法 2 Momentum 3 自适应学习率算法 3.1 AdaGrad 3.2 Adam 3.3 Adam配置参数 1 随机梯度下降 1.1 什么是梯度下降 我们先从一张图来直观解释这个过程。 如上图假设这样一个场景:一个人被困在山上,需要从山上下来,但此时山上的浓雾很大,导致可视度很低2021-04-23 14:09:1596 7 4760
-
文章目录 1 概述 2 批量生成训练数据 2.1 如何实现 2.2 实验验证 2.3 图片标注并生成训练所需文件 3 数据增强 4 目标检测中的图像增强 1 概述 这几年深度学习领域的新进展就是以这个想法为基础产生的。我们可以使用更复杂的深度学习网络,在图片中挖出数以百万计的特征。 这时问题也就来了。机器学习过程中是需要一个输入文件的。这个输入文件的行、列分别指代样本名称以2021-04-23 14:09:3797 5 5243
-
背景: 随着游戏娱乐等直播业务的增长,在移动端观看直播的需求也日益迫切。但是移动端原生的播放器对各种直播流的支持却不是很好。Android 原生的 MediaPlayer 不支持 flv、hls 直播流,iOS 只支持标准的 HLS 流。本文介绍一种基于 ffplay 框架下的跨平台播放器的实现,且兼顾硬解码的实现。 播放器原理: 直观的讲,我们播放一个媒体文件一般需要5个基本模块,按层级顺序:文2021-04-23 14:10:0996 7 5093
-
摘要: 视频预处理是很多领域都会遇到的问题,特别是现如今各行业对视频剪辑视频转码和批处理相关操作对要求更多,市场也更大,所以各式各样的视频工具如雨后春笋般诞生,下面我们就从ffmpeg 和 opencv 两个视频工具深入分析原理及应用。 认识ffmpeg+opencv库 ffmpeg库是一个功能及其强大,集成各种视频处理类,可快速便捷对视频流文件进行二次处理,它能够解码、编码、转码、混合、解密2021-04-23 14:10:4296 8 5841
-
摘要: 紧接上一篇我们讲了视频批处理过程的具体实现,本篇我们将对摄像头捕获,麦克风和鼠标事件进行讲解。 最近发现很多人问怎么用FFmpeg采集摄像头图像,事实上FFmpeg很早就支持通过DShow获取采集设备(摄像头、麦克风)的数据了,只是网上提供的例子比较少。如果能用FFmpeg实现采集、编码和录制(或推流),那整个实现方案就简化很多,正因为这个原因,我想尝试做一个FFmpeg采集摄像头视频和麦2021-04-23 14:11:1997 6 5524
-
当你看到这只大猩猩的时候,是不是感觉优点萌萌的。哈哈,这就是我们这篇文章要讲解的一个开源项目 -- Kong( 云原生架构下的分布式API 网关 )。 为什么说 Kong 是物联网网关神器? 在 IOT 系统架构中,为了保证系统的鲁棒性和高可扩展性。我们需要一个强大的 API 网关来承受住遍布各地的 IOT 设备所传输的信息。插件架构设计的 Kong 使得它具有了强大的兼容性,和可扩展性。TCP2021-04-25 15:58:5893 8 5537
-
1. 引言在当前快速发展的工业4.0时代,边缘计算已经成为了一个关键技术,它能够使数据处理更加接近数据源头,从而提高处理速度并降低响应时间。这一技术尤其在工业自动化领域显示出了极大的潜力,因为它能有效处理大量来自工业设备和传感器的数据,实现2024-05-09 13:53:101 1 6556
-
1 视频 1.1 视频像素格式 ARGB_8888 : 常见的图像像素编码格式,用 4 个字节分别存储图像的 A 透明度信息, R 红色通道信 息, G 绿色通道信息, B 蓝色通道信息。 YUV : YUV像素格式来源于RGB像素格式,通过公式运算,YUV三分量可以还原出RGB,YUV转RGB的 公式如下: R = Y + 1.403V G = Y - 0.344U - 0.714V B2021-04-25 16:34:0195 7 4549
-
前言 需求场景1(视频中提取照片): 各大网站在线播放视频时,鼠标滑到某一时刻能够提前显示那一时刻的画面。短的视频编辑APP中,为了更好的对视频进行编辑,会提取出视频各个时刻的画面进行预览,那么这些是如何实现的呢?本文将给出基于ffmpeg的实现代码以及实现思路。 需求场景2(照片合成视频): 摄影师经常不间断的拍摄一组连续的画面用于合成延时视频,剪印APP中也有时光相册这样通过照片生成视频的功2021-04-25 16:34:3789 7 5904
-
ffmpeg内置了很多滤镜库,都封装在AVFilter模块中,通过这个滤镜模块可以用来更加方便的处理音视频。比如视频分辨率压缩滤镜scale(用来对视频的分辨率进行缩放),视频翻转滤镜transpose(对视频进行上下左右的翻转);音频格式转换滤镜aformat(它实际上最终是调用avresample滤镜实现的),volume(用来调整音量大小)等等。 关于ffmpeg的滤镜AVFilter源码及2021-04-25 16:35:2196 8 5060
-
前言 有时会碰到这样的需求场景,对一个视频中的某一段感兴趣,想要精确的截取这一段视频以及对应的音频。例如,有一个25fps的MP4的文件,时长20秒,我想要截取从5秒开始到15秒结束的视频以及对应的音频,这里有两点需要说明: 1、对于视频:开始时间5秒,结束时间15秒。只能做到尽量接近,因为源文件25fps,即每一帧的显示间隔为0.04秒,可能5秒附近的视频帧刚好在5.012秒,最大误差一帧时间差2021-04-25 16:35:5196 8 4995
-
文章目录 1 数据描述 2 思路 3 准备数据 4 构建模型 5 模型优化 6 程序执行 7 观察结果 1 数据描述 初赛选取癌病理切片,为常规 HE 染色,放大倍数 20, 图片大小为 2048×2048 像素,比赛数据为整体切片的部分区域,tif 格式。比赛不允许使用外部数据。初赛选取 100 个病人案例(部分为癌症、部分为非癌症),共计 1000 张病理切片图片,训练集数量 700 张,测试2021-04-26 17:25:2594 7 4901
-
..```python 文章目录 1 一个普通的神经网络 1.1 数据预处理 1.2 分割训练集和测试集合 1.3 搭建模型 2 使用ImageNet数据集 2.1 搭建模型 2.2 训练后结果 3 快速迁移学习 3.1 搭建特征提取模型并导出特征 3.2 训练全联接分类器 4 模型融合 # 1 一个普通的神经网络 的视频资源以适应用户不同网络条件的需求。 2、视频像素格式转换;安卓平台碎片化的特性,安卓手机录制的视频可能有多种不同像素格式,比如NV12,NV21等等,虽然他们都是YUV颜色空间,但2021-04-26 17:28:3089 9 7583
-
背景最近在处理RS485设备时,需要使用一台串口服务器DTU来采集数据并发送到远程服务器,最终由服务器上的上位机软件来远程控制485设备。在挑选了很久,最终选择了串口服务器ZL-LAN-500(以下简称ZLAN500),接下来让我们一起来看2024-05-17 12:55:020 1 2937
-
前言 在视频编辑领域经常会碰到这样的需求场景,用户选择了多段感兴趣的视频想把它们拼接成一个文件。本文的目标就是实现多段视频文件的合并。同时也接触到一个新的概念,流媒体封装格式类型: 媒体格式分为流式和非流式,主要区别: 1、非流式的元信息通常存储在文件中开头,有时在结尾; 2、流式的元信息跟具体音视频数据同步存放的,所以多个流式文件简单串联在一起形成新的文件也能正常播放;多个非流式文件的合并则可2021-04-26 17:29:5395 7 5595
