专业网站建设基本流程,做网站用什么写,wordpress 外观 自定义,网站平台建设实训体会生成对抗网络 – GAN 是最近2年很热门的一种无监督算法#xff0c;他能生成出非常逼真的照片#xff0c;图像甚至视频。我们手机里的照片处理软件中就会使用到它。 目录 生成对抗网络 GAN 的基本原理
大白话版本
非大白话版本
第一阶段#xff1a;固定「判别器D」#x… 生成对抗网络 – GAN 是最近2年很热门的一种无监督算法他能生成出非常逼真的照片图像甚至视频。我们手机里的照片处理软件中就会使用到它。 目录 生成对抗网络 GAN 的基本原理
大白话版本
非大白话版本
第一阶段固定「判别器D」训练「生成器G」
第二阶段固定「生成器G」训练「判别器D」
循环阶段一和阶段二
GAN的优缺点
10大典型的GAN算法
GAN 的13种实际应用 人工提取特征——自动提取特征
深度学习最特别最厉害的地方就是能够自己学习特征提取。 机器的超强算力可以解决很多人工无法解决的问题。自动化后学习能力更强适应性也更强。
人工判断生成结果的好坏——自动判断和优化
训练集需要大量的人工标注数据这个过程是成本很高且效率很低的。而人工判断生成结果的好坏也是如此有成本高和效率低的问题。
而 GAN 能自动完成这个过程且不断的优化这是一种效率非常高且成本很低的方式。GAN是如何实现自动化的呢下面我们讲解一下他的原理。 生成对抗网络 GAN 的基本原理
大白话版本
知乎上有一个很不错的解释大家应该都能理解
假设一个城市治安混乱很快这个城市里就会出现无数的小偷。在这些小偷中有的可能是盗窃高手有的可能毫无技术可言。假如这个城市开始整饬其治安突然开展一场打击犯罪的「运动」警察们开始恢复城市中的巡逻很快一批「学艺不精」的小偷就被捉住了。之所以捉住的是那些没有技术含量的小偷是因为警察们的技术也不行了在捉住一批低端小偷后城市的治安水平变得怎样倒还不好说但很明显城市里小偷们的平均水平已经大大提高了。 警察们开始继续训练自己的破案技术开始抓住那些越来越狡猾的小偷。随着这些职业惯犯们的落网警察们也练就了特别的本事他们能很快能从一群人中发现可疑人员于是上前盘查并最终逮捕嫌犯小偷们的日子也不好过了因为警察们的水平大大提高如果还想以前那样表现得鬼鬼祟祟那么很快就会被警察捉住。 非大白话版本
生成对抗网络GAN由2个重要的部分构成
生成器(Generator)通过机器生成数据大部分情况下是图像目的是“骗过”判别器判别器(Discriminator)判断这张图像是真实的还是机器生成的目的是找出生成器做的“假数据” 下面详细介绍一下过程
第一阶段固定「判别器D」训练「生成器G」
我们使用一个还 OK 判别器让一个「生成器G」不断生成“假数据”然后给这个「判别器D」去判断。
一开始「生成器G」还很弱所以很容易被揪出来。
但是随着不断的训练「生成器G」技能不断提升最终骗过了「判别器D」。
到了这个时候「判别器D」基本属于瞎猜的状态判断是否为假数据的概率为50%。 第二阶段固定「生成器G」训练「判别器D」
当通过了第一阶段继续训练「生成器G」就没有意义了。这个时候我们固定「生成器G」然后开始训练「判别器D」。
「判别器D」通过不断训练提高了自己的鉴别能力最终他可以准确的判断出所有的假图片。
到了这个时候「生成器G」已经无法骗过「判别器D」。 循环阶段一和阶段二
通过不断的循环「生成器G」和「判别器D」的能力都越来越强。
最终我们得到了一个效果非常好的「生成器G」我们就可以用它来生成我们想要的图片了。
下面的实际应用部分会展示很多“惊艳”的案例。 如果对 GAN 的详细技术原理感兴趣可以看看下面2篇文章
《生成性对抗网络GAN初学者指南 – 附代码》
《长文解释生成对抗网络GAN的详细原理20分钟阅读》 GAN的优缺点
3个优势
能更好建模数据分布图像更锐利、清晰理论上GANs 能训练任何一种生成器网络。其他的框架需要生成器网络有一些特定的函数形式比如输出层是高斯的。无需利用马尔科夫链反复采样无需在学习过程中进行推断没有复杂的变分下界避开近似计算棘手的概率的难题。
2个缺陷
难训练不稳定。生成器和判别器之间需要很好的同步但是在实际训练中很容易D收敛G发散。D/G 的训练需要精心的设计。模式缺失Mode Collapse问题。GANs的学习过程可能出现模式缺失生成器开始退化总是生成同样的样本点无法继续学习。 10大典型的GAN算法
GAN 算法有数百种之多大家对于 GAN 的研究呈指数级的上涨目前每个月都有数百篇论坛是关于对抗网络的。
下图是每个月关于 GAN 的论文发表数量 如果你对 GANs 算法感兴趣可以在 「GANs动物园」里查看几乎所有的算法。我们为大家从众多算法中挑选了10个比较有代表性的算法技术人员可以看看他的论文和代码。
算法论文代码GAN论文地址代码地址DCGAN论文地址代码地址CGAN论文地址代码地址CycleGAN论文地址代码地址CoGAN论文地址代码地址ProGAN论文地址代码地址WGAN论文地址代码地址SAGAN论文地址代码地址BigGAN论文地址代码地址
上面内容整理自《Generative Adversarial Networks – The Story So Far》原文中对算法有一些粗略的说明感兴趣的可以看看。 GAN 的13种实际应用
GAN 看上去不如「语音识别」「文本挖掘」那么直观。不过他的应用已经进入到我们的生活中了。下面给大家列举一些 GAN 的实际应用。
生成图像数据集
人工智能的训练是需要大量的数据集的如果全部靠人工收集和标注成本是很高的。GAN 可以自动的生成一些数据集提供低成本的训练数据。 生成人脸照片
生成人脸照片是大家很熟悉的应用但是生成出来的照片用来做什么是需要思考的问题。因为这种人脸照片还处于法律的边缘。 生成照片、漫画人物
GAN 不但能生成人脸还能生成其他类型的照片甚至是漫画人物。 图像到图像的转换
简单说就是把一种形式的图像转换成另外一种形式的图像就好像加滤镜一样神奇。例如
把草稿转换成照片把卫星照片转换为Google地图的图片把照片转换成油画把白天转换成黑夜 文字到图像的转换
特别是他们的 StackGAN从鸟类和花卉等简单对象的文本描述中生成逼真的照片。 语意 – 图像 – 照片 的转换
在2017年标题为“ 高分辨率图像合成和带条件GAN的语义操纵 ”的论文中演示了在语义图像或草图作为输入的情况下使用条件GAN生成逼真图像。 自动生成模特
在2017年标题为“ 姿势引导人形象生成 ”的论文中可以自动生成人体模特并且使用新的姿势。 照片到Emojis
GANs 可以通过人脸照片自动生成对应的表情Emojis。 照片编辑
使用GAN可以生成特定的照片例如更换头发颜色、更改面部表情、甚至是改变性别。 预测不同年龄的长相
给一张人脸照片 GAN 就可以帮你预测不同年龄阶段你会长成什么样。 提高照片分辨率让照片更清晰
给GAN一张照片他就能生成一张分辨率更高的照片使得这个照片更加清晰。 照片修复
假如照片中有一个区域出现了问题例如被涂上颜色或者被抹去GAN可以修复这个区域还原成原始的状态。 自动生成3D模型
给出多个不同角度的2D图像就可以生成一个3D模型。 生成式对抗网络GAN, Generative Adversarial Networks
是一种深度学习模型是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中至少两个模块生成模型Generative Model和判别模型Discriminative Model的互相博弈学习产生相当好的输出。原始 GAN 理论中并不要求 G 和 D 都是神经网络只需要是能拟合相应生成和判别的函数即可。但实用中一般均使用深度神经网络作为 G 和 D 。一个优秀的GAN应用需要有良好的训练方法否则可能由于神经网络模型的自由性而导致输出不理想。 生成对抗网络GAN是一类用于无监督机器学习的人工智能算法由在零和游戏框架中相互竞争的两个神经网络系统实现。他们是由Ian Goodfellow 等人介绍的。在2014年这种技术可以生成照片看起来至少在表面上真实的人的观察员有很多的现实特征虽然在测试中的人可以真正告诉在许多情况下产生。