但始终着眼于创造具有高度视觉冲击力的产出。
他关于变分自动编码器的教训激励我尝试培养一个可以为人类提供重要服务的网络:生成70年代电视机的新颖但真实的图像。
什么是变分自动编码器?
这家伙的帖子答案比我以前能做得更好,但是你可以把它想象成一个巧妙压缩和重建的工具。训练了许多例子,它学习将它们编码成所谓的潜在向量。通过每个训练步骤,它通过将当前潜在向量解码成图像来检查其进展。换句话说,它从潜在向量中简单的一系列数字重建输入图像。损失函数测量这些输出与输入的匹配程度。最酷的部分是,一旦网络被训练完毕,你可以为它的解码部分提供一系列数字(对潜在向量的变化),并且会弹出一个新的图像表示形式。
数据输入
Parag鼓励学生四处搜寻有趣的数据集。通过袭击这个网站,我制作了自己的groovy数据集,大约有100多幅70年代的电视图像。它的粉丝会扫描并上传整个目录(Sears,JCPenney等)。(是的,有些人把它当做嗜好,为此我感谢他们。)

他们很漂亮,那是70年代的电视机。但正如我们将要看到的那样,这个数据集太小了。
训练
掌握了这些数据后,我调整了Parag的笔记本电脑,从我70年代的电视数据集中进行训练。您可以在下面看到培训进展情况。我认为,看起来这很酷,这激励我写这篇文章。这是这篇文章的钱!

问题
可悲的是,尽管我无法获得训练有素的网络。即使使用图像翻转等增强技术,数据集可能太小也是如此。如果我远远超过了GIF动画中显示的数字时代,那么进度最终会停止。错误率会上升,并且输出图像会开始偏离输入图像。确切地说,为什么还要保持一个谜,因为这对我来说只是一个有趣的玩具项目(但我欢迎任何有关改进评论结果的建议)。(接下来的步骤是放大数据集,看看生成敌对网络是否可以做得更好。)尽管如此,如下所示,半受训网络仍然能够产生一些有趣的,如果不完美的结果。事实上,这是他们缺乏完美的保真度,给他们一个很好的绘画质量。













