2019/8/21 Update: 已经有人部署到网站 selife2anime.com

UGATIT是一个由韩国NCSOFT公司开源的非监督GAN网络,这个GAN网络使用了新的改进的注意力模块能更好的关注几何和整体变化;以及使用新的AdaLIN (Adaptive Layer-Instance Normalization) 函数从数据集中学习参数,来灵活控制对材质和形状的修改(个人理解为更精细的生成?)。GitHub上开源了其TensorFlow版PyTorch版

请输入图片描述

使用恰当的数据集,可以训练妹子->二次元 or 二次元->妹子的模型,8说了,准备数据集,开冲!

- 阅读剩余部分 -

4pda是个老毛子的手机论坛网站,有次在里面找到个软件,想要下载却发现下载链接跳转404,其他附件链接也是跳转404,应该是防盗链,需要登录才能下载。于是尝试注册。在Google翻译的帮助下填完了基本信息,最后一步验证码却卡住了,这扭曲的俄文验证码机器也没法翻译啊……后来找到一篇博客,讲了这个验证码的意思和对应的俄文,终于注册成功下载到了软件。

下面是翻译的博客正文和俄文对照表:

- 阅读剩余部分 -

预测出的嗅球和白色部分需要验证是否正确,因为嗅球和白色部分比较对称,所以有个朴素的方法:将预测出的mask从中间折叠,计算重合部分占比,占比过小的认为是无效预测

然而在实现时发现pytorch的Tensor不支持负数作为步长:

Snipaste_2019-08-07_15-56-09.png

Google之后发现:这2个issue:

在第二个issue里可以看到这个问题的历程:

- 阅读剩余部分 -

系统一直是保持更新最新版本的,出现问题的版本:

  • Windows 10 18362.239
  • Microsoft 照片 2019.19051.16210.0

出现场景:

打开了一个png图片后最小化至后台,过了大约一两个小时后显卡显存占满,系统严重卡顿

检查发现照片应用占用了7G的显存:

Snipaste_2019-08-07_13-10-54.png

已经第二次出现了,应该算比较严重的BUG了

上周发了个博客说多分类应该用一个像素代表不同值的方式来实现,今天又仔细研习了一下 github 上这个 issue,看了作者的回复,感觉还是应该用多通道作为输入。
于是我把unet传入的n_classes参数改成了2,然后让传入的数据形状和unet输出预测的形状一致,把嗅球和白色区域数据用torch.cat叠起来,最后两个通道输出扩充一个通道保存成3通道RGB的形式

81{$EWPX3UTZ}5R3FJ[8_TK.jpg


- 阅读剩余部分 -