-
Notifications
You must be signed in to change notification settings - Fork 3
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
predict VIDEO #10
Comments
必读论文及相关要求:
zdx6 mocogan https://github.com/sergeytulyakov/mocogan 这个训练的硬件满足。 7 Dual Motion GAN for Future-Flow Embedded Video Prediction |
2017-11-10 |
2017-11-10 拓展应用:使用一张静态图生成video |
2017-11-11 采用的架构C3D为: 最后通过和其他方法进行对比,提出C3D在动作识别、场景和目标识别,以及运算速度上具有优势 |
2017-11-11 架构: |
2017-11-13 pix2pix的判别器代码(tensorflow)链接: C3D的代码(keras): videogan 的生成器和判别器代码(torch): mocogan的生成器和判别器代码pytorch: |
Image Pool 考虑直接删除 |
目的:??(不知道和公司发展有什么关系,也不知道做出来能干什么……)
zdx:序列预测是智能非常重要的能力,对于AI非常重要,完全符合公司目标通用智能,做出了能增强现有神经网络的智能。
具体场景:大家一起想!避障,其他车辆意图的预测,torcs游戏验证?机器人自己动作的预测,常识学习。
原型验证ok,完善中再继续找应用的场景和产品的具体完善。
目标:搭建一个视频生成网络
要求:pix2pix 框架,基于GAN技术
注:以上为主观因素
基本结构:
G:简易 3D_UNET 网络,初步大小64 x 64,目标大小 128 x 128
D:C3D 类似结构判别器
效果: 输入10帧视频,输出5帧视频
预计时间:总用时 8 周
15 号最新更新:
按张总的意思,换 Pytorch 框架,基于 pix2pix 原始代码修改修改。参考如下:
pix2pix pytorch 源代码:
https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix
一些 pytorch 3D 应用的实例:
https://github.com/shiba24/3d-unet
https://github.com/kenshohara/video-classification-3d-cnn-pytorch
https://github.com/kenshohara/3D-ResNets-PyTorch
pytorch 官方 Document:
http://pytorch.org/docs/master/nn.html
关键 operatoin:
3D deconvolution - torch.nn.ConvTranspose3d
3D convolution - torch.nn.Conv3d
3D maxpooling - torch.nn.MaxPool3d
3D dropout - torch.nn.Dropout3d
Keras 实现 已取消
计划注意:
可能失败原因
The text was updated successfully, but these errors were encountered: