跳转至

如何找研究想法

  • 打补丁法

  • 以MAE为例:

    image-20230420111414655

  • 第一个想法:“遮住更多的图片块”就是给图片加很强的噪声,相当于数据增强,数据增强是为了使模型不过拟合,但是坏处就是训练很慢,收敛速度极慢,考虑在更大数据集或更大架构上做MAE成本过大。因此可以考虑其他的数据增强,使得效果不差且训练速度快

  • 第二个想法:对于ViT,可以考虑使用新的model,例如自注意力、MLP都是可以替换的;

  • 第三个想法:对于BERT,使用的是完形填空和句子对匹配,是否可以增加额外的一个损失函数,例如contrast learning

  • 打补丁逻辑要串起来

  • 打补丁要找一篇脑洞比较大的