缺陷或负样本难以收集怎么办?使用生成式模型自动生成训练样本,image-to-image Stable diffusion

文章大纲 样本稀疏与对应的解决方案 1.数据层面 2.模型层面 3.方法层面 如何解决工业缺陷检测小样本问题 参考1:AIDG(Artificial Intelligent Defect Generator) 参考2:灵感来源 : Imag

文章大纲

  • 样本稀疏与对应的解决方案
    • 1.数据层面
    • 2.模型层面
    • 3.方法层面
  • 如何解决工业缺陷检测小样本问题
    • 参考1:AIDG(Artificial Intelligent Defect Generator)
    • 参考2:灵感来源 : Image-to-Image Diffusion Models
    • 参考3:结合Stable diffusion 控制噪声
    • 参考4:工业级 deep learning anomaly detection algorithms
  • 参考文献与学习路径
    • 参考博文
    • 数据集
    • 算法
    • 缺陷检测库
    • hugging face


样本稀疏与对应的解决方案

1.数据层面

数据增广
数据增广,就是尽可能产生更多的样本,比如,一张图像,通过裁剪、变换、翻转、加噪声,获得更多样本;

合成数据
比如,通过 GAN 生成数据等。

  • 图片分类的效果不好怎么办?-- 从数据驱动的角度出发

2.模型层面

数据量比较小会导致模型过拟合, 使得训练误差很小而测试误差特别大.

模型正则化
通过在Loss Function 后面加上正则项可以抑制过拟合的产生. 缺点是引入了一个需要手动调整的hyper-parameter.

Dropout是一种神经网络正则化手段,通过随机将部分神经元的输出置零来实现.

k折交叉验证
使用k折交叉验证训练模型,可以提供模型的精度,防止划分数据的随机性。

集成弱学习器
SVM能在数据量不足,且特征维度高的情况下,进行学习。但是,与神经网络比较,像SVM,GBDT这些弱学习群可能并不能达到理想的效果。对这些模型使用集成学习,提

发布者:admin,转转请注明出处:http://www.yc00.com/web/1754976389a5223577.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信