百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名


本文开源百度网盘AI大赛文档图像阴影消除参赛方案,基于IDR网络改进:底层加Non-Local模块,提升全局信息获取能力;特征通道增至96,增强学习能力。通过添加随机阴影等数据增强提升多样性,调整损失函数使PSNR达40+。还分享了扩大卷积核等失败尝试,感谢相关支持,附各模型离线验证分数及代码相关说明。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

百度网盘ai大赛:文档图像阴影消除参赛方案 ab榜第二名 -

百度网盘AI大赛:文档图像阴影消除参赛方案开源

本项目网络源自IDR网络:Self-Supervised Image Denoising via Iterative Data Refinement

论文链接:https://arxiv.org/abs/2111.14358

github:https://github.com/zhangyi-3/IDR

项目paddle实现源自:https://aistudio.baidu.com/aistudio/projectdetail/3439099?channelType=0&channel=0

1、简介

百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名 -        

网络与UNET极为类似,用于去除噪音、摩尔纹等

DYng进行了以下改进:

  1. 在底层叠加了Non-Local模块,提高网络获取全局信息的能力。
  2. 把网络特征通道从48增加到96,提高网络的学习能力。

2、本方案在此基础上,进行了以下工作:

1、数据增强 借鉴原论文中的思路,对数据添加干扰,提升多样性

百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名 -        

百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名 -        

原图:

百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名 -        

随机阴影、随机亮度、随机伽马

百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名 -        

百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名 -        

百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名 -        

擦除和随机重组

百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名 -        

百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名 -        

百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名 -        

2、训练过程

训练过程中发现主要的ssim可达到99+,但psnr只有39+ 调整损失函数,原方案中损失函数为L1_loss+ssim_loss,替换为1-0.1*log10(pnsr)+ssim_loss作为损失函数。更换后,psnr达到40+。

3、大把时间踩的坑,留赠有缘人

思路1:更大的感受野,更大的卷积效果会更好,将下面三层卷积核由3调整至7

放弃原因:收敛速度变慢,模型由10M+变大到50M+,不够优雅

思路2:归一化,借鉴P2P网络,加入tanh、Instance Normalization等,加快收敛

放弃原因:图像中存在大量255值,0.5*(1+tanh)取值范围是(0,1),无法达到255,导致分数下降,Instance Normalization可能也有同样的问题,并未提高成绩

思路3:借鉴Range Scaling Global U-Net for Perceptual Image Enhancement on Mobile Devices,引入浅层特征,与最后输出层做乘运算

简小派 简小派

简小派是一款AI原生求职工具,通过简历优化、岗位匹配、项目生成、模拟面试与智能投递,全链路提升求职成功率,帮助普通人更快拿到更好的 offer。

简小派 123 查看详情 简小派

放弃原因:分数不升反降,留待研究突破

思路3:采用transformer编码方式重构网络

放弃原因:多次训练,pnsr无法突破30,为何分割、检测与分类都可提取到更好的信息,gan却不行,留待研究突破 模型一并开源()

4、与技术无关的总结

感谢百度举办比赛,感谢沈忱同学、朱静茹同学、秦登达同学、翟同学的支持 感谢aistudio平台DYng,FreFrankiesa开源的方案

已过而立之年,依然少年心性,任性且肆意妄为

于是被生活吊打

肺炎半年,仍未痊愈

毕业延期

家庭危机

教育责任

房贷压力

科研是一条需要独行的路,迷茫且孤独

奈何,我喜欢

要有情怀,迎难而上

要保持好奇,我们都是海边捡贝壳的孩子

要有光,我就是光

成绩复现

In [ ]
!unzip data/data129115/delight_testB_dataset.zip!python submit2.py
   

训练过程

In [ ]
# 准备训练数据与环境!unzip data/data128551/dataset_v3.zip!pip install scikit-image
    In [ ]
# 开始训练!python train.py
   

代码与工作简要介绍:

  1. IDR 离线验证最高分70.08 0和1模型是第一批数据训练,2和3是第一批+补充数据训练,作为提交模型
  2. MBCNN 离线验证最高分 68.64 详见:https://aistudio.baidu.com/aistudio/projectdetail/3454475?contributionType=1
  3. IDR-RSG(思路三)离线验证最高分68.63 详见:modules/AIDR_arch-rsg.py
  4. transformer网络用于任务,离线验证最高分55.92,相当于完全失败
  5. IDR+ (思路一,卷积大小修改为7)离线验证最高分69.78(感觉还有潜力,但训练速度慢,模型大,有大显存卡可以试试)

以上就是百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名的详细内容,更多请关注其它相关文章!


# git  # 更大  # 重构  # 开源  # 一言  # 离线  # 文档  # 百度网  # type  # udio  # 百度  # 百度网盘  # ai  # python  # 中文网  # 安宁网站优化策划招聘网  # 海淀网络推广网站  # 桂林网站建设是什么  # 龙口营销推广平台  # 柑橘抖音营销推广  # 南京抖音营销推广教程  # 广东企业seo公司排名  # 顺义区办公用品网站建设  # 河北学校网站建设  # 鹤壁百度seo网站优化哪个好  # 进行了  # 官网 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 优化推广96088 】 【 技术知识133117 】 【 IDC资讯59369 】 【 网络运营7196 】 【 IT资讯61894


相关推荐: 新华三集团总裁兼首席执行官于英涛:人工智能时代需要想象力,更需要精耕务实  田渊栋新作:打开1层Transformer黑盒,注意力机制没那么神秘  再也不怕「视频会议」尬住了!谷歌CHI顶会发布新神器Visual Captions:让图片做你的字幕助手  机智云AI离线语音识别模组,让家电变得更加智能便捷  在心理治疗中用VR技术,治疗成效显著提高  字节团队提出猞猁Lynx模型:多模态LLMs理解认知生成类榜单SoTA  科技有狠活|时光修复师 :用AI让昨日重现  引领AI变革,九章云极DataCanvas公司重磅发布AIFS+DataPilot  13条咒语挖掘GPT-4最大潜力,Github万星AI导师火了,网友:隔行再也不隔山了  写出优质文章的妙招:利用"稿见AI助手"的实用指南  首届亚太网络法实务大会召开 九位大咖探讨元宇宙与人工智能发展  北京市元宇宙产业创新中心筹建工作正式启动  提高开发效率:AmazonCodeWhisperer与Amazon Glue的集成和生成式AI的应用  音乐制作元工具AudioCraft发布开源AI工具  中国电信AI能力通过国家级金融领域权威认证并荣膺AI国际头部竞赛冠军  6月14日《星空下的对话》 张朝阳陆川将畅聊人生、电影、心理学与AI  微软在 Build 大会上宣布的新 Microsoft Store AI Hub 现已开始推出  周鸿祎:360智脑开放API接口 AI大模型将赋能百行千业  腾讯TRS之元学习与跨域推荐的工业实战  12页线性代数笔记登GitHub热榜,还获得了Gilbert Strang大神亲笔题词  人工智能驱动艺术,打开达利的超现实想象  微软 GitHub Copilot 编程助手被投诉:换口吻改写公共代码来躲版权  人工智能产业协同创新中心:全产业链资源在这里汇聚  探索人工智能在居家养老方面的应用  上海发布“元宇宙关键技术攻关行动方案”,加快 AIGC 等突破  彭博社:苹果Vision Pro曾测试VR手柄追踪方案  沐曦首款AI推理GPU亮相:INT8算力达160TOPS!  了解 AGI:智能的未来?  “三夏”农忙保障用电,无人机高空巡视高压线  人工智能赋能广西自然资源领域监测监管  世界人工智能大会中西部县域数字就业中心组团亮相  站在社会的高度理解人工智能  Moka发布AI原生HR SaaS产品“Moka Eva”,布局AGI时代  世界水下机器人大赛:9国青年携手逐梦深蓝  热点资讯:家乐福推出聊天机器人;米哈游2025年营收273.4亿元…  中国联通发布图文AI大模型,可实现以文生图、视频剪辑  AI技术改变*,新骗局来袭,*成功率接近100%  人工智能大胆预测:银河系至少有2万个地球,36种外星文明  曝光HarmonyOS 4的重要新能力:全面升级AI大模型,小艺实现全面进化  人工智能时代的科幻译者怎么办?“做好翻译工作的高端10%”|文化观察  马克龙密会AI专家,法国加入全球人工智能竞赛  调查:过半数艺术家认为 AI 作图无法帮助他们的工作  马斯克预测:特斯拉全自动驾驶将在今年实现 对AI深度变化感到担忧  AI人工智能软件,婚纱设计师的必备利器  “黑科技”亮相大湾区轨交论坛 智慧交通迈向“强AI”  组建团队,字节跳动要造机器人?  英国前首相:AI可能被用来制造“生物恐怖武器”  昆仑万维与全球领先的元宇宙公司Meta达成商务合作,共同认可昆仑万维在XR领域的技术实力  猿力科技入选北京市通用人工智能产业创新伙伴计划  马斯克回应“人工智能让一切变得更好”:我们已经是半机器人了 

 2025-07-17

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司


运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。

 8156699

 13765294890

 8156699@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.