当前位置: 首页>关注 >
精选!详细探讨了视觉Transformer在处理长尾数据时的优势和不足之处
2023-06-16 10:05:53 来源:聚焦网
本篇文章为大家介绍清华大学在CVPR2023的论文,LearningImbalancedDatawithVisionTransformers(用视觉Transformer学习长尾数据),代码已开源。
背景
(资料图)
在机器学习领域中,学习不平衡的标注数据一直是一个常见而具有挑战性的任务。近年来,视觉Transformer作为一种强大的模型,在多个视觉任务上展现出令人满意的效果。然而,视觉Transformer处理长尾分布数据的能力和特性,还有待进一步挖掘。
目前,已有的长尾识别模型很少直接利用长尾数据对视觉Transformer(ViT)进行训练。基于现成的预训练权重进行研究可能会导致不公平的比较结果,因此有必要对视觉Transformer在长尾数据下的表现进行系统性的分析和总结。
本文旨在填补这一研究空白,详细探讨了视觉Transformer在处理长尾数据时的优势和不足之处。本文将重点关注如何有效利用长尾数据来提升视觉Transformer的性能,并探索解决数据不平衡问题的新方法。通过本文的研究和总结,研究团队有望为进一步改进视觉Transformer模型在长尾数据任务中的表现提供有益的指导和启示。这将为解决现实世界中存在的数据不平衡问题提供新的思路和解决方案。
文章通过一系列实验发现,在有监督范式下,视觉Transformer在处理不平衡数据时会出现严重的性能衰退,而使用平衡分布的标注数据训练出的视觉Transformer呈现出明显的性能优势。相比于卷积网络,这一特点在视觉Transformer上体现的更为明显。另一方面,无监督的预训练方法无需标签分布,因此在相同的训练数据量下,视觉Transformer可以展现出类似的特征提取和重建能力。
基于以上观察和发现,研究提出了一种新的学习不平衡数据的范式,旨在让视觉Transformer模型更好地适应长尾数据。通过这种范式的引入,研究团队希望能够充分利用长尾数据的信息,提高视觉Transformer模型在处理不平衡标注数据时的性能和泛化能力。
文章贡献
本文是第一个系统性的研究用长尾数据训练视觉Transformer的工作,在此过程中,做出了以下主要贡献:
首先,本文深入分析了传统有监督训练方式对视觉Transformer学习不均衡数据的限制因素,并基于此提出了双阶段训练流程,将视觉Transformer模型内在的归纳偏置和标签分布的统计偏置分阶段学习,以降低学习长尾数据的难度。其中第一阶段采用了流行的掩码重建预训练,第二阶段采用了平衡的损失进行微调监督。
其次,本文提出了平衡的二进制交叉熵损失函数,并给出了严格的理论推导。平衡的二进制交叉熵损失的形式如下:
与之前的平衡交叉熵损失相比,本文的损失函数在视觉Transformer模型上展现出更好的性能,并且具有更快的收敛速度。研究中的理论推导为损失函数的合理性提供了严密的解释,进一步加强了我们方法的可靠性和有效性。
不同损失函数的收敛速度的比较
基于以上贡献,文章提出了一个全新的学习范式LiVT,充分发挥视觉Transformer模型在长尾数据上的学习能力,显著提升模型在多个数据集上的性能。该方案在多个数据集上取得了远好于视觉Transformer基线的性能表现。
不同参数量下在ImageNet-LT上的准确性。
同时,本文还验证了在相同的训练数据规模的情况下,使用ImageNet的长尾分布子集(LT)和平衡分布子集(BAL)训练的ViT-B模型展现出相近的重建能力。如LT-Large-1600列所示,在ImageNet-LT数据集中,可以通过更大的模型和MGPepoch获得更好的重建结果。
总结
本文提供了一种新的基于视觉Transformer处理不平衡数据的方法LiVT。LiVT利用掩码建模和平衡微调两个阶段的训练策略,使得视觉Transformer能够更好地适应长尾数据分布并学习到更通用的特征表示。该方法不仅在实验中取得了显著的性能提升,而且无需额外的数据,具有实际应用的可行性。
关键词:
为你推荐
-
精选!详细探讨了视觉Transformer在处理长尾数据时的优势和不足之处
-
泰国lisa个人资料身高体重(泰国lisa多高多重)
-
强化安全行车责任意识 昆明开展网约车安全应急演练
-
【广州】比音勒芬服饰股份有限公司招聘视觉创意经理-微资讯
-
禄口街道:织密“精网微格”,夯实社会治理根基
-
飞鸟尽良弓藏_狡兔死走狗烹什么意思 这句话出自哪里
-
环球快看:人参泡酒一般用什么酒泡比较好
-
世界今亮点!广州白云推广垃圾分类 让生活小妙招助力环保
-
付出和收获的经典语录有哪些
-
2023年7月份去大连赶海应几号到那里|世界快看
-
通过别人原作者允许搬运没漏脸视频,然_环球播资讯
-
【全球报资讯】商务部:将继续跟踪了解外贸企业面临的困难挑战 帮助企业降本增效
-
今日热搜:苹果x悬浮球在哪设置 为什么找不到(苹果X悬浮球在哪设置)
-
江苏出台新措施推进基本养老服务体系建设_环球快播
-
世界要闻:wifi满格信号网速却很慢怎么解决(oppo手机wifi满格但不能上网)
-
长春快速路启用24处测速抓拍点位
-
天天速递!纠拔苗砍树“一刀切”的偏,纠得好
-
天天报道:俄罗斯紫皮糖真假图片_俄罗斯紫皮糖真假辨别
-
6月15日-6月20日,各省养老金将公布?预计变化不大,啥原因?
-
港股异动 | 维亚生物(01873)涨超6%领涨CRO概念 机构指国内工程师红利优势仍在 看好CRO持续高业绩增长
推荐内容
- 精选!详细探讨了视觉Transformer在处理长尾数据
- 泰国lisa个人资料身高体重(泰国lisa多高多重)
- 强化安全行车责任意识 昆明开展网约车安全应急演练
- 【广州】比音勒芬服饰股份有限公司招聘视觉创意经
- 禄口街道:织密“精网微格”,夯实社会治理根基
- 飞鸟尽良弓藏_狡兔死走狗烹什么意思 这句话出自
- 环球快看:人参泡酒一般用什么酒泡比较好
- 世界今亮点!广州白云推广垃圾分类 让生活小妙招
- 付出和收获的经典语录有哪些
- 2023年7月份去大连赶海应几号到那里|世界快看
- 通过别人原作者允许搬运没漏脸视频,然_环球播资讯
- 【全球报资讯】商务部:将继续跟踪了解外贸企业面
- 今日热搜:苹果x悬浮球在哪设置 为什么找不到(
- 江苏出台新措施推进基本养老服务体系建设_环球快播
- 世界要闻:wifi满格信号网速却很慢怎么解决(oppo
- 长春快速路启用24处测速抓拍点位
- 天天速递!纠拔苗砍树“一刀切”的偏,纠得好
- 天天报道:俄罗斯紫皮糖真假图片_俄罗斯紫皮糖真假
- 6月15日-6月20日,各省养老金将公布?预计变化不
- 港股异动 | 维亚生物(01873)涨超6%领涨CRO概念
- 酒鬼酒急了,四个月没了220亿
- 亲贤臣远小人此先汉所以兴隆也_亲贤臣远小人此先
- 当前要闻:2023全国媒体摄影大师远安行活动昨日收官
- 美国汽车盗窃案激增!去年平均每分钟有两辆车遭窃
- 故宫参观须知6月30日起施行:禁带商拍器材、露营
- 北京东方大学城(北京东方大学城)_全球热闻
- 全球播报:快递小哥人数暴增!欧盟立新规:为“零
- 全球速读:古人的婚礼在傍晚举行对不对_古人的婚
- 华策影视(300133):6月14日北向资金增持155.3万
- 累计折旧科目借贷方(累计折旧借贷方表示什么)
- 怎么查询座机号码是移动还是联通_170号码是属于移
- 视焦点讯!弯矩图的特征_弯矩图正负
- 世界资讯:“喝过的水被蟑螂爬过”!女子身体不适
- 杭州亚运会博物馆首次对媒体开放 当前快播
- 什么不能放进微波炉(哪些食物不宜放进微波炉加热?
- 变频空调真的省电吗?幸亏听了师傅的话!_变频空调
- 山东组培实验室常用仪器设备-上海农卉组培室设计|
- 2023北京德云社郭德纲于谦相声专场最新消息查询
- 男子坐飞机下错站 襄阳机场民警暖心助其回家-
- 每日速讯:现役球员入选名人堂概率:约基奇74%,
产业
-
传音控股上半年营收231.09亿元 非洲智能机市场占有率超过40% 妥妥的“非洲之王”
2022-08-25
-
2022-08-17
-
2021-10-20
油气
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
经济
-
中新网通辽10月18日电 (记者 张林虎)18日,记者从内蒙古自治区通辽市奈曼旗公安局获悉,国家一级保护动物--梅花鹿误入当地村民羊群,
-
中新网杭州10月18日电 (王题题 胡燕婕)云天收夏色,浅秋正渐浓。10月18日,浙江杭州市西湖游船有限公司推出的惠民多站点“西湖环湖游
-
中新网福州10月18日电 (记者 龙敏 王东明)福州市晋安区官方18日晚间通报,18日14时47分,晋安区岳峰镇化工路爱摩轮商业广场项目摩天
-
中新网兰州10月18日电 (闫姣 艾庆龙 吉翔)“红山白土头,黄河向西流。”不少人疑问,天下黄河向东流,为何甘肃永靖县这段黄河却向西
-
中新网北京10月18日电 《清华城市健康设施指数》18日在北京发布。报告成果显示,城市健康设施指数领先城市以中心城市和东部沿海城市