本篇文章2338字,读完约6分钟

参加:杜伟,楚航,罗若天

这周的重要论文包括上海交大发表的医疗版mnist数据集和陈丹琦关于关系抽取的新探索。

目录:

medmnistclassificationdecathlon:alightweightautomlbenchmarkformedicalimageanalysis

asurveyonmulti-sourcepersonre-identificati on

combininglabelpropagationandsimplemodelsout-performsgraphneuralnetworks

afrustratinglyeasyapproachforjointentityandrelationextraction

self-trainingandpre-trainingarecomplementaryforspeechrecognition

asurveyoncontrastiveself-supervised learning

image sentiment transfer

arxiv weekly radiostation:nlp、cv、ml越来越多的精选论文(带语音)

论文1:medmnistclassificationdecathlon:alightweightautomlbenchmarkformedicalimageanalysis

作者:江城阳,瑞石,兵兵尼

论文链接: arxiv/pdf/.14925v1.pdf

摘要:数据集在ai技术的迅速发展中起着重要的作用。 但是,医疗数据集的创建面临着数据获取、数据标记等诸多课题。 最近,上海交通大学的研究者建立了医疗图像数据集medmnist,总共包括10个预解决开放医疗图像数据集(其数据来自许多不同的数据源,经过预解决)。 与mnist数据集一样,medmnist数据集在轻量级的28 × 28图像上执行分类任务,包含的任务涵盖了主要的医疗图像模型和多样性的数据规模。

热门:7 Papers & Radios

在所有10个数据集中判断automl算法的性能,不手动微调算法。 研究者对早期停止resnet [6]、开源automl工具( auto-sklearn [7]、autokeras [8] )、商业化automl工具( googleautoml )等多个基线方法具有性能 研究者希望medmnistclassificationdecathlon能促进automl在医疗图像分析行业的研究。

热门:7 Papers & Radios

medmnist数据集概述。 涵盖数据集的名称、源、数据模式、任务和数据集的划分。

研究者提到了多条基线方法的性能。

算法在小数据集上容易过拟合。

推荐:上海交大研究者创建新型开放医疗图像数据集medmnist,目的是设计“medmnist分类十种全能”,促进automl算法在医疗图像分析行业的研究。

论文2:asurveyonmulti-sourcepersonre-identificati on

作者:叶峪、王正和梁朝等

论文链接: AAS/CN/Article/DOI/10.16383/j.AAS.c 190278

摘要:行人再识别是近年来计算机视觉行业的热点问题,经过多年的快速发展,基于可见光图像的通常行人再识别技术已经接近成熟。 但是,现在的研究大多基于步行者图像是在照明充分的条件下拍摄的高分辨率图像这一比较理想的假设。 这是因为在很多研究中可以得到满意的效果,但在实际环境中不能适用。 多源数据步行者再识别是利用多个步行者新闻进行步行者匹配的问题。 除了需要处理通常步行者再识别面临的问题以外,多源数据步行者再识别技术针对低分辨率图像、红外线图像、深度图像、复印新闻、草图图像等不同种类的步行者新闻与通常的步行者图像一致时的差异问题 因此,多源数据行人再识别研究与通常的行人再识别方法相比更加实用和具有挑战性。

热门:7 Papers & Radios

本文首先介绍通常行人再认识的迅速发展现状和面临的问题,然后比较多源数据行人再认识和通常行人再认识的区别,根据不同的数据类型总结5种多源数据行人再认识问题,分别是做法、数据集的两面吗 多源数据步行者再识别的优点是,与通常的步行者再识别技术相比,能够完全利用各种数据学习交叉模式和类型的特征变换。 最后探讨了多源数据行人再认识的未来快速发展。

热门:7 Papers & Radios

多源数据行人再识别类型。

介绍三种多源数据行人的再识别方法。

一些多源数据的行人再识别方法是普通行人数据集上的识别结果。

推荐:这项研究发表在《自动化学报》上。

论文3:combininglabelpropagationandsimplemodelsout-performsgraphneuralnetworks

作者:前黄、horace he、abhay singh等

论文链接: arxiv/pdf/.13993.pdf

摘要:图神经网络( gnn )是图学习中的主要技术。 但是,我们对gnn成功的奥秘及其优异的性能是否必然知道很少。 最近,来自康奈尔大学和facebook的研究提出了一种新的方法,以许多标准的直推式节点分类( transductive node classification )标准,这种方法超过了现在的最佳gnn的性能或

热门:7 Papers & Radios

该方法将忽略图结构的浅层模型与两个简单的后解决步骤结合起来,后解决步骤利用标签结构中的相关性: ( I )“误差相关”:向训练数据传递残差以纠正测试数据中的误差。 ( ii )“预测相关”:平滑测试数据上的预测结果。 研究者将这一步改为correct and smooth (c&; s ),后解决步骤是通过简单修正基于早期图的半监视学习方法中的标准标签传达( lp )技术来实现的。

热门:7 Papers & Radios

这种方法在多个标准上超过或接近当前最佳gnn的性能,但其参数远远小于后者,运行时也快了几个数量级。 例如,该方法的ogb-products的性能超过sota gnn,其参数量是后者的1/137,训练时间是后者的1/100。 这种方法的性能表明,通过将标签新闻纳入直接学习算法,可以容易地实现显着的性能提高。 这种方法也可以纳入大型gnn模型。

热门:7 Papers & Radios

模型结构图

实验中使用的九个数据集。

ogb-products数据集上参数和性能(准确率)的一些变化曲线图。

推荐:通过将传统的标签传递方法与简单模型相结合,在部分数据集上超过了目前最佳的gnn性能。

论文4:afrustratinglyeasyapproachforjointentityandrelationextraction

作者:泽宣中,丹齐陈

论文链接: arxiv/pdf/.12812.pdf

摘要:端到端关系提取的目的是识别命名实体并提取其关系。 在最近的研究中,多采用joint法对这两个子任务进行模型化,通过将两者合并到一个结构化预测互联网上或共享显示来进行多任务学习。

最近普林斯顿大学的ze宣中、陈丹琦介绍了非常简单的做法,以标准标准( ace04、ace05、scierc )取得了新的sota成绩。 此方法基于两个独立的预训练编码器,仅使用实体模型为关系模型提供输入特征。 通过一系列仔细的验证,该研究验证了学习不同语境表达对实体和关系的重要性,即在关系模型的输入层融合实体新闻,整合全球语境新闻。

热门:7 Papers & Radios

另外,提出了这种方法的有效近似方法,估计时只需一次运行两个编码器就能得到816倍的加速,准确率只是略有下降。

这项研究提出的模型包括实体模型和关系模型。

研究者通过三个端到端的关系提取数据集ace04、ace054、scierc进行做法的判断,采用f1得分作为判断测量指标。 对不同做法的结果。

完全关系模型和近似模型的f1得分和估计速度。

建议:在端到端关系提取任务中,pipeline方法会回到高峰吗?

论文5:self-trainingandpre-trainingarecomplementaryforspeechrecognition

作者:前同墟、alexei baevski、tatiana likhomanenko等

论文链接: arxiv/pdf/.11430.pdf

摘要:自我训练和无监督事先训练已成为使用无符号数据改进语音识别系统的比较有效的方法。 但是,不清楚它们是否能学习类似的模式,或者它们是否能比较有效地结合。

最近,facebook人工智能研究院( fair )的研究表明,使用虚拟标记和wav2vec 2.0的事先训练在多种标记数据设定中具有互补性。

如果没有来自libri-light数据集的10分钟标记数据和来自librivox数据集的5.3万小时标记数据,则在librispeech clean和other测试集中为3.0%/5.2%的wer (语错误率) 如果用librispeech的所有标记数据进行训练,这种方法可以达到1.5%/3.1%的错误率。

在所有的低资源数据设定中,预先训练和自我训练( wav2vec 2.0 + st )相结合的性能超过了只采用预先训练( wav2vec 2.0 )的性能。 与迭代伪标记方法[14]相比,10h labeled设置大大提高了此方法。

在100 h标签的设置中,如果ls-960被建议为无注释数据,则该研究不能超过基线模型。 但是,采用更大规模的lv-60k作为无标记数据时,这种方法提高了性能,test-other测试集中的语错误率比wav2vec 2.0降低了10%。

该效果在没有语言模型的10 min labeled设定中特别明显:在test-other数据集中,wav2vec 2.0 + st (s2s scratch )将基线方法( wav2vec 2.0 - lm )的语错误率设为83

推荐:来自fair的研究者建议将自我训练和无监督事先训练结合起来执行语音识别任务,说明这两种方法具有互补性,取得了良好的结果。

论文6:asurveyoncontrastiveself-supervised learning

作者: ashish jaiswal、ashwin ramesh babu、mohammad zaki zadeh等

论文链接: arxiv/abs/.00362

摘要:本文说明了来自德克萨斯大学阿灵顿分校的研究者在学习设定中经常使用的自我监视任务和现在提出的不同框架,对图像分类、目标检测和动作识别等多个下游任务的不同做法进行了性能比较,最后说明了现在做法的局限性和将来

热门:7 Papers & Radios

用于自我监视训练的学习用pipeline。

关于预测编码的图像

学习的各种体系结构pipeline。

推荐:论文一作ashish jaiswal是ut arlington年级学生。

论文7:image sentiment transfer

作者:天郎陈,魏行,海田正,杰博罗

论文链接: arxiv/pdf/2006.11337.pdf

摘要:计算机视觉行业有很多任务,如目标检测、图像转换、风格转移等,你听说过“图像感情转移”吗? 罗切斯特大学罗杰波队提出了这项研究任务。 与其他计算机的视觉任务相比,图像的感情转移更具挑战性,需要对图像中的各物体进行不同的感情转移。 该研究提出了灵活比较有效的物体级图像情感转移框架和新的模型sentigan,实验表明该框架可以比较有效地执行物体级图像情感转移。

热门:7 Papers & Radios

本研究提出的画风转变框架。

核心组件sentigan的体系结构

验证物体水平感情迁移的效果。

推荐:图像样式迁移? 语音感情转移? 不,是图像感情的转变。

arxiv weekly radio站

机心与楚航、罗若天发起的arxiv weekly radiostation合作,以7 papers为基础,本周精选了越来越多的重要论文,包括nlp、cv、ml行业各10篇精选,提供语音形式的论文摘要。

本周的10篇nlp精选论文如下。

1.semi-supervisedrelationextractionviaincrementalmetaself-training.( from PhiliPs.Yu )

2.SLM:learningadiscourselanguagerepresentationwithsentenceunshuffling.( fromchristopherd.manning )

3.phonemebasedneuraltransducerforlargevocabularyspeechrecognition.( fromhermanney )

4.topic-preservingsyntheticnewsgeneration:anadversarialdeepreinforcementlearningapproach.( Fromhuanliu )

5.simulmttosimulst:adaptingsimultaneoustexttranslationtoend-to-endsimultaneousspeechtranslation.( fromphiion )

6.cross-domainsentimentclassificationwithcontrastivelearningandmutualinformationmaximization.( fromkurtkeutzer )

7.improvingeventdurationpredictionviatime-aware pre-training.( fromclairecardie )

8.automaticdetectionofmachinegeneratedtext:a critical survey.( fromlaksv.s.lakshmanan )

9.artificial intelligence ( ai ) in action:addressingthecovid-19 pandemicwithnaturallanguageprocessing ( NLP )

10.warpedlanguagemodelsfornoiserobustlanguageunderstanding.( fromdilekhakkanitür )

这周的10篇cv精选论文如下。

1.volumetricmedicalimagesegmentation:a3 ddeepcoarse-to-fineframeworkanditsadversarialexamples.( from Elliot )

2.learningunbiasedregistrationandjointsegmentation:evaluationonlongitudinaldiffusionmri.( Fromwiroj.NI Essen )

3.learningagenerativemotionmodelfromimagesequencesbasedonalatentmotionmatrix.( from her védelingette,nicholas ayache )

4.out-of-distributiondetectionforautomotiveperception.( fromrolandsiegwart )

5.canthestateofrelevantneuronsinadeepneuralnetworksserveasindicatorsfordetectingadversarialattacks? . ( from tinne tuytelaars )

6.end-to-endanimalimagematting.( fromstephenj.maybank,dacheng tao )

7.muti-viewmousesocialbehaviourrecognitionwithdeepgraphicalmodel.( fromdachengtao,xuelong li )

8.revisitingstereodepthestimationfromasequence-to-sequenceperspectivewithtransformers.( fromrussellh.tay les )

9.Vega:towardsanend-to-endconfigurableautomlpipeline.( Fromtongzhang )

10.aspatialhuesimilaritymeasureforassessmentofcolourisation.( frompaulf.Whelan )

本周的10篇ml精选论文如下。

1.comprehensiblecounterfactualinterpretationonkolmogorov-Smirnov test.( fromjianpei )

2.handlingmissingdatawithgraphrepresentationlearning.( fromjureleskovec )

3.age bo-tabular:jointneuralarchitectureandhyperparametersearchwithautotuneddata-paralleltrainingfortabulardata

4.humanversusmachineattentionindeepreinforcementlearningtasks.( frommaryhayhoe,dana ballard,peter stone )

5.dataaugmentationviastructuredadversarialperturbations.( fromsamybengio )

6.autoencodingfeaturesforaviationmachinelearningproblems.( fromkeithcampbell )

7.towardsaunifiedquadratureframeworkforlarge-scalekernelmachines.( From Johana.k.Suy Kens )

8.augmentingorganizationaldecision-makingwithdeeplearningalgorithms:PrinciPles,promises,andchallenges ...

9. controlvae: tuning,analytical properties,andperformanceanalysis.( fromtarekabdelzaher )

10.bayesianvariationaloptimizationforcombinatorialspaces.( fromalánasp uru-guzik )

喜欢这个复印件的人还喜欢

原标题:7 papers &; radios |陈丹琦关系提取新sota; 上海交大医疗版mnist数据集》

阅读原文。

来源:天津新闻信息网

标题:热门:7 Papers & Radios

地址:http://www.tcsdqw.cn/tjxw/21065.html