《TODQA: Efficient Task-oriented Data Quality Assessment》被CCF C类国际会议 MSN2019 评选为会议最佳论文

发布时间:2020-01-07浏览次数:459

 1212日,由李安然,张兰(老师),肖翔,李向阳(老师),谢筠庭等合作的文章《TODQA: Efficient Task-oriented Data Quality Assessment》被CCF C类国际会议 Mobile Ad-hoc and Sensor Networks (MSN 2019)评选为会议最佳论文。

该工作提出了一种高效的针对特定任务的大规模数据集质量评估方法。针对给定任务(例如:图片分类,本文分类等),该方法可对数据集内在质量(正确性,一致性,完整性,时效性等)和面向特定任务的上下文质量(任务相关性,数据多样性等)进行评估,并返回综合考虑各种质量结果的数据集排序。文章所提出的基于采样的高效算法,在针对大规模数据集进行上下文质量评估时,在损失0.34%精度的情况下节省约90%的计算时间。该文章获得评审意见一致高度评价,称“本文提出了一个非常全面的大规模数据集质量评估框架,这对机器学习和数据挖掘研究是一项基础的重要贡献(“This paper proposes a very comprehensive large-scale datasets quality assessment framework, which is a fundamental contribution to machine learning and data mining research.”)


该研究工作得到了国家重点研发计划,国家自然科学基金,以及中央大学基础研究基金的支持。