文档名:众包数据管理研究进展与趋势
很多复杂的数据管理和分析任务难以通过自动处理方式完成,而利用人类的认知能力可以帮助解决这些"机器难"任务,例如,实体解析、情感分析和图像识别.众包数据管理就是借助互联网大众来解决这类复杂的数据处理和分析任务.众包数据管理已经受到了学术界和工业界的广泛关注.众包数据管理有三个关键问题:质量控制:由于互联网大众(工人)可能返回错误答案,因此需要有效的策略来处理工人答案,以获得高质量的结果;代价控制:众包不是免费的,代价控制的目的是减少花销;延迟控制:对比计算机处理任务的时间,工人完成任务花费时间较长,因此需要考虑任务的延迟控制.对于众包任务设计、众包数据操作和复杂众包查询的查询优化,目前已经有大量研究结果可用来解决这三个问题.本文综述了国内外众包数据管理的相关研究,并给出了众包数据管理今后的研究工作重点.
作者:李国良 冯建华 周立柱
作者单位:清华大学计算机系,北京CCF数据库专业委员会
母体文献:CCF2015-2016中国计算机科学技术发展报告会论文集
会议名称:CCF2015-2016中国计算机科学技术发展报告会
会议时间:2016年10月1日
会议地点:太原
主办单位:中国计算机学会
语种:chi
分类号:TP3TP2
关键词:众包数据管理 质量控制 代价控制 延迟控制
在线出版日期:2018年11月22日
基金项目:
相似文献
相关博文
- 文件大小:
- 2.67 MB
- 下载次数:
- 60
-
高速下载
|