面向数据发布的科学工作流数据溯源方法研究 |
| |
作者姓名: | 邓仲华 魏银珍 |
| |
作者单位: | 武汉大学信息管理学院; |
| |
基金项目: | 国家自然科学基金项目“大数据环境下面向科学研究第四范式的信息资源云研究”(批准号:71373191)与国家自然科学基金项目“云计算环境下图书馆的信息服务等级协议研究”(批准号:71173163)研究成果之一 |
| |
摘 要: | 越来越多的科学家使用工作流系统设计和运行科学实验。工作流执行的结果数据集可能需要与报告或论文一起发布,以为其他科学实验的输入重复使用。此时,数据的正确性需要被验证,要求科学家在发布数据的同时发布其溯源元数据,包括数据的演变历史、起源和所有权。为协助科学家完成这一任务,文章建立了一个工作流实例,在此基础上,探讨工作流管理系统运行时溯源信息的收集,指出原始溯源信息在支持数据发布任务时的缺陷,提出了一种提纯溯源的方法来获得适合于数据发布任务的溯源信息。
|
关 键 词: | 科学工作流 提纯 溯源 数据发布 |
本文献已被 CNKI 等数据库收录! |
|