期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张晨朝乐门靳庆文《图书情报工作》2023,(20):142-150

[目的/意义]基于数据故事本体模型提出一种语义描述及推理方法,旨在生成机器可理解的数据故事语义脚本,完整的数据故事产品能够利用此脚本生成。[方法/过程]首先,基于OWL本体的建模和知识表示方法设计数据故事的XML格式和RDF(S)格式的描述脚本。然后,基于SWRL定义数据故事的语义描述规则,论述数据故事化的语义描述及推理流程与关键任务。最后,以UCI breast-cancer数据集为数据来源,将存储在MySQL数据库中的数据故事内容转换为XML数据故事描述脚本和RDF(S)数据故事语义描述脚本,并使用推理方法标记数据故事的要素及关系。[结果/结论 ]定义包含故事要素、故事要素关联以及故事实例的数据故事脚本,划分出数据故事语义描述与推理的流程以及形式化表示活动中的关键任务,并提出可操作的面向数据故事化的语义描述和推理方法。相似文献

2.

数据故事化:从数据感知到数据认知

朝乐门张晨《中国图书馆学报》2019,45(5):61-78

数据呈现是大数据时代的新课题。通常,数据呈现的主要途经有两个,即数据的可视化和数据的故事化,二者的区别在于,数据可视化主要解决的是数据感知问题,而数据故事化更加关注的是如何将数据感知转换为数据认知。数据故事化涉及三个基本要素:数据、视觉效果和叙述。从数据故事的创作者和受众之间的信息交流模式看,可将数据故事化分为创作者驱动和受众驱动两种不同模式。目前,数据故事化中常用的结构有三种:马提尼酒杯结构、互动演示幻灯结构和向下钻取事结构。数据故事化的主要活动包括理解数据、明确目的、了解受众、确定关键数据、选择故事模型以及故事叙述。数据故事化是数据科学的主要研究内容之一,也是数据科学区别于其他学科的重要特征。图6。表4。参考文献60。 相似文献

3.

数据故事叙述的关键技术研究

张晨朝乐门孙智中《情报资料工作》2021,42(2):73-80

[目的/意义]数据故事化是围绕数据构建叙事从而传递数据洞察的有效方式,目前有多种相关学科的关键技术能够为数据故事化过程尤其是数据故事的叙述过程提供支持,梳理数据故事叙述的支撑技术并设计技术框架对数据故事叙述阶段的实现具有重要价值。[方法/过程]本文首先论述了数据故事叙述的两种方式,分别为视觉叙述和文本叙述。接着构建了数据故事叙述过程的技术框架,并详细阐述了其在数据故事化中的应用。最后分析了数据故事化叙述的相关技术与工具的发展特点。[结果/结论]提出数据故事化的过程包括数据故事的生成和数据故事叙述,叙述阶段已有多种关键技术提供支持,而生成阶段的相关技术存在空白,并总结数据故事化叙述相关技术的六个发展特点。相似文献

4.

数据故事中的人物类型及自动生成方法研究

朝乐门刘慧张天怡李泽仑《图书情报工作》2023,(24):99-110

[目的/意义]人物和情节是数据故事的两大支柱。数据故事的情节通过人物特征、行为、所期待目标、所面对现实和所认为偏见来展开，实现数据故事人物的自动化生成是数据故事化领域科学研究的核心主题之一，对于数据故事的理论研究、自动生成和工程化研发具有重要意义。[方法/过程]首先，探讨数据故事人物的类型、特征及操作。其次，提出基于反事实解释的人物生成方法，分别对数据故事中的主人公、同类人物、异类人物、正面人物和反面人物给出自动生成方法。接着，分析其技术实现，探讨实验设计、数据来源、方法选择及结果讨论。最后，总结论文的主要研究发现，并对未来研究提出建议。[结果/结论 ]在数据故事化领域首次较为系统研究数据故事人物的组成要素、基本类型、主要特征及核心操作，并提出基于反事实的数据故事人物自动生成方法。相似文献

5.

面向局部可解释性机器学习的数据故事生成方法研究

肖纪文《图书情报工作》2023,(2):98-107

[目的 /意义]针对实践中数据故事应包含哪些内容、创作流程是什么等问题,提出一种数据故事生成方法,以期为数据故事的创作提供理论指导。[方法 /过程]在前人的研究基础上,基于数据科学、认知科学、自然语言处理和可解释性机器学习等理论,提出一种面向局部可解释性机器学习的数据故事生成方法,该方法对数据故事的生成步骤和创作方式进行详细的阐述和说明。同时对LIME算法的输出进行改进,使其更易理解。在此基础上对提出的数据故事化方法进行案例实现,以验证方法的可行性。[结果 /结论 ]提出的数据故事生成方法有助于丰富数据故事化研究的理论体系,同时为数据故事的生成研究和数据故事化工具的研发提供一定的启示。相似文献

6.

数据故事化的评价与改进

孙智中朝乐门王锐《情报资料工作》2021,42(2):81-89

[目的/意义]数据故事化评价是监控数据故事化过程、衡量其效果、保障和提升其质量的关键目前,国内外关于数据故事化评价的研究较少,本研究可为今后相关研究提供参考。[方法/过程]本文的评价方法分为基于过程的评价和基于结果的评价。其中基于过程的评价采用软件能力成熟度模型,将数据故事化划分为数据准备、数据分析、故事建模、故事描述和故事呈现五个阶段,并根据具体实施需要定义了过程评价的阶段参考特征和改进方向;基于结果的评价,则是以本文提出的基于结果的评价模型为基础,从受众和使用者视角对个人的接受度和持续接受度进行评价,最后以评价结果为依据提出了改进流程[结果/结论]本文提出的评价方法能够在一定程度上帮助组织在开发过程中把握产品痛点,提升开发能力。同时也可以解释和预测个人的接受意向,为下一步的营销推广活动提供依据。相似文献

7.

数据故事的自动生成与工程化研发

朝乐门《情报资料工作》2021,42(2):53-62

[目的/意义]明确定义数据故事化的内涵与特征,正确理解数据故事与文学故事的区别,实现数据故事化的自动生成和工程化研发是推动数据故事化这一新研究领域的关键所在。[方法/过程]首先,在调查分析数据故事化领域的研究现状的基础上,提出了数据故事化的内涵与特征;其次,采用数据科学与数据工程方法提出数据故事的自动生成流程;最后,运用软件工程方法设计出数据故事的工程化研发的参考架构。[结果/结论]数据故事的自动生成流程的提出对于数据故事化领域的理论研究具有重要借鉴意义,而数据故事的工程化开发参考架构的设计为研发数据故事产品组件及培育产业生态系统具有较大的参考价值。相似文献

8.

科学数据开放共享中的数据权利治理研究

盛小平袁圆《中国图书馆学报》2021,47(5):80-96

科学数据开放共享是我国实施大数据战略的重要组成部分,明确与尊重数据主体权利是实施科学数据开放共享的前提。在当前科学数据开放共享实践中,数据权属并不明确,存在数据确权、数据侵权、数据维权三方面的数据权利问题。其中,数据确权问题主要是指数据权属缺少相关法律界定,数据权属未在理论上形成统一认识,数据确权成本高;数据侵权问题包含数据具体人格权侵权问题、数据一般人格权侵权问题和数据财产权侵权问题;数据维权问题主要表现为缺乏数据维权所需的专门法律,国家之间存在数据维权障碍,数据维权成本高。针对这些问题,本文从法律、技术与管理三个维度构建科学数据开放共享中的数据权利治理框架与治理体系,包含针对数据确权问题的九种治理对策、针对数据侵权问题的十种治理对策和针对数据维权问题的六种治理对策。图1。表1。参考文献62。相似文献

9.

科研人员视角下科学数据安全风险识别框架探究

刘桂锋阮冰颖苏文成《图书馆建设》2022,(4):81-91

科学数据作为科学研究的重要组成部分,其潜在安全风险影响着科学研究每个过程的研究结果。采用访谈法,对分布在10个学科门类、42个学科大类的51位科研人员进行访谈,借助NVivo11Plus质性分析软件,结合扎根理论方法,对51个访谈文本进行编码,基于此,构建科学数据安全风险识别框架,按照维度剖析科研人员在科学研究过程中的行为、外部环境与科学数据安全风险的关系结构：第一,科学数据生命周期的不同阶段呈现的科学数据安全风险存在异同点;第二,科研人员最关注科学数据收集阶段、科学数据处理阶段、科学数据存储阶段的安全;第三,政策、资金、设备、平台、数据五个维度是科学数据安全风险的影响因素;第四,资金、设备是科学数据安全的基础保障。据此,从科学数据生命周期的角度为科研人员在科学研究过程中规避科学数据安全风险提出对策。相似文献

10.

数据知识库质量控制研究：现状、问题与优化路径

郑伯爽贺子岳陈晓峰《中国传媒科技》2022,(8):66-70

开放科学背景下科研数据知识库的诞生绝非偶然,是科学技术和科学需求发展的必然产物,对科研数据知识库质量控制进行研究有助于学术传播和交流,促进科学数据资源管理、利用和长期保存。本文首先从数据知识库的角度出发,通过使用文献调研法、案例分析法以及对比分析法对科研数据知识库质量控制现状进行梳理和分析,通过调研发现科研数据知识库质量控制处于初级发展阶段,并总结出目前数据知识库质量控制流程主要有五个阶段,分别是数据提交阶段、数据存储阶段、数据审核阶段、数据发布阶段以及数据引用阶段;然后指出目前数据知识库质量控制的过程中存在较多的问题;最后基于这些问题,提出相应的优化路径。相似文献