共查询到20条相似文献,搜索用时 31 毫秒
1.
[目的/意义]分析社会科学数据集的跨学科性有助于理解数据集在不同学科的扩散规律,促进数据集在不同学科之间开放共享。[方法/过程]本文以CHARLS和CGSS数据集为例,首先对CHARLS和CGSS数据集的学科多样性与平衡性进行测度分析;其次构建CHARLS和CGSS数据集跨学科合作网络,采用Louvain算法对网络进行聚类,探测不同的研究社区,然后采用BERTopic对使用数据集的文本进行主题建模;最后构建不同阶段的跨学科合作网络,揭示CHARLS和CGSS数据集跨学科合作演化特征。[结果/结论]CHARLS和CGSS数据集的跨学科多样性和平衡性不断增长,使用CHARLS和CGSS数据集的学科均形成了以少数学科为主导,多学科共同参与的格局;使用CGSS数据集的研究主题比CHARLS数据集的相对较为分散;CHARLS和CGSS数据集的跨学科合作网络节点数、边数以及社区数在不断增长,网络密度有所下降,不同阶段的主导学科不断变化。 相似文献
2.
3.
【目的/意义】在新冠肺炎疫情中,科学数据为疫情分析、管控和治理提供了重要的依据和支撑,为实现新冠肺炎科学数据的价值最大化,有必要构建新冠肺炎科学数据集元数据框架。【方法/过程】文章以Re3data.org中的新冠肺炎科学数据集为例,在对科学数据集元数据进行收集整理后,构建新冠肺炎科学数据集元数据框架,利用Protégé软件实现科学数据集本体构建,并借助图数据库Neo4j对所构建的知识图谱进行存储。【结果/结论】结果表明,对Re3data.org中的新冠肺炎科学数据集元数据进行关联融合,将元数据转化为多元化的数据存储及展示形式。【创新/局限】实现了新冠肺炎科学数据集知识图谱的构建,并且在图谱之中进行实体及其关系的查询检索和推理,细粒度地创建了科学数据集本体中各个部分属性、实体之间的关联,未来还应侧重跨平台科学数据集元数据的关联与融合。 相似文献
4.
一、产品简介:动物油脂包括猪、牛、羊脂。它们均有其特有的香味,是其它植物油不能代替的品种,大量用于食品加工业如油炸方便面,糕点起酥,速冻食品,日化行业肥皂、香皂皂基原料的加工,甘油提取等。由于我国各地饮食习惯的差异,现在,江西、湖南、湖北、四川、重庆、贵州等地仍以食用猪油为主,这些地区炒菜食用也是猪抽消费比较大的一块。 相似文献
5.
针对桥梁裂缝检测准确率与精度有待提高的问题,提出了基于图像分割技术的U-Net网络进行桥梁裂缝检测。采用西安市的桥梁裂缝数据集,通过人工标定完成了对数据集的标注,用于进行监督学习。针对这一数据集采用了数据增强、空洞卷积、批次归一化等方法提高识别精度,减少过拟合现象;将交叉熵损失与Dice损失相结合,提高了模型训练的速度以及识别精度。与广泛应用的图像分割方法进行比较,实验结果表明该模型在桥梁裂缝数据集上的分割表现结果具有优越性。 相似文献
6.
【目的】探究数据论文及关联数据集出版的元数据标准化工作,为数据期刊建设、科学数据出版机构开展相关创新实践提供参考,推动我国科学数据高质量发布共享。【方法】通过文献调研、内容对比和归纳法分析国内外数据论文出版现状,结合科学数据出版工作实践,提炼数据论文及关联科学数据集出版要素,明确元数据规范对象、关联关系和特点。【结果】提出符合我国管理要求的数据论文及关联科学数据集出版元数据标准规范,形成元数据标准架构,明确元素定义和属性描述,并给出应用示例。【结论】研究成果支撑了国家标准《数据论文出版元数据》研制,对推进我国科学数据产权保护、促进科学数据开放共享和充分释放数据价值具有重要意义。 相似文献
7.
【目的/意义】开放科学迈入全球共识新阶段,构建可计量的开放科学数据影响力评价指标体系,将为我国科学数据共享成效量化评价提供参考方案,对完善数据战略、释放科学数据价值和增加国际科技话语权具有重要意义。【方法/过程】基于文献调研法和国家科学数据中心工作实践,设置可计量的开放科学数据集影响力评价指标,采用专家打分法筛选指标;运用层次分析法对具有科学性、代表性和全面性的样本和指标进行量化研究,实现指标体系所涵盖的所有指标项可计量和各指标的权重可计量。【结果/结论】本文构建可计量的开放科学数据集影响力评价指标体系,涵盖学术影响力、决策影响力、社会影响力、国际影响力和经济影响力5个一级指标及24个二级指标。结论表明:开放科学数据集支撑的学术成果、社会影响、政府决策和国际合作等是其影响力评价指标体系的重要组成,科学数据的经济价值得到广泛认同。【创新/局限】基于调研和实践,本文依据多领域科学数据权威专家数据构建了可计量的开放科学数据集评价指标体系。受限于篇幅,实证研究有待进一步展开。 相似文献
8.
9.
[目的/意义]本研究针对我国地方政府数据开放平台面临的挑战,设计并构建基于CKAN的政府数据开放平台,为我国政府数据开放平台的建设和改进提供参考。[方法/过程]在对CKAN的应用及特征进行概述的基础上,分析CKAN具有的核心功能,探讨CKAN的元数据管理以及关联数据集的API发布,最后给出平台安装的步骤和策略。[结果/结论]充分发挥CKAN平台的核心功能、元数据管理以及关联数据集的API发布等方面的优势,结合Drupal等开源内容管理框架来构建政府数据开放平台才是最优选择。 相似文献
10.
[目的/意义]为知识产权数据资源的有效治理和运用提供支撑解决方案,推进知识产权领域数字化发展和信息公共服务体系升级。[方法/过程]基于对现有知识产权公共服务平台的系统调研,剖析当前知识产权公共服务数据资源的组织与利用现状;在对数据基本构成及场景支撑进行分析的基础上,进一步明确知识产权公共服务数据的语义组织内涵及其实现路径,并通过实例展示其应用效果。[结果/结论]面向公共服务场景设计从原始数据集到语义增强数据集的语义组织框架,归纳实现知识产权公共服务数据语义组织的关键技术及实践原则,形成支撑多服务场景的细粒度数据语义组织与应用模式。 相似文献
11.
12.
清华、重庆中文期刊数据库比较分析 总被引:3,自引:0,他引:3
本文对清华、重庆两大中文期刊数据库进行了比较分析,分析了它们在收录数据、检索功能等多方面的差异,并在此基础上提出了一些有针对性地改进建议。 相似文献
13.
分析了应用数据挖拙的基础和数据特点,讨论了数据挖掘的基本思想,提出了集也数据挖掘的模型结构,为数字化矿山及矿山管理决策提出了一条新的途径。 相似文献
14.
本文概述了地理数据成果从数据的提取、加工到对在线服务数据集的应用,分析了在这个数据加工过程中所用的各类方法,形成一个现势性高,负载量大,结构合理的在线服务数据集,并为基于数据集的在线数据服务分析做出了强大的数据支持。 相似文献
15.
16.
微格式是实现都柏林核心数据集的一种新方式。本文介绍了用微格式实现都柏林核心数据集的背景及实现方法并通过一个实例来展示,随后论证了微格式实现都柏林核心数据集的5个优点,文中最后对微格式实现都柏林核心数据集的前景进行了展望。 相似文献
17.
本文依据重庆维普公司研制的《中文科技期刊引文数据库》1999-2001年的数据,对我国石油、天然气类的主要期刊的自引情况进行统计分析和评价。 相似文献
18.
19.
[目的/意义]为了支撑数据驱动研究范式,促进科学数据的共享与利用,提高数据仓储和发现平台中数据集检索功能的效果。[方法/过程]将科学数据集检索过程分为候选数据集检索和候选数据集重排序两个主要阶段:在第一阶段,将BM25模型与基于SimCSE的稠密检索模型结合,获取潜在的相关数据集;在第二阶段,基于BERT排序模型对候选数据集的相关性进行评分,据此优化检索结果排序。[结果/结论]从国内外13个人文社科相关的科学数据仓储平台采集约10万数据集的元数据进行检索实验和效果评价,结果表明:提出的检索模型效果最优,其NDCG@10的得分分别高于基准的向量空间和BM25模型23.6和11.7个百分点;对各模型检索结果分析发现,该模型相比基准模型具有更强的语义检索能力;此外,还对模型权重设置进行分析,可为实践应用中的参数设置提供参考。[局限]仅在英文人文社科数据集上进行模型效果验证。 相似文献
20.
MARC等传统信息描述方式不适用于科学数据组织。RDA可描述各类型信息资源,基于资源描述框架理论,构建科学数据资源描述框架模型,包括科学数据集描述、数据集一数据文档描述、数据集一访问描述等,为图书馆应用RDA组织和管理科学数据提供基础。 相似文献