首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
应对档案信息化建设由“信息管理范式”向“知识管理范式”迁移的挑战,为档案数据化工程技术规范的制定提供基础逻辑支持是当前我国档案学研究的迫切任务。本文在梳理档案数据化工程运行机理的基础上,提出“档案数据基因系统”的概念,从逻辑框架、数据模板、数据规则和技术体系四个方面解析了其原理并对实践应用提出若干建议。“档案数据基因系统”是致力于实现大规模多源异构档案数据跨系统融合共享的逻辑框架、数据模板、数据规则和技术体系的总称,对于提升档案数据化工作的规范化程度,建设可信社会记忆基础设施,提供智能化档案信息服务具有重要理论与实践价值。  相似文献   

2.
语义网的实现需要为网络上现有的和新的文档进行广泛可用的语义标注,使其内容可被机器所识别和理解。语义标注是清晰、明确、容易理解的,可作为大量应用的服务基础,适用于多种文本,包括网页、普通(非网络)文档、数据库中的文本等。本文根据语义标注的研究历程,介绍了国内外面向文本的语义标注研究现状,对语义标注所使用的技术进行总结;在已有语义标注方法分类的基础上,对现有的标注方法进行分类分析;指出了近年来语义标注方法的不足,并探讨了面向文本文档的语义标注发展趋势。  相似文献   

3.
针对传统的相似度计算方法在海量信息处理过程中暴露出的数据处理规模限制和性能不足等方面的瓶颈问题,以非结构化文档为研究对象,提出一种基于Hadoop分布式环境,结合Hive数据处理平台和PostgreSQL关系型数据库的文档相似度计算方法,并给出关键技术思路、具体实现步骤和实证研究,通过研究证明Hive SQL语言可有效简化分布式数据处理的复杂性,但实时性有待改进。  相似文献   

4.
新一代可扩展置标语言XML具有面向文档、面向数据和面向语义的功能,能够很好地保证文档一体化过程所产生的电子文件的凭证价值,因此,XML已经成为文档一体化过程中不可或缺的工具.本文从多层次、多角度对文档一体化领域中XML的研究现状进行了统计,并对统计的结果进行了阐述.  相似文献   

5.
近十年来,文献编目领域从理论模型、标准规范到实践应用,均发生了自机读目录问世以来的最大变化。这个变化与关联数据技术的应用直接相关,可以概括为从数字化到数据化,也就是书目数据由机器可读走向机器可操作,进而融入互联网全球数据库。在此过程中,编目界经历了观念上的重要变更(从记录到数据),厘清了混淆的概念(实体及其名称与描述),重新对书目数据建模,并展开了一系列实践。其中,作为应用的重要组成部分,数据基础设施在数据化中发挥着重要作用。图1。参考文献43。  相似文献   

6.
[目的/意义]针对医学文本的特点,提出一种基于语义图的多文档自动摘要方法,并利用其中的语义信息实现摘要主题的识别。[方法/过程]利用SemRep实现源文档概念及其语义关系的规范化抽取并构建语义图,从概念-关系-社区3个层次对网络图中的关键信息进行抽取并生成摘要,利用概念-语义类型-类型分组三级映射实现对概念的归类,结合语义搭配模式对摘要主题进行划分。[结果/结论]通过对5种疾病数据集进行测试,结果显示该方法能有效识别出文献集中的核心内容,语义图中所富含的语义信息能准确地对摘要进行主题划分。  相似文献   

7.
[目的/意义] 根据基金项目数据的特点,提出基于基金项目数据的研究前沿主题探测方法,以期识别出前瞻价值更高的研究前沿,为研究前沿识别相关研究提供借鉴思路。[方法/过程] 首先,基于PLDA模型识别蕴含在基金项目文本中的研究主题;然后基于主题-文档矩阵建立主题和基金项目文档的映射关系,在此基础上,利用主题的资助时间、资助金额和中心性指标进行研究前沿主题探测,从而识别出值得关注的研究前沿主题;最后,利用主题演化可视化分析方法,对研究前沿主题进行演化分析,以预测其发展趋势。[结果/结论] 研究结果表明,该方法可以根据基金项目数据的特点识别出蕴含在其中的研究前沿主题,并且能够分析研究前沿主题的分裂、融合等演化过程。  相似文献   

8.
文本型科技文献是当前科学知识表达以及科学交流的主要形态。为了促进科学交流,对日益增长的科技文献中的科学知识进行数据化及组织呈现的研究和实践逐渐增多。本文对科技文献数据化及组织呈现方法、应用场景、实现技术进行了系统梳理,包括科技文献的元数据化、科学词汇抽取、领域实体及其关系识别、篇章功能结构识别、科技文献语义组织以及科技文献呈现与智能化应用六个维度,总结目前该研究领域存在的主要问题;在此基础上设计了科技文献数据化及组织呈现的整体框架,阐述了该框架实现的四个核心技术:识别抽取技术、语义组织技术、分析推理技术以及展陈交互技术;最后归纳总结了该领域面临的挑战,如科学知识自动获取、科学数据质量及信任性、科学知识交互体验等。未来需要加强各方合作,以高质量的科学数据为基础,实现科学知识的叙事生产和转化。图4。表3。参考文献69。  相似文献   

9.
"档案数据化"底层逻辑的解析与启示   总被引:1,自引:0,他引:1  
梳理中文语境下档案数据化内涵的多种理解视角,参照知识元理论提出体现档案学特色的记录因子理论,从记录因子视角对档案数据化的底层逻辑进行深度剖析,进而确定档案数据化的战略定位并提出若干实践建议.记录因子是对人类社会活动的单一维度、最小颗粒描述,是不可分割的独立记录单元,是构成档案内容信息的基本语义颗粒.基于记录因子理论,"档案数据化"是档案管理部门面向人工智能时代的精准化、智能化服务需求,运用数据科学理论与方法驱动档案管理和服务创新的战略框架,包括"档案领域本体建模""数字档案资源开发""档案文本结构化"和"业务数据档案化"四种并存互补的实践模式,致力于解决档案内容信息碎片化问题,构建多元主体协同参与的档案数据生态,推动粗粒度档案文档服务向细粒度、智能化档案数据服务转型.  相似文献   

10.
[目的/意义] 智慧数据是"智慧地球"背景下数据科学领域的新概念,目前其理论探讨与实践应用均在迅速发展。梳理学界对其认知脉络,凝聚共识、辨析差异,对厘清智慧数据理论体系和促进智慧数据应用开发意义重大。[方法/过程] 在广泛深入阅读国内外领域相关文献的基础上,将智慧数据研究脉络梳理为概念内涵、价值取向、关键技术与应用框架四个分面,通过对比与分析,归纳出智慧数据的三种概念视角、五个特性特征、五类价值取向、三簇关键技术和五大应用领域。[结果/结论] 研究发现,智慧数据的本质在于通过数据演进或结构设计实现数据规范精准及价值增值,其价值取向呈现出多元化复合特征,其技术体系旨在提供"可计算-可理解-可会话"的逐级演进支撑,其应用框架核心在于精准实现"数据"与"用户"的智慧交互,未来智慧数据理论体系还需在大"数据科学"观下围绕理论体系构建、数据权利治理、技术均衡发展、服务层级深化、理论实践交融等不断完善。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号