首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 423 毫秒
1.
[目的/意义]语句层共被引的关系内容抽取与分类有助于揭示共被引论文间的主题关联。[方法/过程]文章从共被引主题的相似性和相关性出发,利用引用标注位置、作者、语义角色分析、句法分析等信息,将语句层共被引关系划分为同系列、同主题、发展关联、运用关联、并列关联,然后抽取相应的引用主题,构建<被引论文及主题,关系类型,共被引论文及主题>双层三元组,实现共被引关系内容结构化表达,并在Neo4j图数据库中呈现。[结果/结论]实验采用Athar引用语料库;结果表明,本文研究方法可提高语句层共被引网络中关系的可读性和共被引论文的语义搜索、问答与推荐的效率。[局限]实验方法针对英文文献而设计,未来将在更多领域的英文语料上进行验证,并从名词性关系识别、术语选择等方面完善关系内容抽取与分类。  相似文献   

2.
[目的/意义]文章的研究目的是探索科学论文的语义标注模式以满足科研人员快速获取细粒度科学知识的需求。[方法/过程]结合已有的概念模型,提出了一个聚焦于描述科学论文论证过程的语义标注框架,并利用该框架对一篇认知心理学科学论文进行了语义标注实验以验证其有效性。[结果/结论]以上述科学论文为例,利用该框架对其物理结构、论证过程、科学结论和实验过程进行了语义标注,以此构建细粒度的语义出版物,并在此基础上实现了对科学论文的细粒度内容的检索。[局限]如何对科学论文中的图片、表格和数据集进行语义标注,需要进一步研究。  相似文献   

3.
[目的/意义]针对戏曲类视频资源内容的管理难题,旨在构建一个戏曲类视频领域本体,以情节、事件、实体、动作、戏曲音乐等为核心要素,为戏曲类视频语义标注提供参考。[方法/过程]从分析戏曲类视频内容特征出发,确定本体应覆盖的范围;选择复用与参考已有的相关本体,在此基础上进行扩展,确定核心要素及其之间的关系,使用Protégé构建本体。[结果/结论]以豫剧和昆曲的两个经典剧目为例进行语义标注,通过SPARQL检索说明了标注框架的有效性。该本体可对戏曲类视频内容语义有效描述,将多方面的戏曲领域知识与视频内容进行关联,实现视频内容的结构化表达,为向不同类型的用户提供戏曲类视频内容检索提供关键基础。  相似文献   

4.
[目的/意义] 随着"互联网+"在医疗服务行业的应用与发展,积累了大量的医疗评价信息,利用情感分析技术可以对其进行有效地挖掘和利用,从而为医疗管理提供决策参考。[方法/过程] 基于框架语义理论建立医疗情感语义分类词典;采用词典和规则相结合的方法进行在线医疗评论的情感语义分析,标注情感类别、情感主题、极性和强度等信息。[结果/结论] 通过在线医疗评论数据测试,验证了研究方法的有效性和科学性,是情感分析向医疗健康领域纵深发展的一次有益探索。  相似文献   

5.
科学论文内的科学数据组织和发现研究   总被引:2,自引:0,他引:2  
黄可  梁慧刚  姜山  黄健 《现代情报》2009,29(2):34-43
[目的/意义] 科学论文中的图、表等科学数据(文内数据)蕴含有丰富的知识内容。基于细粒度语义组织的文内数据发现有效聚合文献、科学数据两类科研产出,为未来实现全领域、全维度、全粒度、全类型的深度知识发现奠定基础。[方法/过程] 梳理、对比、分析现有3类文内数据的发现模式,尝试构建面向细粒度内容描述的文内数据本体,揭示文内数据的显性特征、内容特征以及与其他类型科学产出的关联特征。[结果/结论] 从面向应用的角度,提出基于本体的文内数据知识发现技术框架,细化"信息抽取—语义标注—关联应用"技术路线,针对关键点技术进行讨论。文内数据本体为科学论文内科学数据提供语义描述和关联组织依据,人工标注结合机器学习自动标注可以解决文内数据部分特征发现问题。  相似文献   

6.
[目的/意义]针对技术功效图构建过程中的主要问题和薄弱环节,提出了一种基于SAO结构和词向量的专利技术功效图构建方法。[方法/过程]利用Python程序获取专利摘要中的SAO结构,从中识别技术词和功效词;结合领域词典与专利领域语料库,运用Word2Vec和WordNet计算词语间的语义相似度;利用基于网络关系的主题聚类算法实现主题的自动标引;采用基于SAO结构的共现关系构建技术功效矩阵。[结果/结论]实现了基于SAO结构和词向量的技术功效图自动构建,该构建方法提高了构建技术功效主题的合理性和专利分类标注的准确性,为技术功效图的自动化构建提供新的思路。  相似文献   

7.
[目的/意义]挖掘高强度关联学科,揭示多学科知识融合规律,有助于更好地把握和推动多学科知识融合。[方法/过程]从Web of Science核心集获取新冠肺炎主题论文,采用Apriori算法挖掘参考文献所属学科的频繁项集和强关联规则,揭示知识融合特征。以一项强关联规则为例,结合关键词聚类分析,识别该学科组合在知识融合后形成的热门主题。[结果/结论]新冠肺炎研究的知识来源非常广泛,跨学科知识融合十分普遍,关联规则挖掘提供了一种识别和预测强关联学科组合及其知识融合趋势的新方案。  相似文献   

8.
[目的/意义] 随着人们对检索文档之间关联关系的理解越来越多样化和细粒度化,检索文档内信息单元间关联关系的构建显得越来越重要。本研究旨在以学术文档内信息单元间关联关系为基础,构建文档的细粒度聚合与关联机制。[方法/过程] 本研究从跨体裁聚合单元知识体系所蕴涵的各类关联关系出发,从信息组在的角度阐述支持情景和语义关联的细粒度聚合理论框架、知识组织系统构建和聚合单元元数据标注等关键问题,并提出聚合机制。[结果/结论] 研究认为构建蕴含聚合单元语义关系、学科领域语义关系、任务和文本关系的本体,采用可反应聚合单元层级与关联关系的聚合单元元数据,是细粒度聚合机制发挥效用的关键。  相似文献   

9.
[目的/意义]为促进健康UGC的利用、共享以及规范化管理,提出一种符合用户认知的知识标注方法。[方法/过程]首先,从健康UGC中抽取认知概念,将其归纳到认知情感、认知需求、认知风格、认知内容4个类目;其次,分析各类目下认知概念间的关联关系以构建个体认知图式,并通过图式筛选和特征融合生成群体认知图式;再次,依据群体认知图式确定知识标注的实体及其关系,进而设计健康UGC的知识标注框架;最后,利用OWL语言对健康UGC的知识标注框架进行语义描述。[结果/结论]本研究方法与大众标注法相比,在查全率、查准率、F1值方面更具优势,能更好地满足用户对健康知识的获取需求。  相似文献   

10.
[目的/意义]旨在为提升政策文本的自动化处理程度提供参考。[方法/过程]在梳理已有政策本体及其构建方式基础上,提出由词汇语义主导的自下而上的本体构建方法,运用本体构建工具Protégé5.5.0构建科技创新政策文本本体,对部分政策内容进行标注并可视化。[结果/结论]该本体适用于科技创新政策文本的结构化语义抽取,能够在一定程度上揭示科技创新政策的结构化语义特征。  相似文献   

11.
[目的/意义]为满足用户多层次、多粒度的知识获取需求,图书馆文献资源组织的对象由文献单元逐步向知识单元转变。[方法/过程]文章在研究单元信息概念和表示模型的基础上,提出基于本体和关联数据的单元信息知识组织框架,并深入探讨了实现单元信息语义组织的核心步骤。以中医养生领域为例,阐述单元信息知识组织语义模型的应用过程。[结果/结论]本文构建的单元信息知识组织模式,是实现单元信息细粒度组织、语义化揭示以及多维度关联的有效途径。该研究可为特定领域单元信息的语义应用提供参考。  相似文献   

12.
[目的/意义] 借助知识图谱对区域政务微博内容进行知识组织与可视化展示,能够提升用户的知识阅读及获取效率。[方法/过程] 首先,基于LDA模型对区域政务微博进行主题建模,通过依存句法分析对微博内容进行语义三元组抽取。其次,构建了区域政务微博知识模型,形成了知识图谱的语义架构。最后,借助图数据库Neo4j及D3.js插件实现了区域政务微博的知识图谱可视化及关联化保存。[结果/结论] 经理论构型与实际验证,本研究构建了基于主题划分的区域政务微博知识图谱,为社交媒体内容的知识图谱构建提供了一定的思路及方法。  相似文献   

13.
王志宇  刘雨薇 《现代情报》2024,(3):47-58+119
[目的/意义]利用政务微博信息构建自然灾害知识图谱,旨在为相关部门加强自然灾害事件的管理提供知识层面的参考价值。[方法/过程]以森林火灾事件为例,选取政务微博信息资源,首先使用LDA主题模型划分微博资源主题;其次构建自然灾害知识图谱的模式层和数据层,包括本体构建、实体抽取、关系抽取和数据融合等环节;最后使用Neo4j图数据库实现自然灾害知识图谱的存储与检索,实现自然灾害信息的组织与可视化。[结果/结论]构建了基于主题划分的自然灾害知识图谱,实现了自然灾害信息的主题知识关联与规范化处理,对提升政府部门防范与管理自然灾害的科学决策水平具有积极作用。  相似文献   

14.
【目的/意义】针对非物质文化遗产(简称“非遗”)视频资源难以入库与管理的难题,提出了一种非遗视频资 源的管理和语义组织的语义标注方法。【方法/过程】首先对非遗视频采用基于SURF算法和窗口阈值的镜头分割方 法,将非遗视频解构成不同颗粒度的逻辑单元;其次构建了非遗视频语义标注的本体模型;最后通过视频语义标注 过程,实现领域知识概念与视频资源间的语义关联,赋予视频单元丰富的语义信息。【结果/结论】非遗视频综合语 义标注方法可对非遗视频资源实现有效管理,为用户提供结构化、语义化的视频浏览及知识可视化等知识服务,对 非遗数字化保护与传播具有重要的意义和价值。  相似文献   

15.
王仁武  孟现茹  孔琦 《现代情报》2018,38(10):57-64
[目的/意义]研究利用深度学习的循环神经网络GRU结合条件随机场CRF对标注的中文文本序列进行预测,来抽取在线评论文本中的实体-属性。[方法/过程]首先根据设计好的文本序列标注规范,对评论语料分词后进行实体及其属性的命名实体标注,得到单词序列、词性序列和标注序列;然后将单词序列、词性序列转为分布式词向量表示并用于GRU循环神经网络的输入;最后输出层采用条件随机场CRF,输出标签即是实体或属性。[结果/结论]实验结果表明,本文的方法将实体-属性抽取简化为命名实体标注,并利用深度学习的GRU捕获输入数据的上下文语义以及条件随机场CRF获取输出标签的前后关系,比传统的基于规则或一般的机器学习方法具有较大的应用优势。  相似文献   

16.
[目的/意义]移动视觉搜索(MVS)服务是移动互联网时代图书馆更好切入用户利用场景和促进图书馆各种资源开发利用的有效措施,而视觉资源与图书馆各种资源的聚合是图书馆MVS服务开展的基础。[方法/过程]从多维度聚合和语义关联两个方面分析了数字资源聚合的理论基础,并从基础数据层、资源描述层、语义聚合层和用户应用层4个方面构建基于语义关联的图书馆MVS资源多维度聚合模型,在此基础上分析了MVS服务的实现流程。[结果/结论]构建移MVS为核心的语义关联视觉资源多维度聚合体系,有利于不同情境下图书馆MVS服务的现实。  相似文献   

17.
[目的/意义]为了实现从非结构化的在线评论中有效提取用户需求,文章提出了数据驱动下产品需求识别的方法。[方法/过程]利用Word2vec表示学习方法,获取评论文本内容的语义向量表示;结合K-means算法和LSA模型实现评论文本聚类,识别产品需求主题;在此基础上,通过网络分析方法探索需求主题间的关联关系。以华为手机的评论数据为例进行方法验证。[结果/结论]结果表明,基于语义的文本特征可以取得较好的聚类效果,与传统方法相比,CH指标和SC指标均得到显著提高,验证了该方法的有效性。研究方法和结果能够为企业产品创新和运营决策提供一定参考。[局限]样本数据集规模不够,缺少跨平台实验计算和比较。  相似文献   

18.
李勇男 《情报科学》2021,39(11):127-132
【目的/意义】为了发现更全面、更具有普适性的反恐情报信息,本文在单层次关联规则挖掘的基础上研究 反恐情报的多层次关联规则挖掘方法。【方法/过程】根据反恐情报的数据特征提出统一最小支持度和多单项最小 支持度参数并用的方式筛选多层次涉恐特征频繁项集,在情报分析过程中保存部分特殊的冗余频繁项集、冗余多 层次关联规则和无趣多层次关联规则。【结果/结论】本文的研究可以发现涉恐数据中不同概念分层的关联规律。 [创新/局限] 文中提出的关联分析方法能够弥补普通的单层次关联规则挖掘在分析包含多层属性的涉恐数据中存 在的不足,为反恐预警和反恐决策提供更丰富、更科学、覆盖范围更广的参考。  相似文献   

19.
[目的/意义]预测社科领域在未来有发展潜力的研究主题对于科研工作者寻找新的学科增长点和政府部门优化资源配置至关重要。文章提出一种基于语义表示和动态主题模型的社科领域新兴主题预测框架,以期丰富和完善主题预测研究的方法体系。[方法/过程]首先,使用BERT模型和UMAP算法对文本进行语义表示和向量降维,再通过动态主题模型对嵌入向量进行聚类,从而获得全局主题;其次,构建新兴主题指标计算公式,基于Neural Prophet模型和非参数检验方法预测新兴主题;最后,通过划分时间窗将全局主题细化为多个局部主题,以定位最近时间段的新兴词汇。[结果/结论]选取“人口老龄化”领域的学术论文和报纸进行实证研究,并采用资料验证法进行方法有效性分析,结果表明该方法能够快速准确地预测社科领域中的新兴主题。  相似文献   

20.
韩娜  马海群  刘兴丽 《情报科学》2021,39(11):180-186
【目的/意义】从大数据驱动角度出发,探索采用人工智能方法实现对政策文本协同性定量分析的可能性。 【方法/过程】以政策全文本数据为研究对象,使用知识图谱技术实现不同主题的本体构建,并应用数据挖掘中关联 规则构建推理模型,对图谱表示的政策文本进行协同性语义挖掘和推理。【结果/结论】围绕“开放数据”和“数据安 全”主题构建知识图谱,实现对政策文本的本体表示,在此基础上使用关联规则完成单文本和多文本在两个主题间 的协同性分析。【创新/局限】本文将知识图谱应用于政策文本分析领域,并完成协同性分析,为政策的全样本分析 提供可能性,后续需扩大样本规模,提升推理效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号