首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 453 毫秒
1.
邢云菲  曹高辉  陶然 《情报科学》2021,39(9):101-109
【目的/意义】网络用户在线评论是用户对某产品或服务机构体验感知的反馈,对网络用户在线评论的文 本挖掘是情报分析的重要内容。【方法/过程】为了更有效从海量网络用户在线评论文本中挖掘用户感兴趣的信息, 本研究爬取TripAdvisor网站四大城市的酒店用户在线评论,基于主题图谱理论和文本聚类算法构建网络用户在线 评论的聚类模型,通过图谱可视化揭示不同地区酒店用户观点差异,并分析不同图谱的社会网络特征。【结果/结 论】研究发现酒店用户最关注的是服务,其次是酒店的环境和位置。本研究能够快速挖掘酒店用户关注内容,对帮 助酒店管理者了解用户住宿需求并以此提高用户满意度具有重要价值。【创新/局限】本文结合主题图谱和文本挖 掘技术构建酒店用户在线评论主题图谱,在大数据文本主题聚类上显示出优越性。但本文仅分析TripAdvisor网站 四个城市中部分酒店的用户在线评论,数据面覆盖不够广泛。  相似文献   

2.
韩娜  马海群  刘兴丽 《情报科学》2021,39(11):180-186
【目的/意义】从大数据驱动角度出发,探索采用人工智能方法实现对政策文本协同性定量分析的可能性。 【方法/过程】以政策全文本数据为研究对象,使用知识图谱技术实现不同主题的本体构建,并应用数据挖掘中关联 规则构建推理模型,对图谱表示的政策文本进行协同性语义挖掘和推理。【结果/结论】围绕“开放数据”和“数据安 全”主题构建知识图谱,实现对政策文本的本体表示,在此基础上使用关联规则完成单文本和多文本在两个主题间 的协同性分析。【创新/局限】本文将知识图谱应用于政策文本分析领域,并完成协同性分析,为政策的全样本分析 提供可能性,后续需扩大样本规模,提升推理效率。  相似文献   

3.
张丽  马静 《情报科学》2019,37(10):20-25
【目的/意义】本文构建一种“特征降维”文本复杂网络进行文本表示,解决传统词同现文本复杂网络处理海 量数据时的维数灾难与语义不足问题,再结合机器学习方法提升文本特征提取效果。【方法/过程】依据共现关系抽 取二级词条,再结合依存句法关系抽取三级词条,构建“特征降维”文本复杂网络,接着利用PCA算法和TOPSIS法 评价网络节点重要性提取反映文本主题的关键词作为文本特征词,实现文本特征提取。【结果/结论】本文以网络新 闻数据为实验对象。实验结果表明,特征降维文本复杂网络能较好地表示中文文本,并且在较好地保留了文本语 义信息的同时有效减少网络节点冗余,结合PCA算法的特征提取方法可以使文本分类性能提高。  相似文献   

4.
周贞云  邱均平 《情报科学》2022,39(1):184-192
【目的/意义】知识图谱不仅是新一代人工智能的前沿技术,而且是大规模知识工程的学科方向。探究我国 知识图谱研究的分布特点和发展趋势,将对技术应用和学科研究具有参考价值和借鉴意义。【方法/过程】本文运用 文献计量学方法和数据可视化技术,针对我国知识图谱研究重要文献的来源库、期刊、基金、机构、作者、关键词等 进行计量研究,采用ECharts和VOSviewer工具可视分析。再根据共词分析方法挖掘“知识抽取”和“知识应用”两大 研究主题,使用Python软件绘制词云图,着重阐述其核心内容、关键问题和主要趋势。【结果/结论】我国知识图谱研 究具有应用跨界与文献激增的总体特点,并呈现六大具体特点。面向开放域的知识抽取技术和智能应用方法,将 成为大规模知识图谱的未来发展趋势。【创新/局限】聚焦人工智能学科范畴,依据共词分析和生命周期,综合利用 多种可视化工具,我国知识图谱研究的分布特点和重要主题得以阐述。然而,国际知识图谱的文献计量与主题挖 掘,尚待进一步分析与研究。  相似文献   

5.
【目的/意义】大数据技术的发展与应用使大数据治理成为学术界的研究热点。可视化图谱能够直观地揭示该领域的研究概况与趋势。【方法/过程】运用文献计量信息可视化软件CiteSpace,以CNKI数据库中CSSCI期刊收录的大数据治理研究相关文献为数据来源,对该领域研究成果的总体概况、研究机构、期刊来源等进行特征分析,并绘制关键词共现图谱、聚类图谱和突变词信息表,分析了关键词的特点与发展趋势。【结果/结论】结果表明该领域的研究热点主题包括大数据治理的基本概念、大数据的管理和大数据治理的应用等方面,研究内容丰富且不断演变创新,未来有较大的发展空间。【创新/局限】借助可视化文献计量工具系统梳理了大数据治理的研究现状和发展趋势,提出了未来的发展建议。  相似文献   

6.
【目的/意义】旨在从网络舆情用户信息及文本内容视角出发,构建不同维度的网络舆情主题图谱,结合主 题图谱对网络舆情进行特征演化及可视化分析,为舆情管理提供参考。【方法/过程】本文以实体抽取和关系构建技 术为基础,构建了网络舆情主题图谱模型,并以“台风利奇马”事件为例,建立了三个不同维度的主题图谱,结合用 户和文本等多维度微观数据,对网络舆情特征演化进行分析。【结果/结论】在该事件中,用户影响力节点具备多元 化、相关性、官方主导性等特点;网络舆情演化对应台风事件发展存在一定的滞后性;PC终端存在传播媒介种类少、 发博数量多且用户集中等特点,移动终端存在传播媒介种类多、发博数量少且用户分布均匀等特点。【创新/局限】 本文借助主题图谱,构建了网络舆情用户节点和文本节点及其关联关系,从用户、账户、内容三个维度系统且全面 的展示了网络舆情特征的演化规律。  相似文献   

7.
胡吉明  钱玮  李雨薇  文鹏 《情报科学》2021,39(10):11-17
【目的/意义】本文以主题为核心,从外部属性和内容属性两个视角展开政策文本结构化解析,直观反映政 策核心内涵,挖掘政策文本语义,为政策内容解读提供新模式。【方法/过程】利用LDA2Vec主题模型实现基于上下 文的政策文本主题识别,同时借助位置和语法规律提取外部属性,以此构建政策文本结构化解析的描述框架。【结 果/结论】“互联网+”政策文本解读的实证分析发现,本文所提框架有助于直观展现政策要素,有效揭示政策文本主 题分布,以及进行大规模政策领域文本的批量分析和解读。【创新/局限】通过结构化解析框架展现政策文本的形式 化特征和主题性特征,帮助政策相关群体把握政策制定的特点和侧重点,目前深层次内容解读有待进一步研究。  相似文献   

8.
李刚  朱学芳 《情报科学》2021,39(12):155-164
【 目的/意义】探讨面向图博档数字化服务融合的知识图谱构建与实现。【方法/过程】梳理图博档领域知识图 谱研究和应用现状,研究图博档知识图谱的构建方法,首先构建图博档知识图谱的结构模型,其次设计知识图谱的 构建流程,包括需求分析、数据获取、知识抽取、知识融合、存储设计和图谱绘制,最后以辛亥革命主题为例设计知 识图谱的存储模式,应用Neo4j图数据库存储并实现图博档主题知识图谱。【结果/结论】图博档知识图谱能跨越其 中单一领域的知识壁垒而融合图博档资源,并能可视化展示图博档数字资源之间的语义关联,方便用户知识获取 与知识发现。【创新/局限】本文研究丰富了知识图谱的应用场景,可为图博档数字化服务融合研究提供一种新的知 识可视化呈现及服务方式。  相似文献   

9.
【目的/意义】本文提出了借助知识图谱的知识互联和可视化分析等功能,为公共危机事件智能治理提供知 识支撑的观点。【方法/过程】以“港独”为例,从新华网、人民网、中国新闻网等“港独”新闻语料中抽取实体,构建公 共危机事件知识图谱模型。从知识图谱本体构建和实体数据填充两个方面,对“港独”知识图谱的实体抽取、关系 抽取、知识融合、知识加工和知识推理等构建环节进行重点论述和实践,最后,利用Neo4j数据库实现知识存储,生 成的“港独”知识图谱。【结果/结论】通过Cypher语句对“港独”知识图谱进行查询,能够呈现可视化语义网结构图, 利于知识隐重发现。【创新/局限】本文的创新之处在于把知识图谱技术应用于公共危机事件治理中,为其智能查 询和决策分析提供数据支持。在今后实践中,数据源的选取不必局限于网络新闻语料,还可以适当对“港独”人员 的微博、微信、论坛中的信息进行采集和抽取,以此扩大知识关联,从而更为全面、高效地进行公共危机事件智能 治理。  相似文献   

10.
于娟  黄恒琪 《情报科学》2019,37(10):8-12
【目的/意义】人物关系数据中隐含着丰富的信息,是组织进行特定管理决策的重要依据。人物关系知识图 谱推理研究能够发现隐含人物关系并检测人物关系数据中存在的不一致,从而支持组织基于人物关系的管理决 策。【方法/过程】首先依据已有人物关系数据构建人物关系知识图谱,存储至图数据库中;然后基于自定义规则推 理发现并添加隐含的人物关系;通过检测补全后的人物关系知识图谱是否存在属性值异常或关系不一致,来修正 原有人物关系数据或判断新增数据的正确性。【结果/结论】隐含人物关系的发现和添加提高了人物关系自动推理 与数据异常检测的准确性。并且,将人物关系数据的存储由二维表结构转变为图数据结构,能够大幅提升人物关 系自动推理的效率。  相似文献   

11.
李枫林  柯佳 《情报科学》2018,36(3):169-176
【目的/意义】从大量非结构化文本中抽取出结构化的实体及其关系,是优化搜索引擎、建立知识图谱、开发 智能问答系统的基础工作。【方法/过程】介绍了深度学习框架下不同神经网络模型实现实体关系抽取的方法,比较 了各种模型的优劣势,结合远程监督和注意力机制进一步提高关系抽取性能,最后指出了深度学习模型的不足及 未来发展方向。【结果/结论】实验发现,卷积神经网络擅长捕获句子局部关键信息,循环神经网络擅长捕获句子的 上下文信息,能反映句子多个实体之间的高阶关系,递归神经网络适合短文本的关系抽取。如果模型能结合自然 语言的先验知识,实体关系抽取将会取得更好的效果。  相似文献   

12.
【目的/意义】基于知识元挖掘科技文献中的科学知识,建立科学知识之间的联系,构建细粒度知识图谱,旨在打通知识之间的壁垒,满足用户细粒度的知识需求。【方法/过程】首先,本文构建基于图的知识元表示框架,并以知识元为核心构建细粒度知识组织模型;其次,设计面向科技文献知识元的知识图谱,并探究知识图谱构建流程,以实现知识图谱的自动化构建;最后以科技文献中的摘要和引言为实验数据,进行实证研究,构建面向科技文献知识元的知识图谱。【结果/结论】本文所构建的知识图谱不仅能直观地展现学术论文所需要探究的问题、所提出的方法和模型等,还能够揭示科学知识之间的内在关联。【创新/局限】本文探究了细粒度知识组织模型,构建了面向科技文献知识元的知识图谱。在未来的研究中,将不断完善知识图谱构建流程,并探索知识图谱的应用领域。  相似文献   

13.
李叶叶  李贺  沈旺  曹阳  涂敏 《情报科学》2022,39(2):65-73
【目的/意义】随着网络购物的普及,在线评论成为影响消费者、销售者和生产者决策的重要数据。大数据 时代,在线评论呈现出多源异构、爆发式增长的特点,难以为用户的购买决策和商家竞争提供有力的情报支撑。【方 法/过程】本文利用多源异构的在线评论数据构建知识图谱,提出了一种基于多源异构数据构建知识图谱的框架, 模式层构建围绕在线评论的信源、内容以及形式构建,最终形成知识图谱的概念框架,并运用word2vec从多源异构 文本中获取实体、关系和属性,并进行数据融合与知识图谱分析。【结果/结论】实验部分以手机商品在线评论为例, 验证了本文所构建的知识图谱对在线评论相关研究及挖掘的有效性,研究结果揭示了多源异构在线评论数据的特 点,为大数据环境下在线评论信息组织、展示和挖掘提供了新的研究视角。【创新/局限】运用知识图谱对在线评论 进行描述,有效解决信息过载、多源异构信息融合等问题。本文采用半自动化的方式构建知识图谱,未来考虑引入 无监督的方法提高构建效率。  相似文献   

14.
张毅  李欣 《情报科学》2019,37(11):169-177
【目的/意义】将人工智能技术与可视化技术相结合,解析文章题名与摘要中包含的隐藏信息,为探索我国 图书情报领域的研究历史与现状提供全新研究视角。【方法/过程】从CNKI数据库中下载CSSCI来源期刊中图书情 报学领域的全部文章元数据148 956条,利用自然语言处理技术抽取题名与摘要中的标签、分类以及情感倾向,通 过统计、聚类、神经网络预测以及知识图谱等方法,绘制期刊下载与被引关系图、构建影响文献被引因素模型、研究 热点与情感倾向迁移图以及高质量文章的知识图谱等。【结果/结论】揭示了1957-2018年图书情报领域文献被引与 下载的关系,挖掘文献被引的影响因素,找出研究热点的变迁演化以及高被引文献的特征。  相似文献   

15.
周萌  陈果 《情报科学》2019,37(3):81-87
【目的/意义】传统共现分析方法应用于文本挖掘时,因关系粒度过粗导致难以有效利用文本内容中的语义 关系。本文以武器装备简氏文本为例,提出基于文本内容的细粒度关系抽取和可视化分析方法。【方法/过程】首 先,对原始简氏文本进行解析以提取武器装备名称,然后进行共现句子的提取,再扫描这些共现句子中的高频动名 词作为候选特征词;随后结合领域专家给出的武器装备细粒度关系词并根据在线同义词典进行特征词的归类和扩 展,以确立武器装备细粒度共现关系类型(包括替换、升级改造、配备安装、相似四种)和相应的特征词,并构建具有 多种类型边的武器装备细粒度共现网络。【结果/结论】最后,对该网络进行可视化分析,包括:按边类型划分子网 络、以节点为中心的武器多维关联分析和武器装备演化分析。细粒度共现网络的构建和分析有助于更全面、具体 地揭示该领域的整体、微观知识结构和知识演化情况。  相似文献   

16.
柯佳 《情报科学》2021,39(10):165-169
【目的/意义】实体关系抽取是构建领域本体、知识图谱、开发问答系统的基础工作。远程监督方法将大规 模非结构化文本与已有的知识库实体对齐,自动标注训练样本,解决了有监督机器学习方法人工标注训练语料耗 时费力的问题,但也带来了数据噪声。【方法/过程】本文详细梳理了近些年远程监督结合深度学习技术,降低训练 样本噪声,提升实体关系抽取性能的方法。【结果/结论】卷积神经网络能更好的捕获句子局部、关键特征、长短时记 忆网络能更好的处理句子实体对远距离依赖关系,模型自动抽取句子词法、句法特征,注意力机制给予句子关键上 下文、单词更大的权重,在神经网络模型中融入先验知识能丰富句子实体对的语义信息,显著提升关系抽取性能。 【创新/局限】下一步的研究应考虑实体对重叠关系、实体对长尾语义关系的处理方法,更加全面的解决实体对关系 噪声问题。  相似文献   

17.
【目的/意义】研究新媒体环境下企业微博信息行为特征,通过对比分析五家同类型企业微博信息行为过程,提出建议,从而提高企业与用户信息交互的效果,提高企业核心竞争力。【方法/过程】本文通过网络爬虫采集五家汽车企业近三年来的全部微博数据及粉丝数据,采用知识图谱分析方法,将企业微博在线活动特征可视化,分析企业在线活动的时间特征,在线内容挖掘及热点分析,共同关注者的网络可视化及差异比较。【结果/结论】本文基于知识图谱构建的新媒体环境下企业微博信息行为模型可以作为企业在线信息活动分析的研究框架;数据分析结果表明企业可以利用新媒体平台进行在线活动,提升企业与用户的信息交互效果。  相似文献   

18.
【目的/意义】大数据时代文本主题挖掘在情报分析领域中的作用日趋重要,通过特征比较共词分析和 LDA模型分析两种主流文本主题挖掘方法,研究两者的具体特点,为相关人员合理地运用文本主题挖掘方法处理 数据提供一定的参考。【方法/过程】本文分两种情况对比研究:第一、两者挖掘不同时段同一种类文本数据的主题 分布信息和主题演化信息的能力;第二、两者挖掘同一时段不同种类文本数据的提取正确主题的能力。【结果/结 论】在不同时段LDA模型分析与共词分析相比挖掘主题分布信息的能力可不断提升,并且其可挖掘出更加细化的 主题演化信息;在同一时段LDA模型分析对语义关系模糊逻辑结构粗糙的文本提取正确主题的效果明显优于共词 分析。  相似文献   

19.
【目的/意义】金融领域实体关系抽取是构造金融知识库的基础,对金融领域的文本信息利用具有重要作 用。本文提出金融领域实体关系联合抽取模型,增加了对金融文本复杂重叠关系的识别,可以有效避免传统的流 水线模型中识别错误在不同任务之间的传递。【方法/过程】本文构建了高质量金融文本语料,提出一种新的序列 标注模式和实体关系匹配规则,在预训练语言模型BERT(Bidirectional Encoder Representations from Transformers) 的基础上结合双向门控循环单元 BiGRU(Bidirectional Gated Recurrent Units)与条件随机场 CRF(Conditional Random Field)构建了端到端的序列标注模型,实现了实体关系的联合抽取。【结果/结论】针对金融领域文本数据 进行实验,实验结果表明本文提出的联合抽取模型在关系抽取以及重叠关系抽取上的F1值分别达到了0.627和 0.543,初步验证了中文语境下本文模型对金融领域实体关系抽取的有效性。【创新/局限】结合金融文本特征提出 了新的序列标注模式并构建了基于BERT的金融领域实体关系联合抽取模型,实现了对金融文本中实体间重叠关 系的识别。  相似文献   

20.
【目的/意义】使用人工或常用软件工具获取本体概念及概念间关系已无法满足自媒体环境下大数据的本 体构建及维护的要求,本文尝试用自动或半自动方式予以实现。【方法/过程】对电子商务领域原始语料进行分句、 分词等预处理,构建领域语料库;使用基于语言学以及统计学的方法提取电子商务领域本体概念,同时提出基于混 合策略的本体概念抽取方法;然后使用基于语言学、聚类的方法提取电商领域本体概念与概念之间存在的分类关 系,使用基于关联规则挖掘的方法抽取其本体概念与概念之间存在的非分类关系。【结果/结论】将文本挖掘与本体 构建结合起来,提出了领域本体概念及概念间关系自动抽取与本体构建方法,实验表明使用本体框架 Jena利用此方 法可以自动构建电子商务领域本体,并可将其应用到通用的语义检索系统中。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号