首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
邢云菲  曹高辉  陶然 《情报科学》2021,39(9):101-109
【目的/意义】网络用户在线评论是用户对某产品或服务机构体验感知的反馈,对网络用户在线评论的文 本挖掘是情报分析的重要内容。【方法/过程】为了更有效从海量网络用户在线评论文本中挖掘用户感兴趣的信息, 本研究爬取TripAdvisor网站四大城市的酒店用户在线评论,基于主题图谱理论和文本聚类算法构建网络用户在线 评论的聚类模型,通过图谱可视化揭示不同地区酒店用户观点差异,并分析不同图谱的社会网络特征。【结果/结 论】研究发现酒店用户最关注的是服务,其次是酒店的环境和位置。本研究能够快速挖掘酒店用户关注内容,对帮 助酒店管理者了解用户住宿需求并以此提高用户满意度具有重要价值。【创新/局限】本文结合主题图谱和文本挖 掘技术构建酒店用户在线评论主题图谱,在大数据文本主题聚类上显示出优越性。但本文仅分析TripAdvisor网站 四个城市中部分酒店的用户在线评论,数据面覆盖不够广泛。  相似文献   

2.
[目的/意义]文章提出一种从海量非结构化评论数据中聚合用户对学术APP服务需求的思路与方法,为平台的开发者及运营者高效挖掘并分析用户需求提供指导。[方法/过程]以学术APP用户评论为研究对象,在Word2vec词向量表达的基础上,提出一种基于Canopy-Kmeans和MMR的服务需求聚合方法。并以丁香园APP用户评论为样本,利用Python 3. 7与Matlab R2016a完成实验过程。[结果/结论]实验结果表明文章提出的技术方法能够有效识别并聚合学术APP的服务需求,为大数据环境下从数据层面挖掘用户需求提供参考借鉴。  相似文献   

3.
【目的/意义】为了协助商家和平台获取移动商务在线评论中的用户需求,解决在线评论过载导致用户需求 提取困难等问题。【方法/过程】本文首先获取原始在线评论数据集进行文本预处理和清洗;然后,深入语义层面基 于改进后的 Canopy-Kmeans算法实现用户需求聚合;最后,以聚合结果为层级指标设计 Kano问卷,用重要性判别 方法和用户满意度指数优化用户需求分类标准,实现用户需求的高效聚合和精准挖掘。【结果/结论】通过实验结果 对比分析发现与基于语义的传统聚类方法相比,本文设计的移动商务用户需求聚合与挖掘方法的聚类结果更清晰 合理,能够获取更精准和细化的用户需求。【创新/局限】借助Word2vec模型从语义的视角分析用户需求,提出基于 Canopy-Kmeans算法的用户需求聚合挖掘模型,但选取的研究对象和数据规模较为有限,下一步将扩大在线商品 评论的研究范围及实验数据规模。  相似文献   

4.
占泚  熊回香  蒋武轩  李琰 《情报科学》2022,39(1):121-129
【目的/意义】在线健康信息的有效组织对提升全民身体素质具有重要的社会价值。【方法/过程】在分析健 康信息主题、关联关系和资源标引的基础上,构建基于主题图的在线健康信息标签语义挖掘模型,从而构建了健康 信息标签主题图并实现了其可视化导航、浏览和检索等功能。【结果/结论】基于主题图的在线健康信息标签语义挖 掘模型能够准确的发现在线健康信息与信息标签间的深层关系,可以更好地揭示在线健康信息标签的语义关联, 为用户提供信息的可视化浏览和导航功能、提升健康信息的组织效果,帮助用户健康信息获取。【创新/局限】本文 将主题图与健康信息标签相结合,提高了健康信息的检索效率和利用效率,但本文也存在着不足,例如标签样本量 和样本范围较小,缺乏专业医学研究者的参与。  相似文献   

5.
李叶叶  李贺  沈旺  曹阳  涂敏 《情报科学》2022,39(2):65-73
【目的/意义】随着网络购物的普及,在线评论成为影响消费者、销售者和生产者决策的重要数据。大数据 时代,在线评论呈现出多源异构、爆发式增长的特点,难以为用户的购买决策和商家竞争提供有力的情报支撑。【方 法/过程】本文利用多源异构的在线评论数据构建知识图谱,提出了一种基于多源异构数据构建知识图谱的框架, 模式层构建围绕在线评论的信源、内容以及形式构建,最终形成知识图谱的概念框架,并运用word2vec从多源异构 文本中获取实体、关系和属性,并进行数据融合与知识图谱分析。【结果/结论】实验部分以手机商品在线评论为例, 验证了本文所构建的知识图谱对在线评论相关研究及挖掘的有效性,研究结果揭示了多源异构在线评论数据的特 点,为大数据环境下在线评论信息组织、展示和挖掘提供了新的研究视角。【创新/局限】运用知识图谱对在线评论 进行描述,有效解决信息过载、多源异构信息融合等问题。本文采用半自动化的方式构建知识图谱,未来考虑引入 无监督的方法提高构建效率。  相似文献   

6.
李刚  朱学芳 《情报科学》2021,39(12):155-164
【 目的/意义】探讨面向图博档数字化服务融合的知识图谱构建与实现。【方法/过程】梳理图博档领域知识图 谱研究和应用现状,研究图博档知识图谱的构建方法,首先构建图博档知识图谱的结构模型,其次设计知识图谱的 构建流程,包括需求分析、数据获取、知识抽取、知识融合、存储设计和图谱绘制,最后以辛亥革命主题为例设计知 识图谱的存储模式,应用Neo4j图数据库存储并实现图博档主题知识图谱。【结果/结论】图博档知识图谱能跨越其 中单一领域的知识壁垒而融合图博档资源,并能可视化展示图博档数字资源之间的语义关联,方便用户知识获取 与知识发现。【创新/局限】本文研究丰富了知识图谱的应用场景,可为图博档数字化服务融合研究提供一种新的知 识可视化呈现及服务方式。  相似文献   

7.
张雷  谭慧雯  张璇  韩龙 《情报科学》2022,40(3):144-151
【目的/意义】构建高校师德舆情微博用户评论LDA模型,可以更精准识别舆情演化特征和分析关键主题传 播路径,帮助高校和相关部门更为有效地进行舆情监管和舆情引导。【方法/过程】本文以“天津大学一教授学术造 假”事件为例,基于 LDA模型构建高校师德舆情下微博用户主题生成模型,采用困惑度评价指标确定 LDA模型最 优主题数,采用信息熵确定每一主题在不同日期的主题强度,通过关键词共现知识图谱、词云展现舆情话题的演 变,最后基于主题相似度确定主题传播路径。【结果/结论】LDA模型和信息熵可以解析出网络用户群体关注的重要 主题热点,精准识别舆情演化特征,识别主题最优传播路径进行舆论引导,对爆发的舆情实现预测和管制优化。【创 新/局限】文章创新性地构建高校学术道德舆情的LDA主题模型,有效确定微博用户群体主题、识别舆情演化特征、 分析主题间传播路径,具有普适性;进一步扩大高校师德其他舆情分析及结合网络舆情情感分析为下一步的研究 内容。  相似文献   

8.
余本功  王胡燕 《情报科学》2021,39(7):99-107
【目的/意义】对互联网产生的大量文本数据进行有效分类,提高文本处理效率,为企业用户决策提供建 议。【方法/过程】针对传统的词向量特征嵌入无法获取一词多义,特征稀疏、特征提取困难等问题,本文提出了一种 基于句子特征的多通道层次特征文本分类模型(SFM-DCNN)。首先,该模型通过Bert句向量建模,将特征嵌入从 传统的词特征嵌入升级为句特征嵌入,有效获取一词多义、词语位置及词间联系等语义特征。其次,通过构建多通 道深度卷积模型,将句特征从多层级来获取隐藏特征,获取更接近原语义的特征。【结果/结论】采用三种不同的数 据对模型进行验证分析,采用对比相关的分类方法,SFM-DCNN模型准确率较其他模型分类性能有所提高,这说 明该模型具有一定的借鉴意义。【创新/局限】基于文本分类中存在的一词多义、特征稀疏问题,创新性地利用Bert来 抽取全局语义信息,并结合多通道深层卷积来获取局部层次特征,但限于时间和设备条件,模型没有进行进一步的 预训练,实验数据集不够充分。  相似文献   

9.
【目的/意义】通过构建上海市名人故居知识图谱,可以强化沪上名人故居非结构化数据的知识组织问题,为后续历史名人故居学术资源相关研究提供思路和借鉴方法,也为游客选择名人故居游提供便利。【方法/过程】本文基于沪上名人故居用户需求及旅游领域相关行业标准,首先采用自顶向下的方式设计沪上名人故居知识图谱框架,之后以此框架为基础通过序列标注、机器学习等方法填充图谱的实体、关系及属性为沪上名人故居的知识图谱构建提供数据支撑,最后运用Neo4j图数据库对沪上名人故居知识图谱进行可视化存储。【结果/结论】沪上名人故居知识图谱构建实现了资源的可视化存储及语义检索,能够提供数据浏览与知识展示,数据查询与知识检索、知识关联与信息推荐等功能,为后续智能问答、智能信息推荐的应用研究奠定基础。【创新/局限】本研究结合用户需求及上海市名人故居数据结构特点,建构了沪上名人故居知识图谱框架,为后续名人故居知识组织相关研究提供了思路。本文数据的选取仅限于上海市内的知名名人故居,有关研究数据有待进一步扩充以更好地研究文章方法的适用性。  相似文献   

10.
【目的/意义】在线健康社区用户规模庞大,信息量浩如烟海,如何帮助社区管理者和用户判别有用信息,提 高决策效率是亟待解决的问题。【方法/过程】在复杂网络视角下,提出一个新的评论有用性分析框架。首先,采集 在线健康社区患者评论数据,采用文本分析法分析有用评论、非有用评论以及所有评论的主题分布和情感分布,初 步分析各类评论文本的有用性特征;其次,将各类评论文本分别转换为文本关联网络,使用社会网络分析方法进一 步分析其有用性特征;最后,分析评论有用性及其特征与患者发表评论、用户对评论的有用性投票以及文本关联网 络结构特征的关联性,实现基于文本关联网络的评论有用性分析。【结果/结论】有用评论和非有用评论文本关联网 络结构具有一定差异,在线健康社区用户就诊前后的信息需求和经验输出的重点有所不同。【创新/局限】基于复杂 网络视角研究在线健康社区评论有用性,但仅使用了好大夫在线的数据,未来可对更多数量和种类的在线健康社 区信息内容有用性进行研究。  相似文献   

11.
孟秋晴  熊回香 《情报科学》2021,39(6):152-160
【目的/意义】为了向在线医疗社区中的用户自动推荐符合其自身实际需求的医生,本文基于在线问诊文本 信息,提出了基于相似用户与相似医生的混合医生推荐算法。【方法/过程】首先从用户咨询问题出发,找到具有相 似咨询问题的用户,将其所选择的医生作为基于相似用户的推荐集合;然后从医生回答从发,通过LDA主题模型训 练,从医生回答文本集中挖掘出隐含的疾病主题,按主题查找具有相似疾病诊治经验的医生作为推荐集合;最后通 过混合相似度计算融合基于相似用户和相似医生的推荐结果,得到最终推荐列表。【结果/结论】通过对在线医疗社 区“39健康网”进行实证研究,结果表明,利用本文提出的方法进行推荐,能够有效降低数据维度,挖掘文本间的潜 在语义关联,有效缩小语义鸿沟,提升推荐质量,具有较好的推荐效果。【创新/局限】本文仅选取了针对科室的小样 本数据进行实验,且部分参数使用经验值,未来可深入探讨该方法在大规模医疗数据集上的应用。  相似文献   

12.
叶英平  任志欣  周昕 《情报科学》2023,(5):144-152+160
【目的/意义】探究亲子阅读偏好对引导亲子读物选购具有重要的参考价值,通过对亲子读物的在线消费评价进行分析,深度挖掘影响亲子阅读偏好的维度要素,对提高亲子阅读质量和兴趣具有理论意义与实践价值。【方法/过程】从材质材料、形式形态、主题内容、社会感知价值四个维度对亲子阅读偏好进行评价,建立基于情感词典的在线消费评价偏好模型,对评论文本进行情感词抽取及情感值计算,获取在线消费评价中情感数据,绘制在线消费评价的偏好词标签云和动态偏好趋势曲线。【结果/结论】在线消费评价分析结果表明,幼儿更易被材料环保、形式独特的读物吸引;随着认知阶段的发展,亲子阅读偏好逐渐转向对主题内容的关注;注重提升社会感知价值。【创新/局限】本文构建亲子阅读偏好的评价模型,围绕亲子阅读的偏好维度对在线消费评价情感进行可视化分析。本文仅通过情感分析技术提取在线消费评价中的情感数据,未结合对具体消费者的深度访谈,未能全面概述基于在线消费评价的亲子阅读偏好情况。  相似文献   

13.
韩娜  马海群  刘兴丽 《情报科学》2021,39(11):180-186
【目的/意义】从大数据驱动角度出发,探索采用人工智能方法实现对政策文本协同性定量分析的可能性。 【方法/过程】以政策全文本数据为研究对象,使用知识图谱技术实现不同主题的本体构建,并应用数据挖掘中关联 规则构建推理模型,对图谱表示的政策文本进行协同性语义挖掘和推理。【结果/结论】围绕“开放数据”和“数据安 全”主题构建知识图谱,实现对政策文本的本体表示,在此基础上使用关联规则完成单文本和多文本在两个主题间 的协同性分析。【创新/局限】本文将知识图谱应用于政策文本分析领域,并完成协同性分析,为政策的全样本分析 提供可能性,后续需扩大样本规模,提升推理效率。  相似文献   

14.
【目的/意义】旨在将社会化问答社区中碎片化的答案关联起来,并为用户提供不同主题的高质量答案和更 好的知识服务。【方法/过程】首先,本研究利用Doc2vec算法计算答案之间的语义相似度,并构建答案语义网络。其 次,利用Louvain算法对答案语义网络进行社区划分,并用TextRank算法抽取各个主题下文档的关键词,使用词云 对每个主题进行可视化展示。最后,利用PageRank算法对聚类后的答案语义网络进行排序,从而实现答案文档的 主题聚合和排序。【结果/结论】本研究使用“知乎”上的问答数据进行了实证研究。结果表明,所提出的答案聚合和 排序方法不仅能够向用户直观地展示答案之间的关联强度和各个主题答案的主要内容,还能够为用户提供分主题 的答案排序结果,自动为用户筛选高质量的答案。【创新/局限】创新性地提出了答案语义网络,并基于答案语义网 络,提出了一种集聚合、主题可视化和排序于一体的答案知识组织方法。  相似文献   

15.
【目的/意义】移动互联网时代,微博以其快速、便捷的优点迅速成为信息传播与共享的平台之一。在互联 网信息传播过程中,话题内容焦点会随着时间推动发生动态迁移,及时准确的发现话题内容焦点的迁移有助于了 解网络舆情的演化趋势。【方法/过程】首先,定义基于焦点特征词分布的焦点词提取公式,构造焦点特征词集合;然 后,使用Skip-gram模型在大规模语料上训练得到词向量,再通过BTM对文本建模,直接在BTM主题维上结合焦 点特征词集合构造主题词向量;最后,计算主题特征词间的相似度,将其应用到聚类算法中实现话题焦点识别。 【结果/结论】通过对新浪微博数据集上的实验结果表明,本方法能够充分利用词向量引入的语义信息,提高文本聚 类效果,有效的获取各阶段的话题焦点。  相似文献   

16.
陈君  钱晨  何梦婷 《情报科学》2018,36(11):150-157
【目的/意义】基于消费地点情境视角,综合探究线上和线下情境因素对在线评论信息分享行为的作用机 制。【方法/过程】使用社会氛围理论和精细加工可能性模型(ELM),构建基于消费地点的虚拟社区在线评论信息分 享行为研究模型;通过调查问卷实证研究验证模型的有效性。【结果/结论】研究结果表明,线上社区凝聚力、社区支 持和线下产品质量、消费地点氛围均显著影响用户涉入度,进而促进用户在虚拟社区进行在线评论信息分享的意 愿。最后基于研究结果分别针对线下实体店管理和线上虚拟社交平台推广运营提出相应对策建议。  相似文献   

17.
李枫林  柯佳 《情报科学》2019,37(5):155-165
【目的/意义】词是语言的最小单元,词的向量表示决定了机器学习模型的构建方法。深度学习的神经网络 训练得到的词向量,通过无监督的机器学习方法从海量数据中自动学习词汇的语义特征,无需人工标注和复杂繁 琐的特征工程,端到端的完成各种自然语言处理任务,带来了一种新的研究范式,成为学术界的研究热点。【方法/ 过程】介绍了词向量语义表示及优化方法,存在的问题及解决方法,最后指出了词向量未来的研究方向。【结果/结 论】将句法特征、词形特征、(知识库)先验语义知识融入到神经网络模型能增强词向量的语义表示能力,针对词向 量存在的一词多义、解释性差等问题,总结了最新的研究成果。  相似文献   

18.
[目的/意义]为了实现从非结构化的在线评论中有效提取用户需求,文章提出了数据驱动下产品需求识别的方法。[方法/过程]利用Word2vec表示学习方法,获取评论文本内容的语义向量表示;结合K-means算法和LSA模型实现评论文本聚类,识别产品需求主题;在此基础上,通过网络分析方法探索需求主题间的关联关系。以华为手机的评论数据为例进行方法验证。[结果/结论]结果表明,基于语义的文本特征可以取得较好的聚类效果,与传统方法相比,CH指标和SC指标均得到显著提高,验证了该方法的有效性。研究方法和结果能够为企业产品创新和运营决策提供一定参考。[局限]样本数据集规模不够,缺少跨平台实验计算和比较。  相似文献   

19.
【目的/意义】研究知识付费平台用户持续使用行为及其影响因素,不仅有助于丰富知识付费用户行为理 论,而且为平台持续吸引用户、优化知识供给提供参考和建议,是平台实现可持续发展的基础。【方法/过程】以“在 行网”为例,通过八爪鱼软件爬虫获取真实用户评论数据,采用扎根理论的质性研究方法对用户评论数据进行三级 编码,产生33个开放式编码和10个关联式编码,最后形成3个核心式编码,分析用户持续使用行为及其影响因素。 【结果/结论】研究发现,知识付费平台用户持续使用行为包括:重复行为、期待行为和推荐行为,用户认知、用户情 感是持续使用行为的主要影响因素。由此构建了知识付费平台用户持续使用行为影响因素模型。  相似文献   

20.
卢恒  陈章杰  周知 《情报理论与实践》2023,(12):157-166+192
[目的/意义]知识图谱已经成为海量信息资源知识组织的新形态。将知识图谱应用于虚拟学术社区用户生成内容知识组织中,对于虚拟学术社区知识发现及服务具有重要意义。[方法/过程]提出一种基于知识图谱的虚拟学术社区用户生成内容知识共聚框架。首先,运用Word2Vec词向量模型对虚拟学术社区用户生成内容数据集进行词向量表示;其次,基于双向长短记忆神经网络模型与条件随机场识别出虚拟学术社区用户生成内容中的命名实体,基于双向门控循环单元与注意力机制进行实体关系抽取;最后,借助Neo4j图数据库对知识共聚的结果进行可视化展示,并采集丁香园心血管论坛的学术交流帖子,对提出的知识共聚框架进行实证分析。[结果/结论]基于知识图谱的虚拟学术社区用户生成内容知识共聚方法能够有效序化重组虚拟学术社区知识资源,细粒度挖掘和揭示不同类型的知识单元和知识关联,有助于为虚拟学术社区智能知识服务提供语义理解和人工智能的基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号