首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 788 毫秒
1.
[目的/意义]社交网络快速发展的时代,越来越需要自动摘要技术来解决产品评论信息过载。针对现有图模型方法在评论摘要抽取中存在信息不充分、准确性差的问题,提出一种融合主题聚类和语义图模型的多文本摘要方法。[方法/过程]首先运用FCM(Fuzzy C-means)聚类算法对评论文本进行主题划分;然后利用Word2vec模型获取分类评论句子的向量化表达,并根据句子间的语义相似度进行图模型构建;最后利用加权图排序算法,自动抽取出重要性高的句子形成文本摘要。[结果/结论]实验结果显示,该方法能有效识别出产品评论的关键内容,与传统方法相比,融合主题聚类和语义图模型的方法在信息覆盖率和信息多样性指标方面得到了更高的分数,提高了摘要抽取的质量和效率。  相似文献   

2.
[目的/意义]针对传统方法的不足,提出一种以用户评论为数据源的企业产品级竞争对手识别方法。[方法/过程]首先,根据企业分析维度确定候选竞争产品,进行相关评论文本采集;其次,利用信息抽取技术从本企业产品评论中抽取用户较为关注的产品特征;然后,基于情感分析技术设计特征情感权重算法;利用该算法对本企业产品特征进行优劣势分析,获取优势与劣势特征集,完成待分析产品向量空间表示与相似度计算;分析计算结果,挖掘出与本企业产品优势相似及劣势互补的候选竞争产品,并选择优势相似且劣势互补的产品为主要竞争对手,其他优势相似的产品为次要竞争对手。在实证部分,选择"红米Note"手机为分析对象,以"淘宝""京东""中关村在线"多源评论为数据源,利用基于情感分析的竞争对手识别方法挖掘该产品的主要和次要竞争对手。[结果/结论]本文的基于情感分析的竞争对手识别方法能够实现企业产品级竞争对手的识别与分析。  相似文献   

3.
[目的/意义]提出一个药物不良反应本体的半自动构建方法,构建的细粒度药物不良反应本体为利用社交媒体挖掘潜在的药物不良反应信号提供语义资源库。[方法/过程]首先,采用业务层次和语言层次相分离的设计理念,将用户在社交媒体中评论的药物不良反应表示成"对象要素-属性要素-描述概念"的形式。细粒度体现在社交媒体用户对药物同一不良反应描述概念表达的多样性上。然后,基于深度学习的思想,利用基于word2vec的描述概念候选词抽取算法自动地抽取出更多的描述概念候选词构建本体。[结果/结论]以糖尿病药物的建模实例表明,提出的细粒度药物不良反应本体的半自动构建方案,提高了本体构建的智能化水平,构建的细粒度药物不良反应本体为利用社交媒体挖掘潜在的药物不良反应信号提供语义资源库。  相似文献   

4.
[目的/意义] 微信、微博等自媒体中隐含着大量的用户旅游消费需求的信息,将这些信息进行分类并依据分类结果构建需求本体,从而帮助企业分析和研究用户需求以获取巨大的商业价值。[方法/过程] 利用SVM分类算法将微博信息分类并生成分类结果集,这些结果集中包含大量旅游相关概念的词汇,可以作为构建和扩展旅游需求本体的语料;然后通过调查各大旅游网站的类目确定旅游需求的核心概念,抽取分类结果中与旅游相关的概念。[结果/结论] 利用抽取结果匹配核心概念,生成扩展后的本体,使用HOZO本体编辑工具进行修改和完善,并呈现部分旅游需求本体。从实验结果看,本文所提方法能较为准确地对包含旅游需求的文本进行分类。  相似文献   

5.
[目的/意义] 微博平台产品评论的特征级情感分析问题具有其特殊性,为了对特征分类,解决隐式特征的识别问题,并分析特征情感,提出一种基于特征本体的产品评论情感分析方法。[方法/过程] 该方法利用构建的特征本体对特征词分类,通过计算情感词与特征的搭配权重来识别隐式特征,并构建领域情感词典和微博表情符号词典,计算微博产品评论的特征情感极性和强度。[结果/结论] 构建方法模型,通过采集微博评论数据设计实验,验证了提出方法的有效性。  相似文献   

6.
[目的/意义]将体验型产品在线评论按照文本长度分为长文本在线评论和短文本在线评论,探究这两类评论的时间和内容特征,为电子商务平台掌握消费者在线评论行为规律和商品需求偏好提供情报依据。[方法/过程]利用Python爬虫语言获取电影评论网站中在线评论的相关信息,构造在线评论时间间隔序列,基于人类行为动力学相关构念,探究不同类型在线评论发布行为的时间特征规律;利用文本挖掘方法找出不同类型在线评论的文本内容特征并进行比较分析。[结果/结论]以电影评论网站在线评论为数据来源,从时间角度总结出不同类型在线评论行为的时间间隔序列符合幂率分布;从文本内容角度发现不同类型在线评论的文本内容特征既有一定的相似性,也表现出明显的差异。  相似文献   

7.
基于Word2vec的情感分析在品牌认知中的应用研究   总被引:2,自引:0,他引:2  
[目的/意义]通过基于Word2vec的文本情感分析技术对某显示器品牌的产品与服务的在线评论进行分析,研究消费者的品牌认知和品牌口碑,为管理者建立更科学的品牌管理体系提供有针对性的建议。[方法/过程]首先利用自然语言处理技术,对评论语料库进行预处理,结合深度学习的Word2vec词向量技术构建产品特征词和情感词词库,进一步构造情感概念对进行情感评分,并将其用于分析品牌产品特定特征的用户情感。[结果/结论]通过Word2vec构建的情感词典相较于传统方法(例如一般的情绪词表)进行情感分析,在情感分析的准确率上有所提高,再结合有效的情感概念对构造与情感评分,可以有效地理解用户的品牌认知。  相似文献   

8.
[目的/意义] 鉴于网络用户评价已成为人们选择产品或服务时的重要参考指标,旨在了解打分评价和评论评价之间的关系,同时为仅有评论评价的网站提供符合潜在分值的排序和推荐功能。[方法/过程] 通过抓取豆瓣电影的用户评价,使用ROST EA工具进行情感分析得到评论评价的综合情绪值,将其与打分评价进行相关分析,并考虑评论文本的情感强度赋权对结果造成的差异,在此基础上通过回归分析构建回归模型并对其进行检验。[结果/结论] 发现评论评价的综合情绪值与打分评价相关性较高,情感强度的赋权情况对结果影响不大,说明可以根据评论评价预测打分,据此给出相应的回归模型。  相似文献   

9.
[目的/意义]基于关注和评论两种类型的交互网络及它们的组合网络,研究开放式创新平台用户交互对隐性社区的影响.[方法/过程]收集LEGO IDEAS平台中半年的用户交互数据,运用拓扑分析、中心性分析、社区分析,借助Gephi软件分别针对关注、评论和组合关系构建3期网络关系图并进行演化分析.[结果/结论]3种交互网络都具有...  相似文献   

10.
[目的/意义] 在线教育评论是影响用户选择和使用在线课程的重要因素,在线教育评论信息的有用性的研究可以辅助用户选择决策,增强用户的使用意愿,推动在线教育产品迭代更新。[方法/过程] 采用问卷调查和实验研究相结合的方法,分析在线评论情感极性(正面评价、负面评价)、产品类型(搜索型在线教育产品、体验型在线教育产品、信任型在线教育产品)对于在线教育评论有用性感知的影响,同时研究在线教育评论信息的有用性、可信性等对选择和使用在线教育评论信息意愿的影响。[结果/结论] 搜索型在线教育产品和信任型在线教育产品的负面评论比正面评论更有用,而搜索型在线教育产品的评论情感极性对评论有用性无统计上的显著差异。当在线教育评论信息固定为正向评论时,在线教育产品类型对感知有用性的调节作用并不十分显著,然而当在线教育评论信息为负向评论时,在线教育产品类型对在线教育评论有用性有显著调节作用。  相似文献   

11.
[目的/意义]算法推荐类APP吸引了大量用户使用,提高用户留存率一直是各类应用关注的重点。文章探索了用户流失行为的影响因素,为减少用户流失、提升用户使用体验提供建议和对策。[方法/过程]文章采集算法推荐类APP用户评论9772条,采用扎根理论对数据进行编码,以此厘清用户流失行为影响因素,构建算法推荐类APP用户流失行为影响因素模型。[结果/结论]信息因素、环境因素、系统因素、网络社群通过影响用户的控制感间接影响用户流失行为,用户的信息素养在控制感和用户流失行为中起调节作用。  相似文献   

12.
[目的/意义] 为了能够准确发现满足用户信息需求的有用在线评论,对在线评论按照有用性进行排序,帮助用户进行消费决策。[方法/过程] 首先通过文献调研和专家咨询,结合移动O2O用户在线评论的特点,选取影响移动O2O在线评论有用性的8项指标,采用模糊层次分析法进行指标赋权,然后利用定量方法进行指标量化,使用加权灰色关联分析方法进行有用性计算和排序,构建有用性排序模型。最后获取美团商品的在线评论数据进行应用研究,采用与美团原始评论排序结果对比分析的方法,检验方法的可行性和科学性。[结果/结论] 实验结果表明,采用移动O2O在线评论有用性排序模型进行排序,排名靠前的在线评论信息量大,包含产品或服务的维度较多,能够较好地满足用户的个性化信息需求,为用户消费决策提供更大的参考价值。  相似文献   

13.
[目的 /意义]重大突发事件网络舆情在传播过程中往往会出现不同的主题,而微博用户对不同主题的表达和关注也会直接影响网络舆情的传播速度和规模以及舆情事件的走向。针对重大突发事件的微博用户主题演化分析有助于应急管理部门更好地理解重大突发事件的发展轨迹以及公众在不同阶段的关注点,以便采取有效应对措施。[方法 /过程]以网络舆情信息特征为立足点,辅以自然语言处理技术将舆情信息客体与本体进行剥离,结合重大突发事件特征,创新性提出以舆情客体信息为参照基线的舆情本体演化强度来反映微博主题演化趋势。[结果 /结论 ]研究结果表明,面向网络舆情信息本体的主题分析,与网络舆情实际发展演化趋势更加贴近,对主题内容的揭示也更加全面。同时研究思路也对现有网络舆情主题分析的研究方法中单一求助于自然语言处理技术的优化与更新具有一定启示意义。  相似文献   

14.
马超  李纲  陈思菁  毛进  张霁 《情报学报》2020,39(2):199-207
为有效识别旅游产品在线评论中多模态数据对在线评论感知有用性的影响因素,探究基于用户生成内容的在线旅游产品优化方法,从数据融合分析角度出发,对旅游产品在线评论中的多模态数据进行特征融合。以旅游产品的真实在线评论数据作为研究对象,进行描述性统计分析,同时使用机器学习和深度学习方法,进行文本向量嵌入与图片内容识别,融合图文特征向量,构建多模态在线评论有用性分类模型,进行模型测试。实验结果表明,与仅包含文本或仅包含图片的单模态评论相比,图文结合的多模态评论能够更好地进行在线评论有用性预测,结合评论激励机制,提高在线评论质量,能够充分发挥用户生成内容潜在价值,为产品提供者提供优化思路,为产品消费者提供决策支持。  相似文献   

15.
[目的/意义]现有的关键词提取方法不适应社会化问答社区文本长度较短、内容表述口语化、数据集稀疏的特点,且很少考虑用户关注程度对词语重要性的影响,不能有效地提取此类文本的关键词,因此,提出针对社会化问答社区的多属性加权关键词提取方法。[方法/过程]多属性加权关键词提取方法通过引入调节函数和词性对传统TF-IDF进行改进,并通过线性加权融合用户回答数、关注数、浏览数以及评论数4个用户关注属性来综合度量词语权重。[结果/结论]实验表明,该方法能更有效地提取社会化问答社区文本的关键词。  相似文献   

16.
[目的/意义]为识别并去除非理性投资者的网络评论,提升评论的专业程度与质量,促进理性投资,本文以识别股吧中的用户是否属于噪声投资者为研究任务,进行用户画像。[方法/过程]对股吧的用户发文内容进行深度用户表示学习(deep user representation learning),结合股吧用户的粉丝数量、影响力、关注量、自选股、吧龄、发帖量、评论量、访问量等行为特征,提出一种行为-内容融合模型(behaviour and content combined model,BCCM),并在标注数据集上进行实证与对比研究。[结果/结论]实验结果显示,该模型对噪声投资者识别的F1值为79.47%,优于决策树方法(69.90%)、SVM方法(75.61%)、KNN方法(73.21%)和ANN方法(74.83%)。在噪声投资者识别这一特定用户画像研究任务中,通过利用深度用户表示学习引入文本内容特征,能够显著提升用户画像的各种评价指标。  相似文献   

17.
[目的/意义] 为解决现有网页文本缺乏起源标注的问题,提出一种借助PROV本体发现相似网页文本起源关系的方法。[方法/过程] 通过聚类算法、自动语义标注和关联数据构建等技术的综合应用,结合PROV-POL溯源模型,检测网页文本实体的演变过程,实现文本级和属性级两级溯源方案。[结果/结论] 实验验证了借助语义网技术和数据溯源模型实现网页文本数据溯源的可行性,但实验过程中聚类算法的召回率有待提高。  相似文献   

18.
基于领域本体和概念向量的中文文本相似性测度研究   总被引:2,自引:0,他引:2  
文本相似性测度被广泛用于计算用户提问与文档资源相关程度以及基于内容相似资源推荐。OCVSM是一种基于领域本体和概念向量相似性测度的方法。该方法将军用飞机领域知识本体OntoAvion的概念集作为词汇抽取特征项,根据本体中概念间的关系确定特征项的相似度,最后利用余弦算法计算文本向量相似度。实验证明,该方法与基于语言学词典的相似性测度方法相比,更接近用户对文本相似性的判断。表10。图5。参考文献10。  相似文献   

19.
基于领域本体实现Web文本挖掘研究   总被引:1,自引:0,他引:1  
阮光册 《图书情报工作》2011,55(18):116-120
为弥补改进传统Web文本挖掘方法缺乏对文本语义理解的不足,采用本体与Web文本挖掘相结合的方法,探讨基于领域本体的Web文本挖掘方法。首先创建Web文本的本体结构,然后引入领域本体“概念-概念”相似度矩阵,并就概念间关系识别进行描述,最后给出Web文本挖掘的实现方法,发现Web文本信息的内涵。实验中以网络媒体报道为例,通过文本挖掘得出相关结论。  相似文献   

20.
[目的/意义] 构建面向典籍文本的语义本体,能够促进典籍文本的挖掘与分析。然而由于典籍文本与现代文本在语法上存在较大差异,给面向典籍的语义本体构建带来了困难。[方法/过程] 本文运用自然语言处理技术探讨针对先秦典籍的本体构建方法。以国际上文化遗产领域通用的CIDOC CRM为框架,设计先秦典籍本体模型。针对典籍文本内容的特点及句法特征,将规则抽取与条件随机场方法相结合,提出一套本体实例自动获取技术,并以《左传》为实验语料进行测试。[结果/结论] 实验表明,本文所提出的本体实例抽取技术能够较好地提高面向典籍文本的本体构建效率。基于规则的本体实例抽取实验F值在93%左右,基于条件随机场的本体实例抽取最佳特征模板的F值为82.51%。在本体实例获取中,词性信息和位置信息具有重要作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号