共查询到20条相似文献,搜索用时 0 毫秒
1.
为解决传统的情感分析方法中存在的语义理解能力不足和情感分析不充分问题,本文从语义的角度,运用构建模糊情感本体的方法,对中文在线评论情感分析进行研究.引入情感空间模型,并将传统的在线评论情感分析细分为特征评价和情绪表达两方面.基于已建立的模糊情感本体,对产品(服务)的特征、情感类和强度、程度词、否定词、修辞方法和标点等语义元素进行标注,构建从句子层到文档层的情感计算方法.选取有代表性的评论语料进行实验,结果表明建立的情感分析方法具有优良的准确性和应用性,进一步分析发现不同评论语料中情感具有不同的表达形式和关联关系. 相似文献
2.
3.
研究分词在统计机器翻译中的影响因素,分析不同分词对机器翻译词对齐模型的影响,提出基于粒度约束和子串标注的分词优化方法,并通过优化分词提高机器翻译的效果。 相似文献
4.
中文生物医学文本无词典分词方法研究 总被引:1,自引:0,他引:1
为了在不利用词典的条件下实现对中文生物医学文本的有效切分,结合中文生物医学文本专业术语多、新术语不断出现和结构式摘要的特点,引入一种基于重现原理的无词典分词方法,并在实际应用过程中从分词长度上限值的设定和层次特征项抽取两方面对其进行了改进。实验结果表明,该方法可以在不需要词典和语料库学习的情况下,实现对生物医学文本中关键性专业术语的有效抽取,分词准确率约为84.51%。最后,基于本研究中的分词结果,对生物医学领域的词长分布进行了初步探讨,结果表明中文生物医学领域的词长分布与普通汉语文本有非常大的差异。研究结果对在处理中文生物医学文本时N-gram模型中N值的确定具有一定的参考价值。 相似文献
5.
[目的/意义]将体验型产品在线评论按照文本长度分为长文本在线评论和短文本在线评论,探究这两类评论的时间和内容特征,为电子商务平台掌握消费者在线评论行为规律和商品需求偏好提供情报依据。[方法/过程]利用Python爬虫语言获取电影评论网站中在线评论的相关信息,构造在线评论时间间隔序列,基于人类行为动力学相关构念,探究不同类型在线评论发布行为的时间特征规律;利用文本挖掘方法找出不同类型在线评论的文本内容特征并进行比较分析。[结果/结论]以电影评论网站在线评论为数据来源,从时间角度总结出不同类型在线评论行为的时间间隔序列符合幂率分布;从文本内容角度发现不同类型在线评论的文本内容特征既有一定的相似性,也表现出明显的差异。 相似文献
6.
用户在社交网络的评论内容反映了其对公共图书馆的观点和情感,是公共图书馆创新服务模式、提高服务质量的重要依据.基于Python采集用户在大众点评、携程网上对31家省级公共图书馆的评论内容,利用词频分析、高频词语义网络构建、LDA主题聚类、情感倾向分析等挖掘文本内容,分析评论内容特点及用户情感.研究发现,完善基础设施配套、... 相似文献
7.
8.
在线图书评论是出版信息数据的精华,对图书销量影响显著,选题策划应重视并利用在线图书评论挖掘的信息数据,并结合定量、定性分析进行信息整合,充分挖掘利用其背后隐藏的有效出版信息,以使选题策划更趋科学合理,推动选题策划和出版开发由传统业务驱动型向数据驱动型转变. 相似文献
9.
基于Hash算法的中文分词的研究 总被引:1,自引:0,他引:1
姚兴山 《现代图书情报技术》2008,3(3):78-81
通过对已有算法的分析,提出一种新的词典结构,并根据词典给出分词算法。理论和实验证明,算法在速度和效率上有很大的提高。 相似文献
10.
基于哈希算法的中文分词算法的改进 总被引:1,自引:0,他引:1
中文分词是中文信息处理一个重要的部分,一些应用不仅要准确率,速度也很重要,通过对已有算法的分析,特别是对快速分词算法的分析,本文提出了一种新的词典结构,并根据新的词典给出了新的分词算法,该算法不仅对词首字实现了哈希查找,对词余下的字也实现哈希查找。理论分析和实验结果表明,算法在速度和效率比现有的几种分词算法上有所提高。 相似文献
11.
[目的/意义] 本文旨在提出一种从大量在线商品评论数据中挖掘影响读者满意度的关键因素的方法,并深入探讨各个影响因素对消费者满意度的影响模式和影响程度,进而为图书出版企业、电商平台持续改善读者满意度提供理论基础。[方法/过程] 一方面利用朴素贝叶斯分类器将读者的情感进行分类。另一方面对评价文本中的高频名词进行聚类,发现影响读者满意度的主要因素。在此基础上基于最大程度减少不确定性的原则对各个影响因素的影响模式和影响程度进行分析。[结果/结论] 以京东人工智能类图书评论为例进行了实证研究,发现包括内容、价格在内的六个因素可以极大地反映出读者的满意度(83.2%)。因此对于图书类商品,可以通过对大量历史评论数据的学习,找出影响读者满意度的主要因素,据此设计出简化的读者评论框架,以增强读者参与评论的积极性,提高评论的质量。"图书内容"是影响读者满意度的最主要因素。当读者对图书内容表达出不同的情感时,其他因素对读者满意度的影响模式和程度是完全不同的。当读者对图书内容表示满意时,89.2%的总体评论是好评,其他因素的影响较小,价格是导致中评和差评的最主要因素;当读者认为图书内容一般时,评论趋向于中性,读者对服务和物流更为关注;当读者认为图书内容不令人满意时,影响读者满意的因素依次是包装、服务质量和价格。基于不同影响因素对读者满意度的影响模式和影响程度,图书出版企业和电商平台可以更加有针对性地对其加以改善,以提高读者满意度。 相似文献
12.
海量的在线评论表达了用户对于图书整体及其内容、印刷等属性的观点与态度,能够反映图书的影响力。文章对图书在线评论进行多层次细粒度挖掘从而评价图书影响力。首先获取图书的在线评论数据,然后细粒度挖掘图书评论以获取评价指标,并且通过比较多个文本表示方法及构建领域情感词典提高指标挖掘的性能,最后整合评价指标获取图书影响力结果。实验结果表明,虽然存在学科差异,但是图书的在线评论可以作为图书影响力评价的有效资源。此外,在研究语料中,基于One-hot文本表示方法的评论情感判断性能优于基于主题模型与基于深度学习的方法,同时,考虑模糊情感词的情感词典能够有效提升情感判断的性能。 相似文献
13.
基于Lucene的中文字典分词模块的设计与实现 总被引:8,自引:1,他引:8
在分析Lucene语言分析器结构的基础上,采用基于中文字典的正向最大匹配分词算法,设计实现能够在基于Lucene的搜索引擎中处理中文信息的中文分词模块。 相似文献
14.
15.
分析中文自动分词的现状,介绍和描述几种不同的分词思想和方法,提出一种基于字位的分词方法。此分词方法以字为最小单位,根据字的概率分布得到组合成词的概率分布,因此在未登录词识别方面比其它方法有更优秀的表现。使用最大熵的机器学习方法来进行实现并通过两个实验得出实验结果的比较分析。 相似文献
16.
17.
近十年来,国内外学者在不断探索在线评论的测度和文本挖掘方法的基础上,对在线评论与销售绩效间的关系进行了大量实证研究,研究结论包括正相关、负相关、不显著等多种形态关系.这表明,在线评论对销量的影响不仅取决于在线评论维度的选取与测度等自身因素,还取决于在线评论的产品类别、来源平台差异、文化语境等情境因素.由于在线评论分析的领域性较明显,本文仅以图书领域为例,对国内外已有的图书在线评论与销量关系的实证研究进行系统归纳和总结,旨在为研究者进行规范的实证研究提供思路. 相似文献
18.
19.
20.
中文文本解构与知识发现研究 总被引:2,自引:0,他引:2
中文文本是一个结构化的、综合性的信息和知识集合体,对中文文本的结构和特征进行分析,并对文本结构中所包含的各类要素进行分析,或重新排列和组织,以便发现文本中蕴含的知识和信息,是文本知识发现的重要途径之一.文章通过对中文文本的基本结构、主要特征、知识来源、知识组织等的探讨,以期达到文本知识发现的目的. 相似文献