首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 312 毫秒
1.
[目的/意义]鉴于传统的作者身份识别方法不适用于当前大量涌现的网络文本。综述近年文本作者身份识别的典型方法和关键问题,并进行客观分析和评价,以期为进一步研究提供新的思路。[方法/过程]分别从应用领域、文体特征选取、作者身份建模和性能评价指标等方面对国内外作者身份识别相关研究现状进行客观分析,梳理相关领域研究发展脉络和趋势。[结果/结论]作者身份识别需要适应短文本、不规范文本、海量、高维和多语种环境,需更具表现和刻画能力的多层面特征和相应的作者身份建模方法,并借助信息检索、机器学习和自然语言处理领域的最新研究成果提高效率和准确率。  相似文献   

2.
[目的/意义]针对传统方法的不足,提出一种以用户评论为数据源的企业产品级竞争对手识别方法。[方法/过程]首先,根据企业分析维度确定候选竞争产品,进行相关评论文本采集;其次,利用信息抽取技术从本企业产品评论中抽取用户较为关注的产品特征;然后,基于情感分析技术设计特征情感权重算法;利用该算法对本企业产品特征进行优劣势分析,获取优势与劣势特征集,完成待分析产品向量空间表示与相似度计算;分析计算结果,挖掘出与本企业产品优势相似及劣势互补的候选竞争产品,并选择优势相似且劣势互补的产品为主要竞争对手,其他优势相似的产品为次要竞争对手。在实证部分,选择"红米Note"手机为分析对象,以"淘宝""京东""中关村在线"多源评论为数据源,利用基于情感分析的竞争对手识别方法挖掘该产品的主要和次要竞争对手。[结果/结论]本文的基于情感分析的竞争对手识别方法能够实现企业产品级竞争对手的识别与分析。  相似文献   

3.
[目的/意义] 细化社交机器人对网民情感的干预机制,同时从实践上为网络突发事件舆情治理提供建议参考。[方法/过程] 以仁济医院赵晓菁事件为例,利用朴素贝叶斯方法计算微博情感倾向,通过构建向量自回归模型(VAR)并进行格兰杰因果检验、脉冲响应分析以及方差分解分析,确定社交机器人、意见领袖与普通用户在事件生命周期各阶段的情感关系。[结果/结论] 社交机器人、意见领袖与普通用户的情感关系随舆情阶段演进发生变化,在爆发期,社交机器人放大了意见领袖对普通用户的情感影响;在成熟期,社交机器人影响式微,普通用户的情感反作用于社交机器人与意见领袖;在衰退期,三者保持较为独立的情感关系。此外,社交机器人的影响策略具有隐匿性和间接性特征。  相似文献   

4.
[目的/意义] 在"新冠"疫情这类突发公共卫生事件中,网络社交媒体上迅速产生大量关于疫情的言论,其中包含不少蓄意传播的谣言,不仅危害公众心理健康,而且会影响应对公共卫生事件的方案实施。识别突发公共卫生事件的谣言能够使民众正确面对危机,为社会安定、网络治理起到积极的维护作用。[方法/过程] 首先对采集到的疫情期间已被证实的谣言进行深度分析,提取谣言文本的主要特征,包括上下文特征、话题类别特征、情感程度特征、关键词特征等;然后针对文本分类模型中的文本特征表达较为单一的问题,利用不同的模型对提取的谣言文本特征进行向量化,并对各类文本特征进行加强和融合。其中通过TF-IDF计算的词向量权重在捕获上下文特征的同时,能够加强词粒度的关键词特征信息。最后,使用BiLSTM+DNN模型对融合的特征向量进行分类判别。[结果/结论] 实验结果表明,话题类别、情感程度等特征对谣言识别均有贡献,特别是经过强化后的词向量与其他特征融合后对识别准确率有明显提升,召回率、F1值等指标均达到90%以上,效果超过其他的谣言识别模型,说明笔者所构建的方法能够很好地实现对突发公共卫生事件背景下的谣言识别。  相似文献   

5.
[目的/意义] 基于社交媒体,探索突发事件信息生命周期中不同利益相关者的动态分类及其关注主题的演变规律,为更精准的危机信息监测与动态决策提供依据。[方法/过程] 以特定危机事件的事实文本数据为来源,以利益相关者理论和动态主题模型为指导,构建三维动态主题演化模型以对社交媒体危机事件中不同利益相关者的分类与话题关注进行主题挖掘。其中包括时间粒度划分、利益相关者的定量评估、基于时间和主体的危机主题观点识别与刻画,并利用可视化工具对该动态趋势进行表征。[结果/结论] 基于三维动态主题演化模型,利益相关者的组成与分类在不同阶段中具有明显的差异性,同时其关注主题与行为特征也体现出不同的偏好性和动态差异性。危机主体的动态与危机主题的动态有效结合,能够更加全面地表达舆情传播的特点和规律。  相似文献   

6.
任海英  李真 《图书情报工作》2021,65(19):117-129
[目的/意义] 基于专利文献识别产业技术领域的核心技术链,对于梳理产业核心技术架构,分析我国核心产业链的薄弱环节,确定技术攻关方向,完善技术链和产业链具有积极意义。[方法/过程] 改进经典的SAO结构,提出基于输入输出型SAO网络的核心技术链识别方法。从领域专利文本中提取输入输出型SAO结构作为技术要素,根据技术要素间的输入输出关系构建技术的领域知识网络;运用加权k-Core方法获得包含主要技术关系的核心知识子网络,并通过识别强连通分量实现核心知识子网络的分解;利用主路径分析等方法识别核心知识子网络中的外部核心技术链与内部核心技术链,并参照其涉及专利对核心技术链进行解读。[结果/结论] 将所提出方法应用于量子计算领域,识别出其中蕴含的外部和内部核心技术链,通过专家验证以及与相关学者研究的对比,验证了结果的准确性。该识别方法具有技术链关系连贯、自动化程度高以及灵活性强等优点。  相似文献   

7.
[目的/意义]作者身份识别是语言文体学的重要研究方向,利用文本特征的身份识别也是文本挖掘的重要任务。在开放和虚拟网络环境下海量信息的作者身份或发布者的识别难题和传统作者身份识别方法在处理效率和成本等方面存在的问题有待解决。[方法/过程]将复杂网络理论引入该研究领域,在利用传统文体学特征识别作者身份方法的基础上结合文本词共现网络模型及其指标特征改进相关算法,使用文本文体学特征和文本网络模型度量指标构建作者风格特征集合,通过计算文本间风格相似度进行作者识别。[结果/结论]基于复杂网络模型的作者身份识别方法可以有效的利用作者风格特征,提高识别的精度,与其他算法的对比试验表明其识别结果的准确性更高。  相似文献   

8.
[目的/意义] 针对当前对企业弱信号定量研究不足的现状,通过层次分析和隶属度函数构建新方法对其进行定量识别,为企业战略决策管理和危机预警提供服务。[方法/过程] 首先,基于波特的五力模型构建七力模型,结合实证分析提取企业竞争弱信号的特征;其次,结合层次分析法构建影响因素指标体系,并计算各指标的具体权重;最后,结合隶属度函数对弱信号进行定量识别。[结果/结论] 通过层次分析法和隶属度函数,构建了企业竞争弱信号的定量识别方法,为企业战略决策管理和危机管理提供服务。  相似文献   

9.
[目的/意义] 睡美人文献是指那些发表初期遭遇长时间的冷遇,随后突然引起广泛关注的文献。这些文献往往蕴含着重大科学发现,对其进行识别研究具有重大意义。通过对现有识别方法的梳理和分析,提出识别睡美人文献方法的改进思路和做法。[方法/过程] 明确以高被引文献作为睡美人文献识别研究的对象,选取文献年被引频次累积变化趋势作为研究切入点,提出累积被引速度和累积被引加速度两个指标,明确自引的处理方法。[结果/结论] 提出睡美人文献识别方法的改进思路与实证路线,在一定程度上优化了识别方法,同时为睡美人文献预测方法的研究提供一定的基础。  相似文献   

10.
利用实体解析的跨社交媒体同一用户识别   总被引:1,自引:0,他引:1  
[目的/意义] 跨领域关联实体一直是实体解析研究的主题,本文旨在不同的社交媒体(跨社交媒体)中找到属于同一用户的账户。[方法/过程] 在传统近似字符串匹配技术的基础上,提出使用属性值结合社交媒体中的链接和文本内容的方法,比较两个不同社交媒体账户的属性相似度、邻域相似度和关键词相似度这三个匹配函数,以此提高识别这两个账户是否是同一个人的精确度。并利用社交媒体Facebook和Twitter数据作为实验数据集,针对匹配函数的不同组合进行试验。[结果/结论] 结果表明,三个匹配函数的组合能够得到更多的账户匹配为同一用户,同时精确度也很高,达到0.923。本文提出的方法在Facebook和Twitter上的成功运用,给其他社交媒体平台或者其他领域的实体关联的研究提供了一条新的路径。  相似文献   

11.
[目的 /意义]重大突发事件网络舆情在传播过程中往往会出现不同的主题,而微博用户对不同主题的表达和关注也会直接影响网络舆情的传播速度和规模以及舆情事件的走向。针对重大突发事件的微博用户主题演化分析有助于应急管理部门更好地理解重大突发事件的发展轨迹以及公众在不同阶段的关注点,以便采取有效应对措施。[方法 /过程]以网络舆情信息特征为立足点,辅以自然语言处理技术将舆情信息客体与本体进行剥离,结合重大突发事件特征,创新性提出以舆情客体信息为参照基线的舆情本体演化强度来反映微博主题演化趋势。[结果 /结论 ]研究结果表明,面向网络舆情信息本体的主题分析,与网络舆情实际发展演化趋势更加贴近,对主题内容的揭示也更加全面。同时研究思路也对现有网络舆情主题分析的研究方法中单一求助于自然语言处理技术的优化与更新具有一定启示意义。  相似文献   

12.
[目的/意义]探究影响突发公共卫生事件网络虚假信息传播行为的因素,为有针对性地监测预警、阻断传播突发公共卫生事件网络虚假信息提供借鉴参考。[方法/过程]基于S-O-R理论模型,综合考虑外部刺激因素和个体认知因素对传播者信任感知及传播行为的影响,提出相关研究假设,并利用新冠肺疫情期间微博平台的虚假信息进行验证。[结果/结论]突发公共卫生事件的虚假信息质量、信息发布者影响力和事件进展对信息接收者的信息传播行为具有显著促进作用,医护人员主题、呈现积极情感的网络虚假信息更容易获得信任和传播,网络影响力高的信息接收者在虚假信息传播过程中起到辟谣作用。  相似文献   

13.
[目的/意义] 梳理网络舆情的研究进展,有助于厘清网络舆情研究的知识基础、传导规律、预警机制和治理策略等之间的内在联系和主题演化路径。[方法/过程] 首先分析网络舆情的理论知识基础,然后结合现有研究,按照内容递进的规律将网络舆情研究分为影响因素、传导路径、预警机制以及引导治理策略四个主题,采用内容分析法和社会网络分析法对网络舆情进行主题关联关系分析和演化路径探索。[结果/结论] 结果表明,生命周期理论、认知定势理论、沉默的螺旋、群体极化理论、蝴蝶效应理论和治理理论常作为网络舆情研究的理论知识基础,网络媒介环境、社会结构压力、网民心理、触发性事件、有效动员和社会控制力量六个因素被视为网络舆情演化的重要影响要素,且网络舆情、舆情事件、社交媒体、利益相关者、大数据和信息传播等六个主题与其他研究内容关系较为密切,在主题演化路径中发挥着重要桥接作用。  相似文献   

14.
张晗  赵玉虹 《图书情报工作》2016,60(11):135-142
[目的/意义]针对共词分析存在的普遍问题,提出一种基于细粒度语义分析的共词网络构建与分析方法。[方法/过程]借助SemRep实现源文本主题概念及其语义关系的规范化抽取并由此构建语义共词网络,然后以节点的中心度和边的频次为指标对内容特征词进行抽取,利用UMLS语义网络规定的语义搭配模式,通过概念-语义类型-语义类型组的两级映射,对语义述谓项进行类团划分。[结果/结论]通过与常规共词分析方法比较,发现基于细粒度语义关系的共词分析能有效地揭示文本主题内容,利用UMLS语义网络资源能从语义学角度清晰准确地对语义共词网络进行类团划分。  相似文献   

15.
[目的/意义] 探究不同环境下,美国不同服务范围的公共图书馆应对不同种类重大突发事件的经验,从中获得相应启示,继而为我国公共图书馆应对类似事件提供参考。[方法/过程] 对公共图书馆面对社会重大突发事件所做的工作进行全面梳理,将其分为自身业务工作和对外社会服务两大类。其中,针对社会服务类工作,将案例以突发事件来源归类,并探讨在不同类型的重大突发事件发生后,现实与网络两种环境下,美国公共图书馆社会服务的模式内容。[结果/结论] 研究发现,从突发事件的来源看,自然灾害和社会问题下的社会服务都具有对损失的补偿性,但社会问题下的社会服务在短期应急响应方面还具有对灾后不良后果的遏制性;而从提供服务的环境看,在面临重大突发事件时,公共图书馆逐渐呈现出将工作重心从现实转移到网络的趋势;此外,从公共图书馆的类型看,大型公共图书馆更具宏观调度的特点,中小型公共图书馆则更具针对性服务本地民众的特点。最后,根据上述分析结果得出对我国公共图书馆应对重大突发事件的启示。  相似文献   

16.
[目的/意义] 针对复杂网络中的重要节点的识别,设计一种节点中心性算法,在传染病防控、舆情监控、产品营销、人才发现等方面发挥作用。[方法/过程] 同时考虑节点的高影响力邻居的数量及其总体影响,提出HHa节点中心性算法,在真实网络和人工网络上,使用SIR传染病模型模拟信息传播过程,采用单调函数M和肯德尔相关系数作为评价指标验证HHa中心性算法的有效性、准确性以及稳定性。[结果/结论] 实验表明,与7种经典的中心性算法相比,HHa中心性算法得出的排序结果M值为0.999等,排名第2;肯德尔系数为0.845等,高于其他算法0.15左右,排名第1且表现稳定。采用HHa中心性算法识别网络中的重要节点具备可行性。  相似文献   

17.
[目的/意义] 提出一种融合评论主题识别与技术属性多维度分析的技术机会发现方法,从技术需求驱动视角识别技术机会,为企业前瞻布局研发方向与进行科研管理规划提供决策建议支持。[方法/过程] 以产品在线评论为研究数据源,首先,利用LDA主题模型识别出评论技术主题,提出技术评论主题强度和主题新颖度两个指标,筛选出新兴重点技术评论主题。然后,从学术论文、技术专利中人工选取技术属性词,通过TF-IDF值计算得到评论高频词,结合专家知识进一步筛选出技术特征词,构建产品技术属性词-技术特征词表。通过相关性计算分别得到与评论相关和与新兴重点技术评论主题相关的技术属性。最后,提出一种产品重要技术属性识别指标模型并设计一种多维度分析方法,分析产品重要技术属性的特征情况,最终识别出蕴含在评论文本中的新兴技术机会。[结果/结论] 实验结果表明该方法能够有效地识别技术机会,为企业产品技术研发管理提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号