首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 198 毫秒
1.
事件检测与描述(Event Detection and Characterization,EDC)自2005年作为自动内容抽取(Automatic ContentExtraction,ACE)评测的一个重要子任务出现以来,中文事件的标注、检测与描述越来越成为研究热点。本文就自动内容抽取中的中文事件标注进行详细、系统地研究,主要包括:在ACE会议定义中文事件相关概念的基础上,给出事件标注中事件的可标注内容,包括事件范围及事件触发词等;根据生活中的事件分类在人工事件标注中对EDC的事件进行类别划分及其子类的详细区分,以降低事件检测的复杂度;对每个事件类别(包括子类别)中构成事件的元素进行研究,综合事件类别及其元素信息完成中文事件的标注。本文的研究成果在中文文本信息抽取、自动摘要及主题检测与追踪中得到了很好的应用。  相似文献   

2.
近代报刊的新闻报道记录并见证了这一特定历史时期的社会世相和众生百态,具有重要的史料价值.然而,从时间的维度,追踪和剖析海量新闻中重要历史事件的发展脉络,相关研究尚为数不多.该文由此构建针对近代报刊的时间信息标注工具,从批量新闻报道中抽取时间信息并自动转换为标准格式;在此基础上提出新闻网络模型,计算报道之间的时间关联性和内容相似性,利用有向加权网络的特有属性,追溯并探索特定历史事件的来龙去脉,不仅可以方便读者按照时间进程浏览新闻的前情回顾和后续发展;而且可以帮助研究者高效获取事件的背景知识和演变态势.该文使用《东方杂志》1911-1921年的"大事记"专栏的新闻报道作为实验数据,构建新闻网络,智能抽取历史事件的时间线,并结合特定史料加以分析佐证,旨在为近代史的知识发现提供新的研究视角.  相似文献   

3.
基于本体的计算机语义分析方法可以有效的解决纪传中时间、人物、事件的提取分析问题.文章首先描述了时间和人物在纪传中的表述方式,然后基于本体对纪传研究领域内概念的描述,研究分析了如何构建纪传中时间和人物本体,以及如何利用这些本体为纪传研究服务.理论和实验证明,基于本体的信息抽取相比其它方式能够获取更高的覆盖率和精确度.  相似文献   

4.
随着计算机信息技术的快速发展,电子档案应运而生并逐渐成为档案管理的重要形式。本文结合企事业单位在电子档案管理过程中产生的信息安全需求,主要讨论了引入可信时间戳技术构建可靠的安全管理体系的问题。论文简述了可信时间戳的基本概念及产生原理和法律效力,在此基础上详细探讨了电子档案可行的时间戳应用模式。  相似文献   

5.
陈田田  吴广印 《情报工程》2016,2(3):080-090
web中大量新闻网页、博客、电子邮件等非结构化信息中蕴含着大量的知识,对其进行处理以自动获得知识具有重要意义。目前,一些基于信息抽取等技术抽取简单关联关系的知识获取应用系统存在明显的局限性,本文引入Apache Stanbol——Apache下的一种从非结构化信息中自动获取知识的开源项目,它是一个为语义内容管理设计的模块化的软件集和可重用组件,旨在将传统内容管理系统(CMS)拓展为支持语义服务的语义内容管理系统(SCMS),在此基础上,为改善搜索引擎关于内容的搜索、分类,实体消歧及语义化查询等带来帮助。  相似文献   

6.
基于时态语义的Web信息检索在动态时间信息挖掘、群体记忆、时间问答系统等检索情景中具有相对广泛的应用。在大数据和人工智能迅猛发展的大趋势下,对基于时态语义的Web信息检索从关键技术的角度进行系统而全面的综述,不仅有利于了解该领域研究的整体状况,而且有益于把握时态检索的未来发展趋势。本文在引入文本时间信息的抽取和标注并融合时间信息的检索模型的基础上,以时态语义的技术为整体脉络,从三个方面综述研究情况:信息需求中隐含的时间意图分析,加入时间因素的检索模型构建,时间对提升检索结果的生成。以时态语义检索的本源问题和其在学术文献上的相关应用为切入点,提出时态语义检索未来的发展趋势:识别多源异构信息下的时间表达,构建能识别查询的时间预测模型,搭建能精准检索时间意图的检索平台和开发基于深度学习的隐含时间意图自动分类模型。参考文献91。  相似文献   

7.
信息抽取技术及其在数字图书馆中的应用前景分析   总被引:18,自引:1,他引:18  
信息抽取的目标是自动从文本信息中抽取出预先想要得到的信息(知识) , 它提供了一条从浩瀚的信息堆积中抽取出与用户相关的信息的一条思路。文章分析了信息抽取的主要概念、主要研究活动、信息抽取的类型和信息抽取系统的一般结构, 并提出在数字图书馆的建设中, 信息抽取技术能够在数字内容的自动标引、元数据获取、数据挖掘、情报研究分析、大型知识库数值库建设、参考咨询等方面发挥重要的作用。  相似文献   

8.
时间戳技术在档案数据管理过程中能够起到有效保障档案数据真实性、完整性和保密性的作用.研究发现,现阶段存在时间戳服务机构的可信度问题、时间戳技术证明效力的局限性、时间戳的加盖环节问题以及时间戳的应用范围等问题.文章提出了保证所应用的时间戳服务具有较高的可信度、对时间戳的证据效力进行全面审查、保证时间戳形成过程与档案数据管理过程紧密结合、以政策促进时间戳技术的应用与研发等四项针对性措施.  相似文献   

9.
论可信时间戳在电子档案中的应用   总被引:1,自引:0,他引:1  
可信时间戳作为电子签名的变种应用,已被应用到电子档案管理中,以确保电子档案数据的真实性、完整性、有效性。本文在介绍可信时间戳的含义、原理、作用的基础上,论述了可信时间戳在不同领域的电子档案管理中的作用,最后对可信时间戳的发展作出展望。  相似文献   

10.
模板处理的含义及其主要内容。详细阐述了模板处理在数字化文献环境中的主要应用领域:利用模板建立引用数据库,从电子刊物中抽取信息等。并探讨了在元数据中利用模板自动抽取信息的一些原理及方法。  相似文献   

11.
[目的/意义] 探索微博舆情传播周期中不同传播者关注的舆情热点和传播内容的主要观点,进而发现舆情传播的特点和规律,为舆情分析与决策提供依据。[方法/过程] 以特定舆情事件的事实文本数据为来源,以生命周期理论和LDA方法为指导,设计研究流程与构建研究模型,对微博舆情事件中不同传播者的话题进行主题研究,其中包括主题抽取和结果语义标注、各阶段的不同传播者主题的语义分析、基于时间维度的舆情主题观点识别与刻画。[结果/结论] 研究发现,论文所提出的研究模型能够挖掘出舆情传播周期中不同传播者的主题结构、观点脉络以及特征,研判出分布在文字当中有关联性的、代表性的、重要的词语。同时,结论中还发现微博中的官媒、大众媒体发布信息中的话题和用户谈论的热点话题具有明显的差异性。  相似文献   

12.
介绍对Web空间和现实社会空间中的新闻事件演变进行可视化是一个新的研究热点。总结归纳文本可视化基本方法,并且结合成功的应用,提出应用在单个新闻事件、同时发生的新闻事件和先后发生的新闻事件上的新闻事件演变的可视化形式。指出综合利用基于词频、语义、聚类、时间序列的可视化技术是对新闻事件演变过程进行可视化展示的关键  相似文献   

13.
[目的/意义] 为帮助读者从热点事件产生的海量微博报道中快速了解事件的来龙去脉,提高微博事件摘要的准确性和可读性,提出一种基于事件要素的多模型微博热点事件时间轴摘要提取方法。[方法/过程] 针对微博文本特征,结合主题模型(LDA)与互信息最大熵模型(MaRxEnt-MI)的特点提取事件摘要关键词,以微博传播价值和主题相关性为标准筛选微博,以时间-摘要关键词-摘要微博的形式生成时间轴摘要。[结果/结论] 利用人工标注的测试集,与传统的TextRank方法进行对比,F值提高8%-13%,内部测试表明摘要可读性提高明显。实验文本和测试集的数量及事件丰富度需要进一步扩展,应考虑更多的加权策略模型以提高摘要的准确性。实验结果及测试反馈表明,本文的方法能很好满足用户对热点事件摘要信息需求,提高微博摘要提取的准确率。  相似文献   

14.
基于图挖掘的文本主题识别方法研究综述   总被引:1,自引:1,他引:0  
本文通过文献调研分析,将基于图挖掘的文本主题识别方法总结为中心度方法、紧密关联子图查找和图聚类三种,后两者又细分为基于clique子团或类clique子团、基于图拓扑结构或结点属性聚类的方法。中心度方法通过对比文本网络中术语结点的重要度来实现文本主题的识别,紧密关联子图查找和图聚类方法则是根据文本图中术语结点和边的属性相似度来识别文本核心主题。基于语言文本网络自身特性,如何构建复杂文本关系图来同时揭示术语间的句法、共现和语义关系,如何基于术语关联和图拓扑结构识别其中的紧密关联子团,基于何种标准将紧密关联子团聚类以揭示文本核心主题,都是未来需要进一步深入研究的问题。表1。  相似文献   

15.
本文探究网络舆论对伊朗突发新闻的关注热点,进而透过社交媒体分析网络舆论对国际热点事件的关注倾向.以含有关键词"伊朗少将遇袭"、"伊朗导弹袭击"和"伊朗"的所有微博作为研究数据,基于词频统计和LDA主题模型提取主题,从文本特征角度分析网络舆论对伊朗局势的关注热点.本研究对基于新浪微博数据检索到的文本内容进行分析发现,网络...  相似文献   

16.
国内文本分类研究论文的统计分析   总被引:1,自引:0,他引:1  
介绍文本分类是一个跨信息检索、机器学习和计算语言学的综合研究领域,是信息处理的重要研究方向,指出它在自动标引、信息检索、文本过滤和文献组织等领域中有着广泛的应用;并通过应用文献计量学的方法对1998-2005年国内文本分类的研究论文进行统计分析,探讨近年来我国文本分类研究现状和主要发展趋势。  相似文献   

17.
虚拟参考咨询的时间管理就是通过有效组织管理图书馆人力和资源、控制服务流程来有效利用时间,提高服务效率。它需要在图书馆管理层和参考咨询员两个层面进行:管理者负责时间管理制度的制定、对咨询员进行激励和时间管理能力的培训以及有效的服务流程的组织;咨询员负责在服务中明确用户目的和需求,有计划地进行信息查找,提交简单易懂的答复。这样,通过图书馆上下全员的分工努力,节省用户的时间,提高用户满意度。  相似文献   

18.
Summarizing Similarities and Differences Among Related Documents   总被引:10,自引:0,他引:10  
In many modern information retrieval applications, a common problem which arises is the existence of multiple documents covering similar information, as in the case of multiple news stories about an event or a sequence of events. A particular challenge for text summarization is to be able to summarize the similarities and differences in information content among these documents. The approach described here exploits the results of recent progress in information extraction to represent salient units of text and their relationships. By exploiting meaningful relations between units based on an analysis of text cohesion and the context in which the comparison is desired, the summarizer can pinpoint similarities and differences, and align text segments. In evaluation experiments, these techniques for exploiting cohesion relations result in summaries which (i) help users more quickly complete a retrieval task (ii) result in improved alignment accuracy over baselines, and (iii) improve identification of topic-relevant similarities and differences.  相似文献   

19.
论新闻价值实现的层次性   总被引:3,自引:0,他引:3  
新闻价值实现的层次性是从新闻文本内容的纵向结构出发来揭示价值实现的特点。新闻文本对于一定的接受主体来说 ,可以实现三个层次的价值 :一是表层价值 ,它的核心在于实现对接受主体对最新事态信息的需求 ;二是内层价值 ,它的核心在于满足接受主体对蕴涵于文本之中的情态信息的体验 ;三是深层价值 ,它的核心在于满足接受主体对文本象征信息、意态信息的理知需求  相似文献   

20.
文本可视化可以帮助人们在海量的文本文档中快速获取知识,随着信息技术的发展和信息需求的增加,文本可视化的应用愈加广泛。作为情报学的主要研究对象,文本可视化对基于文献资料的情报研究具有重要的价值。本文结合情报研究任务和文本可视化的应用场景,将27 个案例分为基于文本概览、文本主题、文本情感和文本关系的四类应用,对近期文本可视化的研究状况进行了分析和总结。最后针对可视化方法在情报学的应用提出了建议,以期为相关研究人员提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号