首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 234 毫秒
1.
应急知识模式是关于突发事件演进规律的知识,因而是应急领域知识库的重要组成部分.应急知识模式提取有助于应急工作者有效了解事态现状和快速做出应急反应,进而降低事件负面影响.本文研究如何从海量应急领域文本中抽取应急工作者关注的知识模式.我们用自然语言处理技术(NLP)从无结构海量应急领域文本中提取描述突发事件的特征事实,并通过提取特征事实之间的因果推理关系和并列作用关系,来构建知识的特征事实依赖图(FEDG)模型.基于FEDG模型,我们提出使用闭合约束搜索算法提取应急知识模式.通过实验及其分析证明本方法对知识模式提取具有较好效果.  相似文献   

2.
【目的】从NLP(自然语言处理,Natural Language Processing)的发展对图书出版行业影响角度,分析图书出版各岗位编辑工作可能发生的变化,以期为出版从业者未来职业规划及出版企业发展提供新的思考角度。【方法】通过对出版全流程各大类编辑岗位(策划、加工、营销)具体工作的实践与分析,找出长久以来传统工作方式的短板及业务逻辑的欠缺,结合NLP技术发展现状及未来趋势,使双方合理结合,并分析其中可能遇到的阻碍。【结果】目前,已有出版从业者及出版商运用NLP技术深度参与内容策划及运营工作,并取得了良好的效果。NLP技术的发展不仅会提高工作效率及准确度,更能够从底层业务逻辑角度变革编辑工作流程及工作对象。反观二者之间的关系,图书出版行业已有大量高质量的产品,且经过近几十年的发展,很多都已完成数字化转型,因此,图书出版行业可以为大语言模型提供足量的规范学习样本,以供学习和演化。【结论】随着ChatGPT的问世,NLP从专业技术走向大众应用。NLP是研究人与计算机交互的语言问题的一门学科,其已经从让机器“听懂”人话,并给出反应,发展到让机器“主动思考”,根据大数据信息和人的思维逻辑,...  相似文献   

3.
基于Web的开放领域问答系统研究   总被引:1,自引:0,他引:1  
主要对基于Web的开放领域问答系统及其涉及的信息检索、信息抽取、自然语言处理等相关技术内容进行了分析研究。提出了系统的一般结构,并对系统中问题分析、信息检索、答案生成各部分功能步骤进行了总结和分析。  相似文献   

4.
网络舆情搜索引擎与通常的网络信息搜索不同,其最终结果要深入到站点和页面内部采集与抽取有效数据,给情报界提出了许多新的研究内容和方法.在对网页信息抽取的模板和页面分析两种方式、基于自然语言处理、包装器归纳和Ontology抽取方法的分析基础上,使用基于包装器归纳方式并在规则生成模块中采用专家模式,设计一种基于样本学习的新闻抽取方法,通过人工分析网页源代码制定和修改抽取规则,然后根据抽取规则进行信息自动抽取,以提高舆情搜索引擎的精度和质量.  相似文献   

5.
典型关系抽取系统的技术方法解析   总被引:3,自引:0,他引:3  
实体关系抽取是信息抽取领域中的一项重要任务.文章在对当前关系抽取的相关文献、系统和项目进行分析研究的基础上,将基于非结构化文本的实体关系抽取技术方法归纳为:以模式构造和匹配为主线进行关系抽取、以词典驱动关系抽取、运用机器学习算法进行关系抽取、借助Ontology进行关系抽取以及多种方法有机结合进行关系抽取.从技术应用特点、核心模块的实现细节以及系统评测结果等方面深入分析了典型的关系抽取系统,它们包括EEES关系抽取系统、SVM关系抽取系统、T-Rex关系抽取系统、KMI语义网络门户的混合关系抽取系统,旨在为进一步构建实体关系抽取系统提供良好借鉴.该文为2008年第9期本期话题"知识抽取"的文章之一.  相似文献   

6.
为充分发挥知识组织在企业专利战略中的作用,在分析专利文献的基础上,根据中文专利文献句法描述的特点,利用最大串频匹配、蚁群聚类、多层KMeans聚类、改进关联规则计算、基于规则和CRFs的术语关系抽取等算法,设计出一套领域本体的半自动构建系统,包括术语抽取、分类关系抽取、非分类关系抽取、本体形式化等模块,初步实现结构化数据和非结构化文本的本体半自动构建。  相似文献   

7.
深度学习在自然语言处理方面取得了显著成效,为生物医学领域的信息抽取带来新的研究范式。本研究旨在系统调研生物医学语义关系抽取方法、分析其发展历程,为深度学习方法的进一步运用提供基础和启示。通过检索Pub Med、Web of Science和IEEE数据库,以及Bio Creative、Sem Eval等重要测评网站,遴选出具有代表性的抽取方法,并从目的、方法、数据集和效果四个维度进行分析。经过系统梳理,可将生物医学语义关系抽取方法分为三个阶段:基于知识、传统机器学习和深度学习。将先验知识和领域资源恰当地融入到深度学习模型中,是进一步提升语义关系抽取效果的探索方向。  相似文献   

8.
企业档案知识推送是档案知识服务的关键内容,企业档案知识推送系统包括推送来源与内容、推送方法及推送对象三个基本模块,在实现上可通过基于知识订阅、基于用户情景分析和基于业务流程的档案知识推送三种方式。  相似文献   

9.
该文探讨了一种基于知识图谱的档案管理决策支持系统,通过用户需求分析、系统功能需求分析和系统性能需求分析,确定系统的设计目标。在此基础上,介绍了基于知识图谱的系统模型设计,包括知识图谱的构建与档案元数据、知识图谱的查询与分析、决策支持模块、用户交互模块以及知识图谱维护与更新模块。这些模块相互协作,实现了档案管理的各项功能。最后从知识库搭建和决策分项与计算两方面探讨了系统的实现。  相似文献   

10.
图像检索系统中相关反馈技术的检索过程分析   总被引:2,自引:0,他引:2  
图像检索系统主要可分成基于本和基于内容的两大系统。图像包括视觉特征与语义特征,除了必须对图像进行分析、抽取和描述,利用这些内容特征建立索引进行检索之外,还必须考虑,对同一幅图片,人们可以按照各自的理解来阐释其内涵。本主要探讨基于内容的图像检索中相关反馈技术的运用过程及技术原理。  相似文献   

11.
考察特定领域文本中蕴含的细粒度知识实体的使用情况,对知识实体的评估和选择具有重要意义。学术文本中的细粒度知识实体通常具有多个类型、多种关联关系,挖掘知识实体的同质与异质关联关系,有助于深入了解特定领域知识实体的实际使用情况。目前相关研究大多针对学术文本中单一知识实体的抽取和评估,缺乏对知识实体间关系的关注,在一定程度上限制了基于实体抽取进行知识发现的能力。文章以自然语言处理领域为例,对学术论文全文中的细粒度知识实体关联数据进行挖掘,并通过可视化方式揭示关联数据中蕴含的信息。主要是选取全国计算语言学会议2009-2018年间收录的中文论文为原始语料,人工标注论文中使用的知识实体,并针对NLP特点将其细分为“指标实体”“工具实体”“资源实体”“方法实体”4种类型;结合关联规则挖掘算法Apriori和复杂网络分析软件构建知识实体关联网络,揭示该领域常用的知识实体,以及这些知识实体的使用相关性。  相似文献   

12.
文章在简要介绍开放服务网关(OSGi)规范、Bundle模型及实现框架基础上,设计了基于OSGi的知识服务应用示范系统体系架构,共包括资源层、数据交互层、功能组件层、服务组件层、组件管理层和应用服务层等六层,最后基于Felix框架实现了一个简单的知识服务原型系统,初步完成对科技监测、领域知识结构及其演化分析、学术关系网络分析、领域科研信息环境和关联数据服务等知识服务子系统的模块化、组件式开发,验证了各服务功能实现即插即用、动态化管理的可行性和先进性,初步为各知识服务示范子系统的集成部署奠定了实践基础。  相似文献   

13.
作为主题图在具体行业领域的开发应用,文章在其上篇“主题图的概况及应用研究”的基础上,介绍基于主题图的金融培训机构知识系统的构建,包括金融行业培训机构的需求分析、基于主题图技术的金融培训机构知识系统的架构设计、系统核心部分的知识分类(文章称作知识地图)的设计与构建,以及结论和展望。  相似文献   

14.
采用C/S架构,以C#+Sql Server组合设计构建了由专利数据监测、数据清洗、数据加工和数据挖掘等4个功能模块组构成的多数据源协同下的专利分析系统;详细阐述该系统架构、协同机制和主要功能;认为该系统能有效实现对中国、美国、欧洲、世界知识产权组织等国家或组织专利著录信息、法律状态信息、同族专利信息以及专利引文信息的智能化监测、采集、清洗、筛选、分类、标引、查询、统计、文本挖掘、信息可视化和自动生成报告等功能。  相似文献   

15.
一个基础教育网站搜索引擎的设计与实现   总被引:2,自引:0,他引:2  
在研究网站元数据的基础上,介绍一个以基础教育网站为检索对象的搜索引擎系统。结合基础教育网站的特点,分析该系统的关键技术,如主题蜘蛛搜索、网站分类、网站信息提取等,并对系统的整体架构、功能模块进行详细描述。  相似文献   

16.
周露  王梅 《图书馆论坛》2006,26(4):143-146
长江是中国文明的起源,我们建设了长江知识库。长江知识库是利用信息管理理论和方法,采用元数据与本体相结合的方法描述知识概念,用虚拟总库方法实现知识库的管理,建立适合信息领域的专题知识库。文章介绍了概念设计方法,分析与设计了长江知识库的概念模型、系统构架、系统流程和系统模块。  相似文献   

17.
本文研究了通过信息抽取提取用户兴趣和需求来实现信息推送服务的课题.根据信息抽取过程,将基于信息抽取的信息推送系统划分为用户管理、资源管理、信息推送三个模块.  相似文献   

18.
[目的/意义] 实用的大规模地名本体数据库系统在自然语言处理、信息检索和情报分析领域具有重要的应用价值。本研究的目的是在减少人工干预的情况下,实现对地名简称、俗名以及随时间变化的复杂地名文本的自动识别与处理。[方法/过程] 以多种方法获取大规模名址数据为根基,简化地名元素间复杂关系,在开发名址元素切分、属性与关系分析及推理工具包的基础上,利用Neo4j图数据库工具开发实用地名本体数据库系统。[结果/结论] 基于所介绍的技术与方法而构建的系统具有良好的容错性和持续的数据更新能力,其地名分析、地名元素间关系推理达到了期望的精度,并在面向诸如新闻主题追踪、金融征信中的地名匹配等多种自然语言处理任务中取得良好效果。  相似文献   

19.
汉语科技词系统的Web服务研究与实现*   总被引:2,自引:0,他引:2  
对国内外词汇知识的Web服务研究现状进行调研分析,比较OCLC术语服务、英国高级叙词表、FAO多语种农业叙词表、STAR、中文叙词表本体网络术语学服务等国内外主要研究项目。介绍汉语科技词系统的基本架构、数据模型、功能模块和基于Web服务的汉语科技词系统应用模型、接口封装、部署、以及性能测试情况。最后对下一步研究工作进行展望。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号