共查询到20条相似文献,搜索用时 0 毫秒
1.
2.
公安领域存在大量非结构化案件文本,使人工查询与整理存有困难。信息抽取作为应对海量信息的一门技术,能够有效处理案件信息的结构化问题。本文总结了目前信息抽取的方法技术,在实体识别、触发词获取和事件抽取等子任务方面所达到的水平,以及信息抽取在公安领域案件文本中的应用情况,并提出了未来的研究趋势。 相似文献
3.
张丹 《佳木斯教育学院学报》2006,(3)
文本相似度计算是文本分类、文本聚类、自动文摘、信息抽取的基础.文本相似度计算性能直接影响到文本分类、文本聚类、自动文摘的质量.另外文本相似度还应用于诸多自然语言处理任务中,本文对文本相似度计算问题进行了深入的研究,并根据自然语言的特点提出了通过比较两个文本关键语义对来计算文本的语义相似度. 相似文献
4.
在中文信息处理中,句子相似度计算是一项基础而核心的研究课题,长期以来一直是人们研究的一个热点和难点.句子相似度计算在实际中有着广泛的应用,它的研究状况直接决定着其他一些相关领域的研究进展,如信息检索的相似句子匹配、自动问答的问题匹配与答案抽取等,句子相似度计算都是非常重要的环节.本文提出了一种基于依存关系匹配的句子相似度计算方法,利用词语内在概念和词语相互依存关系计算句子之间的相似度.结果表明,该算法能显著提高返回结果的准确率. 相似文献
5.
Web查询接口之后的高质量数据越来越受到人们的重视,而这些数据并不能够被基于URL的传统爬虫所爬行。抽取结构化Web数据源的数据在其领域中是一个紧迫的研究主题。基于查询的数据库爬行能够被描述为"查询、收获、分解"循环增量抽取目标Web数据库的迭代过程。在迭代抽取的过程中,对关键词的选取是非常重要的。研究了在迭代过程中应用领域知识库的杠杆作用,并且介绍了相应领域知识库的构建与描述。 相似文献
6.
《武汉职业技术学院学报》2016,(1)
伴随着互联网的飞速发展,网络上的信息资源呈现出井喷态势,如何从海量的信息中抽取出自己需要的信息已经变得越发的困难。在分析现有Web信息抽取技术现状及面临的挑战的基础上,设计了一种基于文本标签属性的Web新闻信息抽取模型。主要介绍了基于标签的Web信息抽取技术的算法,给出了信息抽取的具体实现过程,对基于DOM树节点遍历的文本标签过滤算法进行了描述,并选取了主流的新闻网站进行了抽取实验,验证了算法的可行性。 相似文献
7.
根据文本相似计算模型,设计软件实现了对待测文本的分词、词频统计、向量空间模型(VSM)计算,得出相似度值.系统可以对DOC,TXT格式文本进行比较,比较方式为1:1模式和1:n(1对多)模式.软件采用基于MVC模式的三层体系结构设计完成. 相似文献
8.
由于当前信息抽取系统因知识库结构和内容的不同带来的搜索质量问题,将本体引入信息抽取中,有助于信息抽取系统对领域内的概念和概念之间的联系的统一认识,为用户提供更有价值的信息。提出了基于本体的文本信息抽取算法,通过本体元素描述抽取的文本信息。最后,利用此算法对某领域样本Web页面进行抽取并分析。实验表明性能有所提高。 相似文献
9.
文本是教学网页中最基本的设计元素,为了满足易认、易懂、易读的需要,网络教学资源开发者需要根据教学信息的内容特征,认真设计文本信息的字体、大小和颜色.另外,为了提高文本信息的易读性.需要强化文本信息的结构特征,以文本块方式组织文本信息. 相似文献
10.
文本是教学网页中最基本的设计元素,为了满足易认、易懂、易读的需要,网络教学资源开发者需要根据教学信息的内容特征,认真设计文本信息的字体、大小和颜色。另外,为了提高文本信息的易读性,需要强化文本信息的结构特征,以文本块方式组织文本信息。 相似文献
11.
基于文本挖掘的领域本体半自动构建方法研究——以教学设计学科领域本体建设为例 总被引:4,自引:1,他引:4
目前知识工程研究已逐渐成为教育技术学研究领域的热点问题,其中构建领域本体是知识工程的一个重要方面。从已有的基于本体的应用研究来看,领域本体可以在学习者模型建立、网络教学支撑平台开发、智能答疑系统开发、资源库建设等诸多方面发挥重要作用,而构建领域本体是各种应用得以实现的前提。然而构建领域本体是一项浩大的工程,需要大量领域专家的参与,当前是手工完成的,建设周期长。面对一个知识迅速增长的时代,仅仅依靠领域专家来手工构建领域本体显然不能满足需求。因此,本研究提出一种基于文本挖掘的领域本体半自动构建方法,即借助于面向文本的智能信息处理技术从教科书或科技资料中提炼出概念、概念定义和概念之间的关系,并辅之以学科专家和知识工程师的参与,从而加快领域本体建设速度。整个构建过程由“文献材料选取”、“文献材料文本处理”、“概念关系标注”、“形式化表示与存储”、“知识库评价”等五个环节组成,涉及信息提取、中文分词、术语自动提取、术语定义自动抽取等技术以及基于术语部件的概念间属种关系、并列关系半自动发现方法和基于术语互信息值的概念关联关系半自动发现方法等方法。文章还针对当前开展的全国中小学教师教育技术能力培训的学习资源需求,选取“教学设计”这一课程作为研究个案,以基于文本挖掘的领域本体半自动构建方法来建设教学设计学科领域本体,以便进一步丰富和优化教师教育技术能力远程培训的学习资源。 相似文献
12.
为在使用康复量表时给康复师提供国际标准化功能残疾和健康分类(ICF)推荐的编码,利用文本相似度实现康复量表的ICF映射.使用ICF以及6个脑卒中康复量表的中文文本数据,采用非监督的文档间文本相似度算法WMD,将康复量表条目映射为ICF类目.以ICF核心分类组合中的脑卒中综合版作为评价标准,分别进行top-1和top-5... 相似文献
13.
林木辉 《中国远程教育(综合版)》2014,(2)
学习者的相似性反映了学习者之间相近的学习经历,将相近者组织成一个具有共同学习兴趣和目标的共同体,可以增强虚拟学习社区中各组成要素的耦合与连接,提高学习者的学习效果和黏度。本文基于领域本体提出一种能够描述学习者个性化特征的VSM模型,并以此为数据结构,设计了一种能有效计算学习者相似性的算法。实验结果表明,利用概念之间继承和包含关系,算出概念相关度,能快速计算出学习者特征向量之间的相似度;得出的结果较好地反映了专家分组经验,为提高虚拟学习社区的个性化和智能化提供了关键技术支持。 相似文献
14.
跨语言文本相似度计算在跨语言信息检索、数据挖掘、抄袭检测等领域有着重要应用,但是跨语言文本相似度计算因为不同语言文法、结构等问题,在空间映射、特征选择上与单语言文本相似度计算有很大差异。为解决上述问题,采用一种基于文本加权词共现关系的跨语言文本相似度计算方法,通过平行语料库构建跨语言词共现关系模型,使用该模型进行跨语言文本映射,对不同语言的文本进行相似度计算。该模型实际反映了某种语言中某些关键词共同出现时映射成另一种语言时的关键词概率分布。实验表明,该方法对跨语言文本排序的计算更接近人工评判标准。 相似文献
15.
16.
黄民兴 《山西师大学报(社会科学版)》2009,36(6)
传统的伊斯兰国家存在其独特的、富有活力的公民社会,这表现在"真主主权"的理论和作为独立力量存在的乌里玛.近代的一些中东国家因进行初步的现代化改革而发生了变化,其内容包括:对传统意识形态的变更;传统社会制度的改变;政治体制的改变;苏菲派教团取代乌里玛成为反抗殖民政权的主力;个别国家现代公民社会的发展.二战后,中东的公民社会组织大体上分为三类,即传统的乌里玛·苏菲派教团,现代公民社会组织,集传统与现代于一身的伊斯兰主义组织. 相似文献
17.
《华夏少年(简快作文 )》2017,(5)
文本细读是提升阅读教学效率的有力抓手,但近几年文本细读脱离文本牵强附会的解读比比皆是,表面上热热闹闹,文本细读必须尊重文本,文本细读还需有"度",还需遵循一定的原则。 相似文献
18.
基于CFN的相似度计算是一种相似度计算算法、将此算法与实例机器翻译联系,通过语法,语义两个角度对句子进行观察和分析,并经过CFN标注汉语句子,从两个层面进行相似度计算,并建立实例相似度计算模型,使基于CFN的相似度的计算方法更为简便。 相似文献
19.
杨仁忠 《河南师范大学学报(哲学社会科学版)》2014,(5):9-13
推进国家治理体系和治理能力现代化,需要社会力量的理性参与。在治理经济领域矛盾的过程中,社会公共领域能够发挥其独特作用——通过动用独立个人、社团组织、公共传媒以及社会活动力量并运用社会舆论和公共性活动等机制,对利益集团的自利行为和国家权力的不当行使予以干预,从而实现对公民个人经济利益的有效保护,起到调解处理经济领域社会矛盾的作用。 相似文献
20.
许建华 《乐山师范学院学报》2008,23(1):120-122
长期以来,中国的公共领域始终处于缺失状态。而互联网的蓬勃兴起,在当代中国公共领域中起到了极大作用,首先为公共领域构建了新的对话平台,其次激活了传统媒体的“公共领域”对话空间,并推动中国公共领域朝着更为开放、更具包容和更为理性的方向发展。 相似文献