首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
刘伟 《图书情报工作》2015,59(12):128-134
[目的/意义] 鉴于目前同义词抽取方法无法避免抽取结果含有较多的噪音,需要较高的人工代价去除噪音,提出一种对同义词抽取结果排序的方法,使得正确结果排序提前,以达到提高抽取结果准确性及降低人工去噪代价的目的。[方法/过程] 将抽取结果转化为抽取关系有向图,基于该有向图计算抽取结果中每个词汇与被抽取词汇的词义相似性,并按照词义相似性高低进行排序。排序方法的最大特点是只利用了当前的同义词抽取方法,不需要人工参与和额外的语义知识。[结果/结论] 通过在真实数据集上进行验证,得出排序效果与抽取结果的规模呈正向关系的论点,即一个给定词汇的同义词抽取结果数量越多,排序的效果就会越好。  相似文献   

2.
中文文本关键词自动抽取方法研究   总被引:5,自引:1,他引:5  
随着信息技术的发展,中文电子文本信息资源正以惊人的速度急剧增长.文本自动处理技术,通过自动组织海量文献信息资源,能够为用户提供简易有效的信息检索服务.关键词自动抽取是文本自动处理的基础和核心.汉语的特殊性加剧了中文文本关键词自动抽取的难度.本文提出了一种基于N-gram权重计算和关键词筛选算法的中文文本关键词自动抽取方法.该方法不依赖特定的数据集和中文分词技术,可以有效地抽取出任意单篇文本的关键词,而且通过参数调整,应用系统可以灵活地控制标引深度和标引专指度.实验表明,该方法简单、快速、断词错误率低,标引性能明显优于基于中文分词和TF/IDF的方法,可以满足大规模文本的在线处理要求.  相似文献   

3.
专利摘要中含有重要的内容,文章通过对"新能源汽车"中文专利摘要的阅读和分析,提出了一种专利摘要内容判别原则.并通过对国外开源抽取工具GATE和中科院分词工具ICTCLAS的学习和改进,实现了对中文专利摘要的批量抽取,为专利知识库的自动构建准备了充分的语料基础.该文为<数字图书馆论坛>2008年第11期本期话题"科技创新中的专利应用研究"的文章之一.  相似文献   

4.
基于多策略融合的中文术语抽取方法   总被引:2,自引:0,他引:2  
中文术语抽取是信息抽取、文本挖掘以及知识获取等信息处理任务中的关键技术.相对于单词型术语,词组型术语的识别过程要更加复杂.由于短语中引入了大量非名词性词汇,随之产生了更多种的噪声数据,不仅需要判断短语结构是否完整,还要考虑短语内部词汇的搭配合理性、衡量短语中所负载领域信息量等问题.文中将词组型术语抽取过程中遇到的这三个问题作为切入点,分别使用子串归并、搭配检验和领域相关度计算技术来解决这三个问题,分析词组型术语自身的结构特征以及其在语料中的分布特征,完善词组型术语的抽取任务.实验证实了该方法能够有效提升低频术语和基础术语的排序位置,从而改善了中文词组型术语抽取系统的性能.  相似文献   

5.
改进的中文同义词相似匹配方法   总被引:2,自引:0,他引:2  
信息检索的核心技术是文档集与提问集的相似匹配。目前基于关键词的字面匹配方法和基于词义的概念匹配方法各有优势与不足。在数字图书馆文献检索中可以综合两者的优势。设计一种改进的中文同义词相似匹配方法较现有两种方法优越,并具有更好的应用性。图2。表3。参考文献2。  相似文献   

6.
在线百科词条中蕴含着海量的人物间关系信息,基于这些信息可以抽取出大规模社会网络,为数字人文和社会计算研究提供数据支撑。本研究以百度百科为例,首次对面向中文在线百科的大规模社会网络抽取进行探索,提出一种新的人物社会网络抽取方法。该方法利用排序学习综合多种特征计算人物关系权重,通过估计人物生存时空来发现人物间的时空耦合关系。由此,从百度百科中抽取出一个带权重的跨时空人物社会网络和一个时空耦合的人物网络。这两个人物网络具有良好的小世界和无标度特性,并存在清晰的社区结构。最后,通过可视化分析展示了百科人物网络在数字人文研究中的应用模式和应用价值。图8。表6。参考文献39。  相似文献   

7.
8.
基于领域中文文本的术语抽取方法研究   总被引:3,自引:0,他引:3  
在ICTCLAS词典分词的基础上,利用串频最大匹配算法从中文专利文本中抽取候选术语,再利用TF-IDF算法得到相关特征项的权重,经过筛选后得到最终概念术语。最后,抽取部分样本数据进行实验,并对结果进行分析。  相似文献   

9.
中文文本情感倾向分析研究   总被引:2,自引:0,他引:2  
文章首先采用文献计量的方法,统计分析了中文文本情感领域相关的研究论文并给出当前研究框架;接着分类研究了中文文本情感分析的代表性成果,按基础理论研究和应用研究两部分进行深入探讨,前者包括词语和文档情感极性判断、细粒度情感信息抽取、情感分析资源建设,后者则包括其在各领域的应用研究及相关商业系统;最后对中文文本情感倾向分析进行了展望。  相似文献   

10.
提出了Web页面信息的自动抽取思想,并使用WebBrowser和DOM技术实现了Web页面上网页元素查找、表单自动填写、表单自动提交、自动获得查询结果并自动抽取所需信息的技术,从而实现了Web页面信息的自动抽取。文中还给出了这一方法的实现细节和示例代码。  相似文献   

11.
基于模式匹配的汉语同义词自动识别   总被引:7,自引:0,他引:7  
陆勇  侯汉清 《情报学报》2006,25(6):720-724
同义词的自动发现和识别在信息检索领域有着重要的研究意义和应用价值。为了提高同义词自动识别的效率,本文提出了从词典释义中使用模式匹配方法提取同义词。该方法首先对词汇的释义方式进行分析,归纳总结出在词典释义中同义词出现的模式,进而利用模式匹配方法获取同义词。实验结果表明,利用模式匹配方法来自动发现同义词具有可行性和实用性。  相似文献   

12.
为发掘中国古代图书馆学的原创性与民族特色,疏通中国古代图书馆学与现代图书馆学的因承关系,本文从文献学路径出发,论证了文献学与中国古代图书馆学的同一性,并运用文献举证与"知识考古"的方法全面考察了中国古代图书馆学的知识论取向.由此得出结论:世界范围内各民族图书馆学的发生路径是多元的,以西方图书馆学产生之初的特征来评判中国图书馆学的形成过程是一种历史错位.中国古代图书馆学虽未能在文献公共利用方面建立相应的学说和制度,但以其文献学特质,在阐释文献涵义、文献价值及具体的文献组织与整理活动中呈现出一定的知识论取向,与现代图书馆学的知识论多有契合.这为实现图书馆学研究的本土化提供了有益的启示.参考文献30.  相似文献   

13.
以20世纪80年代以来我国出版的文献编目和信息组织等教材专著为对象,采用与国外文献相比较的方法,研究图书馆的组织对象及其层次问题,并试图澄清图书馆信息组织与知识组织的主要依据问题.研究发现,在图书馆组织对象及其层次问题上,国内外学者在认识上存在差异,尤其在国内相关教材上还存在名与实的矛盾.通过研究,本文认为图书馆的组织对象仍是文献或资源;图书馆的信息组织和知识组织,只是文献或资源在组织层次上的区分;信息组织是主要依据元数据标准对其文献或资源所进行的组织,而知识组织是主要依据知识组织系统对其文献或资源所进行的组织.参考文献15.  相似文献   

14.
中国图书情报学教育20年评述   总被引:10,自引:0,他引:10  
80年代我国图书情报学教育的特点是 :图书情报学教育受到党和国家的重视 ;以文科为主的单一模式转向多元化 ;图书情报学教育一体化尝试。 90年代的特点是 :图书情报学教育改革成为关注的热点 ;图书馆学核心课程逐步形成 ;课程体系从图书情报学向信息管理转移 ;图书情报学教育分化显露。存在的问题 :未能正确理解“大情报观” ,未能正确处理“情报”与“信息”的关系 ,未能慎重对待专业目录调整。参考文献 14。  相似文献   

15.
首次采用战略坐标分析方法对我国图书情报学核心期刊群的内部结构和发展动态进行分析,以中国知网论文数据库中2002~2012年19种核心期刊的引文和被引文为数据源,根据密度和向心度绘制战略坐标图,对每个象限期刊的发展特征进行探讨,得出"图情学科期刊发展不均衡"、"多数核心期刊发展遇到瓶颈"、"《图书馆》可能成为图情学核心期刊未来的‘黑马’"等结论。参考文献12。  相似文献   

16.
中美两国图书馆学信息学课程设置的比较研究   总被引:4,自引:0,他引:4  
中美两国图书馆学信息学课程设置的比较研究谢汝ABSTRACTThroughacomparisonofcurriculainlibraryandinfor-mationsciencebetweenChinaandtheUnitedStates,thea...  相似文献   

17.
图书分类法是在一定的社会历史条件下以科学分类为基础编制起来的类分图书的工具。从1975年《中图法》(第1版)到2010年《中图法》(第5版),"G250图书馆学"、"G350情报学"类目长达35年的演变伴随着图书馆学和情报学的学科发展,其各个版本《中图法》的变迁映射出图书馆学、情报学学科发展的历史轨迹。  相似文献   

18.
中美图书信息教育改革与发展述评   总被引:4,自引:0,他引:4  
讨论了中美图书信息教育面临的挑战与机遇 ,分别论述了两国图书信息教育的培养目标、课程设置、原则与特点。参考文献 1 5。  相似文献   

19.
采用文本解读的方法,对现有信息法律文本进行解读,系统总结和反思了我国信息立法的基本价值导向,希望有助于明确今后信息法治建设的思路.研究发现,<著作权法>、<信息网络传播权保护条例>、<个人信息保护法(专家建议稿)>等法律文本体现了以信息权利保护为中心的立法价值导向;而<政府信息公开条例>、<保密法>、<档案法>、<图书馆法(草案)>等则体现了以信息义务规定为中心的立法价值导向.笔者认为,我国应确立以信息权利保护为价值导向的信息立法体系.参考文献18.  相似文献   

20.
自信息不平等问题成为信息社会的重要课题以来,有关该问题的研究已经形成了若干理论类别.这些类别之分基本上继承了社会科学的传统分歧,特别是结构与能动性、宏观与微观之争.本文以英文相关文献为依据,剖析了信息不平等理论的主要分歧及局限,呼吁相关研究更多地采用整体性思路;通过引述当代最有影响的整体性社会理论(如布迪厄、吉登斯),表明整体性研究思路不仅符合信息不平等问题的复杂性和其作为重大社会问题的地位,而且符合当代最有影响的理论创新趋向.参考文献78.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号