首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
方志物产挖掘及系统构建   总被引:1,自引:0,他引:1  
本文首先根据方志文献的行文特征,设计一个统一规范的方志文献文档处理格式,用于文本文档的预处理.本文建立方志全文数据库,并基于数据库构建一个物产挖掘系统,进行物产信息挖掘,方法如下:通过抽取数据库正名字段内容识别物产正名,通过模式识别方法识别物产异名别称.最后建立包含物产正名和异名别称的物产标引词典,对全部物产文献进行标引,从而挖掘出物产名称.经测试,异名别称的识准率为71.6%,识全率为88.6%,表明系统是可行的.  相似文献   

2.
基于百科资源的多策略中文同义词自动抽取研究   总被引:3,自引:1,他引:2  
采用实证的方法,以百度百科语料库为实验抽取对象,在对同义词自动抽取技术分析比较的基础上,提出了多策略的中文同义词抽取的思路.综合利用字面相似度方法、特征模式匹配方法和PageRank链接分析方法对中文百科语料库中的同义词进行自动获取,具有多领域适用性、获取同义词类型多样性等特点.实验结果表明,该方法具有可行性,并可应用于其它语种的同义词自动获取中.未来的研究应进一步实现模式的自动定义、完善抽词词典、有效排除噪音数据并构建能真实反映语义关系的词汇矩阵.图1.表6.参考文献13.  相似文献   

3.
基于模式匹配的军事演习情报信息抽取   总被引:1,自引:0,他引:1  
以军事演习情报信息抽取为突破点,采用基于模式匹配的方法进行演习情报的抽取.在信息抽取的不同环节,采用层次自动分类方法进行待抽取文本筛选;采用基于种子模式的自举方法结合领域词典进行军事演习组块识别;采用基于语料标注的方法进行事件属性模式学习获取.实验结果表明该方法在特定领域内的有效性,在实际工程项目中达到可应用状态.  相似文献   

4.
综合采用切分标志、分词词典和N元语法3种方法对古籍文本进行分词,并采用子串比较过滤、相邻词过滤、高频词过滤、低频词过滤等方法对分词结果进行过滤,分别以12种农业古籍和379种<广东方志物产>为语料进行了古籍分词测试.从12种农业古籍中共识别出已有词1164个,约占总词汇量的31%;未登录词2530个,占总词汇的69%.从379种<广东方志物产>资料中共识别出已有词6314个,占总词汇的8%;未登录词75 438个,则占总词汇的92%.通过对379种<广东方志物产>分词结果的分析发现,当词频等级位于区间(2000,8000)时,词频等级与频次乘积基本为常数23 000 000.这一结果说明齐夫定律在古籍文本中同样适用.  相似文献   

5.
现代信息技术飞速发展,为古籍引书计算机识别提供了可能性。本研究的目的是研究古籍引书的引用模式,进而探讨模式识别方法在引书识别中的应用。具体方法是以明、清及民国时期广东地方志中有关物产门目资料(《广东方志物产》)为语料,抽取所有引书的引用模式(引书名称及其表达方式),分别对引书名称模式和引用表达方式进行研究。  相似文献   

6.
实体关系抽取的技术方法综述*   总被引:3,自引:0,他引:3  
对实体关系抽取研究以MUC和ACE评测为主线的发展进行总结,并指出实体关系抽取任务普遍存在的三个问题是特定领域标引数据集的获取、模式的获取以及共指消解。在对当前关系抽取的相关文献、系统和项目进行分析研究的基础上,将基于非结构化文本的实体关系抽取技术方法归纳为:基于模式匹配的关系抽取、基于词典驱动的关系抽取、基于机器学习的关系抽取、基于Ontology的关系抽取以及混合抽取方法,旨在为进一步构建实体关系抽取系统提供良好借鉴。  相似文献   

7.
古籍智能整理与开发系统构建研究   总被引:3,自引:0,他引:3  
针对开发古籍通用整理平台问题,文章结合情报学、自然语言处理、机器学习的技术和经验以及知识工程领域在构建专家知识库中取得的成果,搭建了集自动编纂、注释、校勘、断句标点于一体的古籍智能整理与开发的原型系统,且构建了古籍整理的专业知识库,包括古代人名、地名、异名别称模式、断句模式等,以满足古籍整理工作需要.  相似文献   

8.
在当前词共现分析多关注两词共现分析的基础上,提出多词共现分析方法,并采用关联规则挖掘中的频繁项集抽取法,实现多词共现的抽取和与分析.以我国国家知识产权局专利数据库(SIPOD)中数字信息的传输领域(H04L)为例,抽取和深入分析该领域中词最多的多词集合和频数最大的多词集合.最后,结合当前文献计量学中研究热点的定义与识别,应用多词共现分析方法发现H04L领域中的6个研究热点,进而对这6个研究热点中的部分代表性专利文献进行介绍.  相似文献   

9.
本研究对MEDLINE中生物体类文献中高频主要主题词进行共词聚类分析,获取主题词之间的关联规则,利用UMLS语义关系进行结构化表达.从MEDLINE中选取<中华医学杂志>上的生物体类文献作为测试集,由专家人工抽取关系,与共词聚类得到的关联规则进行比较.利用共词聚类分析对生物体类主题词关系的挖掘及评价分析,为文本知识发现提供了一种新的尝试.  相似文献   

10.
1982年江苏人民出版社出版了杜信孚先生的《同书异名通检》(增订本),共收同书异名五千多条,对于检索图书、考订图书存亡都有一定的实用价值,为图书馆工作者案头常备的工具书。当然可补者还很多,比如,新出版的《清代杂剧全目》就可补充若干。我粗略地翻读一遍,发现此书无论在体例和校对方面都存在不少问题,略举如下: 1.书名。《竹初乐府》是清钱维乔所作的三种传奇的总称,并非《乞食图》的别称,(见页115),林栖居士即钱维乔的别号。详见赵景深先生《明清曲谈》页40。  相似文献   

11.
国家图书馆经历了从清末至今的几个发展阶段,已建立起较为完善的业务管理组织结构。在发展过程中,组织规模与职能体量成正比,组织结构与政策环境密切相关,建制依据以业务流程为主,且业务流程的灵活性持续提升,管理模式的适应性不断增强。同时,业务管理组织结构也受到非专业因素的干扰,出现了机构拆分与合并交替往复的现象。  相似文献   

12.
探讨数字化时代科技期刊支持信息存在的必要性及其对科技期刊影响力提升的重要意义.以化学类期刊为例分析国内期刊支持信息的现状及合理利用,认为合理利用支持信息是提升科技期刊数字化水平及影响力的有效手段.  相似文献   

13.
论文对我国社会科学院网站的学术资源进行了统计和分析,包括学术期刊、数据库和研究资料、学术交流、科研项目、研究成果、出版信息、学人介绍、热点问题讨论、研究生培养、学术资源链接等内容,并指出了存在的问题,提出了合理的建议。  相似文献   

14.
2010年5月,上海世博会非洲联合馆,十几位来自同济大学的"小白菜"共同约定:在世博会期间,每人每天写下一段感言,并通过短信发送到其中一位"小白菜"的手机上……如今,这些志愿者都已离开了世博园,但他们的故事却通过有心人的整理,被完整地保留了下来。本期"我的世博·我记录"栏目特别刊登这篇根据手机短信内容整理而成的文字,以飨读者。  相似文献   

15.
参考文献引用的学术评价作用   总被引:17,自引:7,他引:10  
朱大明 《编辑学报》2005,17(5):324-325
参考文献引用和著录具有学术评价功能,对促进学术交流、体现学术论文发表的学术价值都具有很重要的作用.按照表达方式可以将其划分为直接评价和隐含式评价2种形式;从评价内容看,参考文献引用的学术评价包括肯定性评价、否定性评价和商榷性评价3种类型.  相似文献   

16.
结合<长江蔬菜>多年的实际发行工作经验,阐明发行工作中要"最大限度"注意的8个问题;锁定和开发终端读者;发挥行业发展优势;发挥邮局主渠道作用;加大发行征订宣传力度;加大发行投入力度;强化发行服务意识;加强发行数据库建设;突破制约当前期刊发行的瓶颈.  相似文献   

17.
文章阐述了公共图书馆的本质属性和服务宗旨,对其在改革开放以来的实践进行了分析,指出了其公益性质扭曲的现象和原因,提出公共图书馆在构建公共文化服务体系建设的实践中,应充分体现公益性。认为建立图书馆的公益保障,转变办馆理念是实现图书馆事业以人为本,树立全面、协调、可持续发展的必由之路。  相似文献   

18.
19.
20.
陈皓  张建平 《新闻界》2008,(2):62-64
本文立足意境审美观来解读影片《悲情城市》,探询导演的创作观,分层次的关注影片的画面与镜语、剪辑与叙事,并在此基础上分析导演怎样完成对意境最高层次——"无形大象"的把握,揭示影片的主旨及导演对历史、人生的反思。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号