共查询到20条相似文献,搜索用时 62 毫秒
1.
方志物产挖掘及系统构建 总被引:1,自引:0,他引:1
本文首先根据方志文献的行文特征,设计一个统一规范的方志文献文档处理格式,用于文本文档的预处理.本文建立方志全文数据库,并基于数据库构建一个物产挖掘系统,进行物产信息挖掘,方法如下:通过抽取数据库正名字段内容识别物产正名,通过模式识别方法识别物产异名别称.最后建立包含物产正名和异名别称的物产标引词典,对全部物产文献进行标引,从而挖掘出物产名称.经测试,异名别称的识准率为71.6%,识全率为88.6%,表明系统是可行的. 相似文献
2.
基于百科资源的多策略中文同义词自动抽取研究 总被引:3,自引:1,他引:2
采用实证的方法,以百度百科语料库为实验抽取对象,在对同义词自动抽取技术分析比较的基础上,提出了多策略的中文同义词抽取的思路.综合利用字面相似度方法、特征模式匹配方法和PageRank链接分析方法对中文百科语料库中的同义词进行自动获取,具有多领域适用性、获取同义词类型多样性等特点.实验结果表明,该方法具有可行性,并可应用于其它语种的同义词自动获取中.未来的研究应进一步实现模式的自动定义、完善抽词词典、有效排除噪音数据并构建能真实反映语义关系的词汇矩阵.图1.表6.参考文献13. 相似文献
3.
基于模式匹配的军事演习情报信息抽取 总被引:1,自引:0,他引:1
以军事演习情报信息抽取为突破点,采用基于模式匹配的方法进行演习情报的抽取.在信息抽取的不同环节,采用层次自动分类方法进行待抽取文本筛选;采用基于种子模式的自举方法结合领域词典进行军事演习组块识别;采用基于语料标注的方法进行事件属性模式学习获取.实验结果表明该方法在特定领域内的有效性,在实际工程项目中达到可应用状态. 相似文献
4.
综合采用切分标志、分词词典和N元语法3种方法对古籍文本进行分词,并采用子串比较过滤、相邻词过滤、高频词过滤、低频词过滤等方法对分词结果进行过滤,分别以12种农业古籍和379种<广东方志物产>为语料进行了古籍分词测试.从12种农业古籍中共识别出已有词1164个,约占总词汇量的31%;未登录词2530个,占总词汇的69%.从379种<广东方志物产>资料中共识别出已有词6314个,占总词汇的8%;未登录词75 438个,则占总词汇的92%.通过对379种<广东方志物产>分词结果的分析发现,当词频等级位于区间(2000,8000)时,词频等级与频次乘积基本为常数23 000 000.这一结果说明齐夫定律在古籍文本中同样适用. 相似文献
5.
6.
实体关系抽取的技术方法综述* 总被引:3,自引:0,他引:3
对实体关系抽取研究以MUC和ACE评测为主线的发展进行总结,并指出实体关系抽取任务普遍存在的三个问题是特定领域标引数据集的获取、模式的获取以及共指消解。在对当前关系抽取的相关文献、系统和项目进行分析研究的基础上,将基于非结构化文本的实体关系抽取技术方法归纳为:基于模式匹配的关系抽取、基于词典驱动的关系抽取、基于机器学习的关系抽取、基于Ontology的关系抽取以及混合抽取方法,旨在为进一步构建实体关系抽取系统提供良好借鉴。 相似文献
7.
8.
9.
本研究对MEDLINE中生物体类文献中高频主要主题词进行共词聚类分析,获取主题词之间的关联规则,利用UMLS语义关系进行结构化表达.从MEDLINE中选取<中华医学杂志>上的生物体类文献作为测试集,由专家人工抽取关系,与共词聚类得到的关联规则进行比较.利用共词聚类分析对生物体类主题词关系的挖掘及评价分析,为文本知识发现提供了一种新的尝试. 相似文献
10.
11.
国家图书馆经历了从清末至今的几个发展阶段,已建立起较为完善的业务管理组织结构。在发展过程中,组织规模与职能体量成正比,组织结构与政策环境密切相关,建制依据以业务流程为主,且业务流程的灵活性持续提升,管理模式的适应性不断增强。同时,业务管理组织结构也受到非专业因素的干扰,出现了机构拆分与合并交替往复的现象。 相似文献
12.
13.
论文对我国社会科学院网站的学术资源进行了统计和分析,包括学术期刊、数据库和研究资料、学术交流、科研项目、研究成果、出版信息、学人介绍、热点问题讨论、研究生培养、学术资源链接等内容,并指出了存在的问题,提出了合理的建议。 相似文献
14.
2010年5月,上海世博会非洲联合馆,十几位来自同济大学的"小白菜"共同约定:在世博会期间,每人每天写下一段感言,并通过短信发送到其中一位"小白菜"的手机上……如今,这些志愿者都已离开了世博园,但他们的故事却通过有心人的整理,被完整地保留了下来。本期"我的世博·我记录"栏目特别刊登这篇根据手机短信内容整理而成的文字,以飨读者。 相似文献
15.
参考文献引用的学术评价作用 总被引:17,自引:7,他引:10
参考文献引用和著录具有学术评价功能,对促进学术交流、体现学术论文发表的学术价值都具有很重要的作用.按照表达方式可以将其划分为直接评价和隐含式评价2种形式;从评价内容看,参考文献引用的学术评价包括肯定性评价、否定性评价和商榷性评价3种类型. 相似文献
16.
17.
文章阐述了公共图书馆的本质属性和服务宗旨,对其在改革开放以来的实践进行了分析,指出了其公益性质扭曲的现象和原因,提出公共图书馆在构建公共文化服务体系建设的实践中,应充分体现公益性。认为建立图书馆的公益保障,转变办馆理念是实现图书馆事业以人为本,树立全面、协调、可持续发展的必由之路。 相似文献
18.
19.
20.
本文立足意境审美观来解读影片《悲情城市》,探询导演的创作观,分层次的关注影片的画面与镜语、剪辑与叙事,并在此基础上分析导演怎样完成对意境最高层次——"无形大象"的把握,揭示影片的主旨及导演对历史、人生的反思。 相似文献