首页 | 本学科首页   官方微博 | 高级检索  
     

三元组可比语料库自动剖析在情报智能处理中的研究与应用
引用本文:王毅,肖健,袁琦,宋金平,李强. 三元组可比语料库自动剖析在情报智能处理中的研究与应用[J]. 情报理论与实践, 2012, 35(4): 94-98
作者姓名:王毅  肖健  袁琦  宋金平  李强
作者单位:1. 总后勤部后勤科学研究所,北京,100071
2. 中国电子信息产业发展研究院中文信息处理实验室,北京,100048
基金项目:解放军总后勤部司令部2011年度后勤科研条件建设项目“军事后勤专业术语库及双语资源库信息处理平台”的阶段性研究成果,项目编号:2011-ZHTJ-5031
摘    要:文章提出的基于三元组可比语料库的自动语言剖析技术扩大了该研究领域的内涵,使其包括面向自然语言处理的应用研究。从工程可实现性考虑,创新性地提出建造三元组可比语料库,利用n-元词串、关键词簇和语义多词表达等自动抽取技术,通过对比中式英语表达,发掘英语本族语言模型,实现改进和发展机器翻译、跨语言信息检索等自然语言处理应用的目标。

关 键 词:机器翻译  三元组可比语料库  自动语言剖析  情报智能处理

Research on the Application of Automatic Language Profiling in Intelligent Information Processing Based on 3-Tuple Comparable Corpora
Affiliation:Wang Yi et al.
Abstract:The proposed automatic language profiling technologies based on the 3-tuple comparable corpora expand the connotation of this research field to include the natural language processing-oriented application and study.Considering the feasibility of the project,this paper innovatively puts forward the building of the 3-tuple comparable corpora and uses the automatic extraction technologies such as n-grams,keyword clusters and semantic multi-word expression to develop the English native language model by comparing with the Chinese type English expression so as to improve and develop the application of natural language processing such as machine translation and cross-language information retrieval.
Keywords:machine translation  3-tuple comparable corpora  automatic language profiling  intelligent information processing
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号