期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

何彦青石崇德于薇张均胜王惠临《数字图书馆论坛》2011,(12):32-38

多机器翻译系统融合技术能够对不同机器翻译系统的输出结果有效地进行融合,产生更好的翻译性能,因此该技术成为机器翻译研究领域的一个热点问题。文章介绍了中国科学技术信息研究所（ISTIC）参加第七届全国机器翻译研讨会机器翻译评测的情况。本单位参加了英汉科技领域的机器翻译评测项目。文章阐述了本单位机器翻译系统的实现框架以及实施细节,并分析了它们在评测数据上的性能表现,最后对机器翻译系统融合方法目前的现状进行讨论,并对该系统融合方法进行总结和展望。相似文献

2.

面向专利领域的汉英机器翻译融合系统

下载免费PDF全文

李洪政赵凯胡韧奋蒋宏飞朱筠晋耀红《情报工程》2017,3(3):105-115

面向专利领域的机器翻译近年来已成为机器翻译的重要应用领域之一。本文提出了一个汉英专利文本机器翻译融合系统,该系统以规则系统为主导搭建,并把规则翻译方法和基于短语的统计翻译系统相结合。在融合系统中,规则系统主要负责源语言的分析和转换阶段的处理,生成相应的源语言句法分析树与转换树,并确定目标语言的基本句法框架。统计翻译系统则在目标语生成阶段根据生成的目标语句法结构寻找合适的对译词形,并产生最终的候选译文。通过利用自动评测指标对融合系统进行测试,融合系统的结果均优于单个规则系统和统计系统的结果,表明了融合方法的有效性和可行性,可以改善系统的翻译性能,提高翻译质量。相似文献

3.

中日两国机器翻译研究进展及比较

张均胜何彦青李颖王惠临《数字图书馆论坛》2011,(12):20-31

机器翻译研究用计算机实现不同自然语言之间的翻译。自第一台计算机诞生开始,人们一直在研究和探索高质量高效率的机器翻译技术。近年来,基于规则的机器翻译、基于实例的机器翻译和基于统计的机器翻译这几种主要的翻译模式共同存在且相互补充,并有不断融合之势。随着中国和日本在科技、经济和文化交流的不断深入,机器翻译研究对于打破汉语和日语之间的语言壁垒进而推进中日两国各个领域的交流与合作具有重要的应用价值。中国和日本两国机器翻译研究人员已经开展了大量的汉日／日汉机器翻译的理论研究与系统研制,已取得了有效的成果,但距离大规模实际应用和高标准的翻译质量的要求尚有差距。为此,中日两国机器翻译人员有必要在汉日／日汉机器翻译技术与系统研制方面展开合作,特别是在对齐平行文本、实例词典、专业术语词典以及句法分析等共同课题方面展开合作。文章介绍了中日两国机器翻译研究的进展并加以比较,对中日两国在机器翻译领域的合作做了分析与展望。相似文献

4.

2015全国机器翻译研讨会ISTIC评测报告

下载免费PDF全文

何彦青孟令恩丁亮石崇德李颖王莉军孙瑶《情报工程》2016,2(5):058-066

中国科学技术信息研究所（ISTIC）机器翻译研发工程历史悠久,几经变迁。本文在回顾ISTIC机器翻译发展历史的基础上,介绍了最近参加第十一届全国机器翻译研讨会机器翻译评测（简称CWMT’2015）系统的具体表现。CWMT’2015评比中, ISTIC 参加了维汉、藏汉、蒙汉三个机器翻译评测项目。本文阐述了本单位机器翻译系统的实现框架以及实施细节,并分析了它们在评测数据上的性能表现。相似文献

5.

汉英双向机器翻译系统BT863的研究与实现 总被引：3，自引：2，他引：1

王海峰李生赵铁军杨彦荀恩东张民《情报学报》1997,(5)

本文将经验主义方法与传统的基于规则的理性主义体系结合起来，提出了一种面向实例、基于模式的机器翻译路线，并在这一翻译路线的指导下，以分析与生成一体、面向生成为基本实现策略，实现了一个面向汉英日常用语的汉英双向机器翻译系统ＢＴ８６３。相似文献

6.

基于机器翻译的专利术语翻译获取方法研究

何彦青刘建辉屈鹏李颖徐红姣《图书情报工作》2014,58(19):25-30

鉴于专利术语的翻译要求高度的准确性和专业性,而专利术语的自动获取翻译对于机器翻译、词典自动编纂、跨语言信息检索等自然语言处理具有重要的实用价值,从双语的专利摘要中分别抽取术语,之后融合多术语识别方法,采用规则翻译和统计机器翻译来动态地辅助词汇化方法进行术语对齐,以期尽可能多地在双语的专利文献中获取准确的专利术语翻译对。在专利文摘中进行实验验证的结果是：专利术语翻译对的准确率达到80%。相似文献

7.

Mu机器翻译项目的语法编写系统(GRADE及其特点)Ⅰ

中村顺一迁井润一长尾真《现代图书情报技术》1989,5(2):39-43

相似文献

8.

Mu机器翻译项目的语法编写系统(GRADE及其特点)Ⅱ

(日）中村顺一迁井润一长尾· 真张潮生(编译) 《现代图书情报技术》1991,7(1):57-61

相似文献

9.

汉英机器翻译中汉语离合词的处理策略 总被引：4，自引：0，他引：4

王海峰李生赵铁军杨沐昀《情报学报》1999,18(4):303-307

汉语中词的离合是指词的构成元素（两个或多个汉字）之间的结合不很紧密,可以在其间插入某些其它成分而被分离,但被分离的词所表达的基本语义不变的语法现象。本文从大规模语料库中对汉语离合词进行了详细的统计分析,并给出了ＢＴ８６３汉英机器翻译系统中汉语离合词的处理策略。相似文献

10.

基于预训练模型的机器翻译译文检测方法

田科张家俊《情报工程》2020,6(5)

相似文献

11.

正确审慎地运用词汇

江乃武《河北科技图苑》2001,14(3):1-1

组词造句,连缀成文,为的是记录下自己的认识同别人交流.写错字,用错词,虽非故意为之,不过,轻则使读者不好理解,重则可能闹出误会或笑话,实在应当谨慎从事. 相似文献

12.

英文医学论文中易错用的词和词组

陈丽文昌兰《出版科学》2009,17(4):36-38,32

归纳英文医学论文的写作和编辑加工中常见的一些容易错用的词,解释其含义,介绍推荐用法,为在医学文献的写作和编辑加工中正确用词提供帮助。相似文献

13.

多测度的突发词探测及验证研究

奉国和武佳佳莫幸清《图书情报工作》2020,64(11):67-76

[目的/意义]为有效探测科技文献中潜在的研究热点,研究文献中关键词突发的特征条件,构建突发词识别模型对促进科研人员精确把握研究方向具有重要意义。[方法/过程]获取各年度内关键词及词频,构建关键词-年度矩阵,将分析时间段划分为标准窗口、观察窗口和表现窗口,在观察窗口内利用多测度突发词探测模型识别具有突发特征的关键词;在表现窗口内利用LDA挖掘主题词汇作为热点词集合。设计突发词覆盖率指标,辅助滑动时间窗口法,计算不同时间窗口内突发词集合和热点词集合的覆盖率,验证模型识别准确性。[结果/结论] 3次滑动时间窗口,计算得到3次突发词覆盖率都在70%以上;与Citespace突发词的对照试验中,本模型3次覆盖率均大于前者,表明设计的突发词探测模型性能良好。相似文献

14.

一种基于序列标注的概念短语抽取方法

李雪思张智雄刘欢《图书情报工作》2022,66(11):121-128

［目的/意义］ 科技文献中的概念是对文献中知识高度凝练的表达,通常以定义句的形式出现在科技文献中。自动从概念定义句中抽取概念,能够进一步挖掘科技文献中蕴含的重要知识。［方法/过程］ 通过分析概念定义句的结构、句式等模式特征,提出以WCL数据集为基础的语料构建方案,并采用BERT+BiLSTM+CRF模型学习概念定义句的模式,从而实现概念短语抽取。［结果/结论］ 结合以往对概念定义句模式特征的研究,创新性地提出一种基于序列标注学习概念定义句的组成模式,从而实现概念短语抽取。通过BERT+BiLSTM+CRF模型,有效学习了概念定义句中的上下文语义、句式结构、组成项分布等模式特征,实现了句子中概念短语的抽取。相似文献

15.

Combining Multiple Strategies for Effective Monolingual and Cross-Language Retrieval

Jacques Savoy 《Information Retrieval》2004,7(1-2):121-148

This paper describes and evaluates different retrieval strategies that are useful for search operations on document collections written in various European languages, namely French, Italian, Spanish and German. We also suggest and evaluate different query translation schemes based on freely available translation resources. In order to cross language barriers, we propose a combined query translation approach that has resulted in interesting retrieval effectiveness. Finally, we suggest a collection merging strategy based on logistic regression that tends to perform better than other merging approaches. 相似文献

16.

关于主题法一个两难问题的解题方案——特称词和类称词的组合运用

庄子逸《图书情报工作》1998,42(2):37-39

针对实践中查词效率和查目效率难以兼顾的两难问题,提出运用概括性强的类称词替代下属的大量特称词,以控制词表的规模;允许各文献情报机构在标引时根据需要将被替代的专指性强的特称词作为类称词的标识词使用,以控制检索系统中相同主题词款目的数量。相似文献

17.

基于词序的多关键词加权检索融合研究 总被引：1，自引：0，他引：1

李培《现代图书情报技术》2008,3(10):32-37

分析国内外目前报道的三种元搜索多关键词加权方法,指出这些方法存在忽视词序的问题;进而提出结合词序特征的多关键词综合加权方法,对多关键词加权方法做重要改进;此外研究基于D-S理论的元搜索结果融合方法;实验表明,该方法可以明显提高检索性能。相似文献

18.

基于规则的化学特征词自动标引研究

宋丹孙济庆《情报学报》2009,28(5)

本文介绍了一种基于规则的识别未登录化学物质名词的方法.通过对大量的化学物质名称进行观察后,发现化学领域中的物质命名有一定的规律可循.本文通过化学物质命名的常用词及规律进行总结,将化学特定词分为3类:化学介词、化学词头和化学符号,制定六项规则,提出了对化学物质名称基于规则的识别方法.在系统实现方面,应用正则表达式将规则结合模板表示出来,从文本信息中提取特定的化学物质专用特征词,同时进行了可行性实验,经过对比,验证了规则的可行性. 相似文献

19.

基于规则的中文时间词和数词的自动识别算法

高霄云杨建林《现代图书情报技术》2007,2(3):46-50

对中文时间词和数词在文本中的常见形式进行归纳，以此为基础构建用于识别时间词、数词的规则集，提出一个基于规则的时间词和数词自动识别算法，并对该算法在竞争情报分析领域和机器翻译领域中的应用价值进行论述。相似文献

20.

基于Mashup的特殊词快捷检索及检索建议

黎邦群《图书情报工作》2012,56(17):126-130

针对当前OPAC存在的关键词拼写错误影响检索结果、检索结果中缺少检索建议等现状,进行特殊词快捷检索、拼音提示、拼写检查及相关搜索等检索建议的研究。利用Mashup和数据库相关技术,对用户输入的关键词进行数据特征的分析与判断,并在此基础上设计和实现特殊词快捷检索,对用户的关键词检索行为给出检索建议提示,以增强OPAC的互动性,提升用户的使用体验。相似文献