共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
面向专利领域的机器翻译近年来已成为机器翻译的重要应用领域之一。本文提出了一个汉英专利文本机器翻译融合系统,该系统以规则系统为主导搭建,并把规则翻译方法和基于短语的统计翻译系统相结合。在融合系统中,规则系统主要负责源语言的分析和转换阶段的处理,生成相应的源语言句法分析树与转换树,并确定目标语言的基本句法框架。统计翻译系统则在目标语生成阶段根据生成的目标语句法结构寻找合适的对译词形,并产生最终的候选译文。通过利用自动评测指标对融合系统进行测试,融合系统的结果均优于单个规则系统和统计系统的结果,表明了融合方法的有效性和可行性,可以改善系统的翻译性能,提高翻译质量。 相似文献
3.
机器翻译研究用计算机实现不同自然语言之间的翻译。自第一台计算机诞生开始,人们一直在研究和探索高质量高效率的机器翻译技术。近年来,基于规则的机器翻译、基于实例的机器翻译和基于统计的机器翻译这几种主要的翻译模式共同存在且相互补充,并有不断融合之势。随着中国和日本在科技、经济和文化交流的不断深入,机器翻译研究对于打破汉语和日语之间的语言壁垒进而推进中日两国各个领域的交流与合作具有重要的应用价值。中国和日本两国机器翻译研究人员已经开展了大量的汉日/日汉机器翻译的理论研究与系统研制,已取得了有效的成果,但距离大规模实际应用和高标准的翻译质量的要求尚有差距。为此,中日两国机器翻译人员有必要在汉日/日汉机器翻译技术与系统研制方面展开合作,特别是在对齐平行文本、实例词典、专业术语词典以及句法分析等共同课题方面展开合作。文章介绍了中日两国机器翻译研究的进展并加以比较,对中日两国在机器翻译领域的合作做了分析与展望。 相似文献
4.
5.
6.
7.
8.
9.
10.
11.
12.
归纳英文医学论文的写作和编辑加工中常见的一些容易错用的词,解释其含义,介绍推荐用法,为在医学文献的写作和编辑加工中正确用词提供帮助。 相似文献
13.
[目的/意义]为有效探测科技文献中潜在的研究热点,研究文献中关键词突发的特征条件,构建突发词识别模型对促进科研人员精确把握研究方向具有重要意义。[方法/过程]获取各年度内关键词及词频,构建关键词-年度矩阵,将分析时间段划分为标准窗口、观察窗口和表现窗口,在观察窗口内利用多测度突发词探测模型识别具有突发特征的关键词;在表现窗口内利用LDA挖掘主题词汇作为热点词集合。设计突发词覆盖率指标,辅助滑动时间窗口法,计算不同时间窗口内突发词集合和热点词集合的覆盖率,验证模型识别准确性。[结果/结论] 3次滑动时间窗口,计算得到3次突发词覆盖率都在70%以上;与Citespace突发词的对照试验中,本模型3次覆盖率均大于前者,表明设计的突发词探测模型性能良好。 相似文献
14.
[目的/意义] 科技文献中的概念是对文献中知识高度凝练的表达,通常以定义句的形式出现在科技文献中。自动从概念定义句中抽取概念,能够进一步挖掘科技文献中蕴含的重要知识。[方法/过程] 通过分析概念定义句的结构、句式等模式特征,提出以WCL数据集为基础的语料构建方案,并采用BERT+BiLSTM+CRF模型学习概念定义句的模式,从而实现概念短语抽取。[结果/结论] 结合以往对概念定义句模式特征的研究,创新性地提出一种基于序列标注学习概念定义句的组成模式,从而实现概念短语抽取。通过BERT+BiLSTM+CRF模型,有效学习了概念定义句中的上下文语义、句式结构、组成项分布等模式特征,实现了句子中概念短语的抽取。 相似文献
15.
Jacques Savoy 《Information Retrieval》2004,7(1-2):121-148
This paper describes and evaluates different retrieval strategies that are useful for search operations on document collections written in various European languages, namely French, Italian, Spanish and German. We also suggest and evaluate different query translation schemes based on freely available translation resources. In order to cross language barriers, we propose a combined query translation approach that has resulted in interesting retrieval effectiveness. Finally, we suggest a collection merging strategy based on logistic regression that tends to perform better than other merging approaches. 相似文献
16.
针对实践中查词效率和查目效率难以兼顾的两难问题,提出运用概括性强的类称词替代下属的大量特称词,以控制词表的规模;允许各文献情报机构在标引时根据需要将被替代的专指性强的特称词作为类称词的标识词使用,以控制检索系统中相同主题词款目的数量。 相似文献
17.
基于词序的多关键词加权检索融合研究 总被引:1,自引:0,他引:1
李培 《现代图书情报技术》2008,3(10):32-37
分析国内外目前报道的三种元搜索多关键词加权方法,指出这些方法存在忽视词序的问题;进而提出结合词序特征的多关键词综合加权方法,对多关键词加权方法做重要改进;此外研究基于D-S理论的元搜索结果融合方法;实验表明,该方法可以明显提高检索性能。 相似文献
18.
本文介绍了一种基于规则的识别未登录化学物质名词的方法.通过对大量的化学物质名称进行观察后,发现化学领域中的物质命名有一定的规律可循.本文通过化学物质命名的常用词及规律进行总结,将化学特定词分为3类:化学介词、化学词头和化学符号,制定六项规则,提出了对化学物质名称基于规则的识别方法.在系统实现方面,应用正则表达式将规则结合模板表示出来,从文本信息中提取特定的化学物质专用特征词,同时进行了可行性实验,经过对比,验证了规则的可行性. 相似文献
19.
对中文时间词和数词在文本中的常见形式进行归纳,以此为基础构建用于识别时间词、数词的规则集,提出一个基于规则的时间词和数词自动识别算法,并对该算法在竞争情报分析领域和机器翻译领域中的应用价值进行论述。 相似文献
20.
针对当前OPAC存在的关键词拼写错误影响检索结果、检索结果中缺少检索建议等现状,进行特殊词快捷检索、拼音提示、拼写检查及相关搜索等检索建议的研究。利用Mashup和数据库相关技术,对用户输入的关键词进行数据特征的分析与判断,并在此基础上设计和实现特殊词快捷检索,对用户的关键词检索行为给出检索建议提示,以增强OPAC的互动性,提升用户的使用体验。 相似文献