首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
科技文献跨语言推荐模型研究   总被引:1,自引:0,他引:1  
信息超载和语言障碍影响我国科研人员对外文科技文献的有效获取,如何提高获取效率成为亟待解决的问题。个性化推荐能很好地处理信息超载现象,但当前国内外相关研究都基于单一语种进行,多语种环境下的推荐研究非常缺乏。本文提出网络环境和海量数据背景下的科技文献跨语言推荐模型,并论证用户兴趣特征抽取、语言转换和混合推荐等步骤。利用Web日志挖掘技术,分析基于多种信息行为的整合分析方法抽取用户兴趣特征,以分类表作为参考体系建立用户兴趣表示模型,在用户—特征词转化为用户—类目矩阵的基础上开展推荐研究。  相似文献   

2.
[目的/意义] 要实现"一带一路"多语种共享型数据库资源的有效利用,必须解决跨语言检索问题,基于已建"一带一路"数据库检索功能调查结果,分析"一带一路"多语种共享型数据库检索功能需求,以调研跨语言检索平台为视角,为"一带一路"多语种共享型数据库的跨语言检索功能设计与开发提供参考。[方法/过程] 采用文献调研法和网络调研法,选取11个国内外典型的跨语言检索平台,从跨语言检索方法、跨语言翻译实现方法、检索功能设置、检索结果呈现、界面与检索支持语种6个方面进行分析,总结其实现方法。[结果/结论] 为"一带一路"多语种共享型数据库的跨语言检索功能设计与开发提出策略:应采用基于神经网络机器翻译的提问式-文献翻译方法,实现多种检索功能,应用可视化技术呈现检索结果,提供多语言检索界面和资源。  相似文献   

3.
双语文本对应分析在处理多语言文本数据、克服语言障碍等方面有着重要的作用,基于语料库技术的跨语言潜在语义索引方法没有充分考虑双语的语义相关性.本文将双语平行文档看作同一语义内容的两种语言表达,运用偏最小二乘方法构建双语文本的语义相关性,为每种语言建立单独的潜在语义空间,并在这两个空间上实现跨语言的分类任务.在香港政府网中英双语新闻的实验结果显示,本文方法构造的双语潜在语义空间上完成的跨语言和单语言文本分类性能接近或优于原始特征空间的单语言分类,并具有良好的稳健性.  相似文献   

4.
跨语言主题标引是满足多语种用户信息需求的重要途径之一。本文以国家图书馆主题标引工作为例,剖析了当前跨语言主题标引存在的问题,探讨了跨语言主题标引实现的路径,并结合国家图书馆的实际提出了开展跨语言主题标引工作的策略。  相似文献   

5.
数字图书馆海量信息的多语种问题,成为人们获取信息资源的一大障碍,而当前的跨语言检索系统普遍存在翻译准确性差、效率低、成本高等不足.主题图作为一种可合并的索引,在知识表示、知识描述、资源定位、语境等方面的优势,可为翻译提供充实的上下文信息.本文正是针对跨语言检索的上述问题,在深入分析主题图技术的基础上,提出一种新的基于主题图的数字图书馆英汉跨语言检索模型.该模型采用索引翻译的策略,实现跨语言检索的目的.其最大的优点是在提高翻译准确性的同时,降低了翻译的工作量和成本.  相似文献   

6.
跨语言信息检索进展研究   总被引:7,自引:1,他引:6  
根据研究对象的变迁,国外关于跨语言信息检索的历程主要分为三个阶段。跨语言信息检索目前的主要解决方法是在单语言信息检索系统上增加一个语言转换机制。解决查询条件与查询文档集间的语言障碍有五种不同的技术路线。跨语言信息检索主要研究热点有翻译歧义研究、翻译资源构建、专有名词识别与音译研究等五个领域。  相似文献   

7.
面对日益膨胀的多语种信息资源,跨语言信息检索已成为实现全球知识存取和共享的关键技术手段。构建一个实用型的跨语言检索查询翻译接口,可方便地嵌入任意的信息检索平台,扩展现有信息检索平台的多语言信息处理能力。该查询翻译接口采用基于最长短语、查询分类和概率词典等多种翻译消歧策略,并从查询翻译的准确性和接口的运行效率两个角度对构建的查询翻译接口进行评测,实验结果验证所采用方法具有可行性。  相似文献   

8.
基于K-近邻方法的科技文献分类   总被引:4,自引:1,他引:3  
鲍文  胡清华  于达仁 《情报学报》2003,22(4):451-456
本文提出了一种在小样本数据下、无需分词处理的科技文献分类器建造方法.分析了科技文献的特点,提出了抽取科技文献的关键词作为分类特征词条,以文献的标题、关键词和摘要作为文档主题信息进行词频统计分析建立分类器.最后分别进行了基于最近邻决策和K-邻近决策的分类效果实验研究,实验证明基于欧氏距离相似性测度和基于余弦相似性测度的文本分类效果并不存在显著的差别,K-邻近决策的分类效果要优于最近邻决策的分类效果.  相似文献   

9.
跨语言信息检索理论与应用研究   总被引:5,自引:0,他引:5  
郭宇锋  黄敏 《图书与情报》2006,35(2):79-81,84
随着互联网的全球化发展趋势,跨语言信息检索日益成为信息检索领域中的重要课题,跨语言检索可用一种提问语言检索出用另一种语言书写的信息。文章主要对跨语言信息检索理论应用研究进行了探讨,并对其在专业领域数据库中的应用提出一种思路。  相似文献   

10.
[目的/意义]从实体关系抽取视角出发,将单一语言情境下的知识获取任务扩展到跨语言情境,提升低资源语言的关系抽取效果。[方法/过程]提出一种跨语言对抗关系抽取(Cross-Lingual Adversarial Relation Extraction, CLARE)框架,将跨语言关系抽取分解为平行语料获取和对抗适应关系抽取两个子模块。通过词典扩展或自学习方法将源语言关系抽取数据集转换为目标语言数据集,在此基础上利用对抗特征适应将源语言的特征表示迁移给目标语言,再利用训练得到的目标语言关系抽取网络对目标语言进行关系分类。[结果/结论]将本文方法应用到以ACE2005多语言数据集为基础的英语-中文、中文-英文两种跨语言关系抽取任务上,最优模型的Macro-F1值分别为0.880 1和0.842 2。实验结果表明本文提出的跨语言对抗关系抽取CLARE框架能显著提升低资源语言实体关系抽取的效果。研究结果对于改进跨语言情境下的关系抽取模型以及促进实体关系抽取研究在情报学领域的应用具有重要意义。  相似文献   

11.
The problem of finding documents written in a language that the searcher cannot read is perhaps the most challenging application of cross-language information retrieval technology. In interactive applications, that task involves at least two steps: (1) the machine locates promising documents in a collection that is larger than the searcher could scan, and (2) the searcher recognizes documents relevant to their intended use from among those nominated by the machine. This article presents the results of experiments designed to explore three techniques for supporting interactive relevance assessment: (1) full machine translation, (2) rapid term-by-term translation, and (3) focused phrase translation. Machine translation was found to better support this task than term-by-term translation, and focused phrase translation further improved recall without an adverse effect on precision. The article concludes with an assessment of the strengths and weaknesses of the evaluation framework used in this study and some remarks on implications of these results for future evaluation campaigns.  相似文献   

12.
基于伪相关反馈的跨语言查询扩展   总被引:3,自引:2,他引:1  
相关反馈是一种重要的查询重构技术,本文分析了两类相关反馈技术,一是按用户是否参与可分为伪相关反馈和交互式相关反馈,二是按作用于查询的方式可分为查询扩展与检索词重新加权.在此基础上,本文重点探讨了将相关反馈技术应用于跨语言信息检索,提出了翻译前查询扩展、翻译后查询扩展、翻译前与翻译后相结合的查询扩展三种方法.最后,本文通过伪相关反馈实验对这三种方法进行了比较,实验结果显示,三种跨语言查询扩展方法都能够有效地提高检索结果的精度,其中翻译后查询扩展方法相对更优越.此外,查询式的长度对不同跨语言查询扩展方法产生着不同程度的影响.  相似文献   

13.
在现有国内外医学检索语言研究的基础上,构建了一个跨语种一体化医学检索语言系统.通过中、英文医学词汇、中图法等级结构和MeSH树状结构及其相互之间的对应转换,该系统为医学信息检索提供更深层的医学知识导航及其跨语言检索接口.  相似文献   

14.
跨语言信息检索方法概述   总被引:4,自引:0,他引:4  
本文介绍了跨语言信息检索问题的由来与发展,通过对单语言信息检索技术的介绍引入了跨语言检索的关键问题,并分别介绍了跨语言信息检索中基于词典、基于语料和基于机器翻译模块这三种主流方法,最后对跨语言检索的一体化方法等较新的思想和跨语言检索评测等做了简要说明.  相似文献   

15.
This paper describes and evaluates different retrieval strategies that are useful for search operations on document collections written in various European languages, namely French, Italian, Spanish and German. We also suggest and evaluate different query translation schemes based on freely available translation resources. In order to cross language barriers, we propose a combined query translation approach that has resulted in interesting retrieval effectiveness. Finally, we suggest a collection merging strategy based on logistic regression that tends to perform better than other merging approaches.  相似文献   

16.
跨语言信息检索的应用是当今信息检索系统,尤其是网络信息检索系统研究的重点和热点。对目前网上最热门的20个中英文搜索引擎的跨语言信息检索应用现状进行了调查,分析了存在的问题,并提出了改进的建议。  相似文献   

17.
The Cross-Language Evaluation Forum (CLEF) is now in its fourth year of activity. We summarize the main lessons learned during this period, outline the state-of-the-art of the research reported in the CLEF experiments and discuss the contribution that this initiative has made to research and development in the multilingual information access domain. We also make proposals for future directions in system evaluation aimed at meeting emerging needs.  相似文献   

18.
文章旨在探讨查询分类技术和跨语言检索技术的关系,前者的应用能否改善后者的系统性能是核心问题。首先提出一种基于查询分类的标准化折扣累积增量评价指标,通过对采用查询分类技术前后信息检索系统的标准化折扣累积增量评价指标的变化进行判断,来检验该评价指标的可用性和有效性。同时,查询分类可以作为降低跨语言检索系统查询翻译的歧义性的技术手段。对大规模查询集随机抽样的查询翻译实验结果表明,本文提出的基于查询分类的查询翻译消歧方法对大部分查询有效,在一些情况下甚至可以直接通过本方法完成查询翻译。结合其他方法进一步消除翻译的歧义性则是下一步的工作内容。  相似文献   

19.
分析跨语言信息检索的基本模式和翻译消歧关键技术,采用基于词语对共现率和词语间距加权计算的方法,对查询式翻译进行消歧优化,在此基础上构建跨语言商品信息检索系统并应用于图书商品搜索,实验结果证明翻译质量和检索效果得到提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号