首页 | 本学科首页   官方微博 | 高级检索  
     检索      

ASPEC: 亚洲科学论文摘录语料库
引用本文:Toshiaki Nakazaw,Manabu Yaguchi,Kiyotaka Uchimoto,Masao Utiyam,Eiichiro Sumit,Sadao Kurohashi,Hitoshi Isahar,何彦青,刘建辉.ASPEC: 亚洲科学论文摘录语料库[J].情报工程,2017,3(3):040-046.
作者姓名:Toshiaki Nakazaw  Manabu Yaguchi  Kiyotaka Uchimoto  Masao Utiyam  Eiichiro Sumit  Sadao Kurohashi  Hitoshi Isahar  何彦青  刘建辉
作者单位:科学技术振兴机构,科学技术振兴机构,国家信息与通讯研究所,国家信息与通讯研究所,国家信息与通讯研究所,京都大学,丰桥技术科学大学,中国科学技术信息研究所,河北地质大学
摘    要:本文详细介绍了ASPEC(亚洲科学论文摘录语料库)。作为首个大规模的科学论文领域内的平行语料库,ASPEC 是由日- 中机器翻译项目于 2006 年至2010 年间利用科技促进专用协作基金构建起来的。它包含约300 万条平行语句的日- 英科学论文摘要语料库(ASPEC-JE)和约68万条平行语句的中- 日科学论文摘录语料库(ASPEC-JC)。ASPEC 被用作机器翻译评测研讨会WAT(亚洲翻译研讨会)的官方数据集。

关 键 词:平行语料库,科学论文,亚洲语言

ASPEC: Asian Scientific Papers Excerpt Corpus
Authors:Toshiaki Nakazaw  Manabu Yaguchi  Kiyotaka Uchimoto  Masao Utiyam  Eiichiro Sumit  Sadao Kurohashi  Hitoshi Isahar  HE YanQing and LIU JianHui
Institution:Japan Science and Technology Agency,Japan Science and Technology Agency,National Institute of Information and Communications Technology,National Institute of Information and Communications Technology,National Institute of Information and Communications Technology,Kyoto University,Toyohashi University of Technology,Institute of Scientific and Technical Information of China and Hebei GEO University
Abstract:In this paper, we described the details of the ASPEC (Asian Scientific Paper Excerpt Corpus), which is the first large-size parallel corpus of scientific paper domain. ASPEC was constructed in the Japanese-Chinese machine translation project conducted between 2006 and 2010 using the Special Coordination Funds for Promoting Science and Technology. It consists of a Japanese-English scientific
Keywords:Parallel corpus  scientific paper  Asian languages
点击此处可从《情报工程》浏览原始摘要信息
点击此处可从《情报工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号