首页 | 本学科首页   官方微博 | 高级检索  
     检索      

提取方正排版文件广义元数据并生成全文HTML的探索
引用本文:杨海亮,徐用吉.提取方正排版文件广义元数据并生成全文HTML的探索[J].中国科技期刊研究,2016,27(2):202-206.
作者姓名:杨海亮  徐用吉
作者单位:东北大学学报编辑部,辽宁省沈阳市和平区文化路三巷11号 110819,东北大学学报编辑部,辽宁省沈阳市和平区文化路三巷11号 110819
基金项目:辽宁省社会科学规划基金资助项目(L12DXW011)
摘    要:【目的】实现自动提取科技期刊全文元数据并生成HTML文件。【方法】 以方正排版文件为对象,在可以提取出来文章的标题、摘要等元数据的基础上,将文章的正文内容元数据化,提出了包含图、表、公式等的广义元数据概念,并建立了提取图、表元数据的提取规则,同时将方正排版数学公式转化为LaTeX表达式。然后利用VB编程软件编写了自动提取广义元数据程序并将元数据重新组合生成HTML格式的文件。【结果】 根据方正BD排版语言的特点,建立的提取规则能有效提取全文并元数据化,最后可直接生成HTML文件。【结论】 实际应用表明了利用广义元数据生成HTML文件的有效性和可行性。

关 键 词:广义元数据  方正BD排版语言  VB编程软件  自动全文提取  HTML文件
收稿时间:2015/9/28 0:00:00
修稿时间:2015/12/24 0:00:00

Study on general metadata extraction from Founder typesetting files and generating the full text of HTML
YANG Hailiang and XU Yongji.Study on general metadata extraction from Founder typesetting files and generating the full text of HTML[J].Chinese Journal of Scientific and Technical Periodicals,2016,27(2):202-206.
Authors:YANG Hailiang and XU Yongji
Abstract:
Keywords:
点击此处可从《中国科技期刊研究》浏览原始摘要信息
点击此处可从《中国科技期刊研究》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号