首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
针对专利资源,研究一种有效地从专利数据库中获取高质量双语对译语料的方法.该方法利用网页的URL命名特点获取专利数据的详细网页,以实现网页的批量下载,并通过网页解析,采用正则匹配表达式提取出网页上的所需信息,合并数据后形成双语对照的语料数据库.  相似文献   

2.
谈同族专利的检索   总被引:1,自引:0,他引:1  
肖哲  朱理 《图书馆学刊》1998,20(3):42-42,44
谈同族专利的检索肖哲朱理(东北大学图书馆)“同族专利”(patentfamily)是指同一专利在多个不同的国家申请并获准的发明内容基本相同的一组等同专利(equivalentpatent)。广义的同族专利还包括那些由此派生的法定的专利,如接续专利(c...  相似文献   

3.
建立流程应用免费在线开放专利服务(OPS)中的Family专利族服务、Legal法律状态服务、Published-data著录项服务,获得指定专利文献国际专利文献中心(INPADOC)扩展专利族所有成员并按简单专利族编号归类,筛选出所有中国专利成员,最终在同一页面显示中国专利文献著录项信息及法律状态变化历史,并保持专利数据信息与欧洲专利局(EPO)官方网站同步更新。另外,使用链接构造功能将专利信息链接至权威官方专利网站,从而实现专利信息的交叉验证以及相应的增值服务。  相似文献   

4.
采用双曲树可视化方法,对转换成树形结构的同族专利可视化进行研究,提出优先权模式和国家模式的两种同族专利可视化表示。设计实现同族专利可视化分析工具,阐述该工具的技术思路、结构框架、主要功能和关键技术实现,并以苹果公司的触摸屏专利为例进行实证研究。  相似文献   

5.
6.
基于汉英双语语料库的汉英词典编撰研究   总被引:5,自引:0,他引:5  
杨沐昀  刘晓月  李生 《情报学报》2003,22(3):310-314
汉英词典对于跨语言信息检索、计算机翻译等许多领域具有重要意义。为了利用双语语料库获取汉英词典 ,本文在对四种常见的基于共现信息的词汇对译计算模型进行研究之后 ,以对数相似性模型为基础 ,采用迭代策略实现了翻译词典获取。实验表明 ,该方法能够有效地提高词典获取的正确率 ,提高词典编撰效率  相似文献   

7.
在对专利情报系统理论、特征及其应用进行概述的基础上,结合地方专利情报服务现状,从服务机构、信息资源、情报技术及系统应用等角度,探讨东莞市专利情报服务系统建设,最后提出了建设地方专利情报服务系统的实施途径。  相似文献   

8.
专利法律信息是专利信息的重要组成部分,一般可分为法律状态信息、权利要求信息、专利诉讼信息和其他法律信息四种,其他法律信息包括同族专利信息等。文章从这四种专利法律信息的概念出发,针对每种法律信息的挖掘方法和内容进行综述研究。目前专利法律信息挖掘领域的研究人员局限在几个群体,且他们分别研究专利法律信息的某一部分,研究比较分散,彼此关联不紧密,没有形成完整的规模和体系。  相似文献   

9.
基于国家知识产权局专利局专利信息资源存储管理现状的分析,提出专利信息资源存储管理系统的建设目标,重点描述专利信息资源存储管理系统的基本架构和存储结构,并且指出构建专利信息资源存储管理系统的关键问题,以期实现专利信息资源的合理保存。  相似文献   

10.
严伟 《情报工程》2017,3(1):072-080
本文以专利这一类科技文献数据为主要载体,针对知识转化过程中隐含的技术层面进行组织分析。通过某一特定产业的产业链,以专利集中度为重心,从微观角度对专利进行定量定性分析,构造一种研究机构技术发展方向、技术热点领域的新分析方法,进而来判定机构的技术优势,并以专利链的属性预测机构的技术发展趋势。  相似文献   

11.
面向双语术语抽取这一应用目标,提出专业领域可比语料库的构建方案并进行实验论证。针对给定的主题领域分别进行中英文专业语料的采集,从中分别获取中英文关键词,根据词语共现统计获取该主题领域的其他相关关键词;以这些关键词作为查询入口,通过学术搜索引擎从网络获取候选可比语料;对可比语料进行定量评估,以剔除不符合要求的语料,最终得到特定主题领域的可比语料库。  相似文献   

12.
面向专利数据领域,根据专利引文数据、IPC分类号、德温特分类号构建一种专利相似度的测量方法,以LT E移动通信领域专利为样本进行实证分析,发现该方法对专利相似程度区分性较好。  相似文献   

13.
专利摘要是重要的情报分析数据来源,但其自然语言文本的特征,使得专利摘要的自动内容抽取具有较大难度。文章利用亚洲语言信息检索测评会议(NACSIS Test Collections for IR, NTCIR,)提供的英文专利文摘测试语料,采用文本信息抽取统计方法中的条件随机场模型,通过提取并添加有效的特征,有针对性地抽取专利摘要中表示技术和功效内容的信息,为专利的技术功效矩阵分析提供可机器自动抽取的强大支持。  相似文献   

14.
近年来,科学技术发展日新月异,每天都会出现各种新型研究领域,众多研究成果被发表与公布。为此,来自各个国家的组织机构做了巨大的努力要为自己的机构带来外部与内部的变化。事实上,对于很多机构来说,研究的意义在于通过分析研究成果得到有意义的结论。因此,本文通过对具体机制下的专利标题(发明名称)进行分析从而提出一种演化模型。首先,我们根据关键词的特性对标题的关键词进行分类,然后定义专利的相互关系。我们建议演化模型的相互关系建立在时间轴基础上,并且可以适用于实际数据。通过应用于实际数据的模型可预测出未来专利的关键词。  相似文献   

15.
从专利情报视角,运用SPSS软件,对国家知识产权局1994年全年授权的3838件发明专利中因未交专利年费而被终止的2921件进行多元线型回归实证分析。分析结果表明,国家知识产权局授权的发明专利平均维持时间短,被终止速度快;外国申请人获得的发明专利维持时间比国内申请人获得的发明专利维持时间长;申请人的国别、从申请到授权所需时间、权利主体类型、发明人数和权利要求数对发明专利的维持时间影响依次减弱。  相似文献   

16.
黎楠  杜永萍  何明 《情报工程》2015,1(3):090-097
LDA 主题模型可用于识别大规模文档集中潜藏的主题信息,本文提出了一种基于LDA 建立发明人兴趣主题模型的方法,合并每位发明人的专利数据,专利信息基于发明人进行划分,将标准的文档- 主题-词的三层LDA 模型变为专利数据中的发明人- 主题- 词的发明人兴趣模型,实现发明人的主题发现,并利用该模型中主题分布之间的相似性进行发明人的个性化推荐。在采集真实专利数据集上的实验结果表明该方法相比传统的向量空间模型方法和隐马尔科夫模型方法具有更高的准确率,推荐效果更优。  相似文献   

17.
熊文新 《图书情报工作》2013,57(10):128-135
对Web和语料库以及多语语料库的关系进行辨析,针对Web上丰富的各类电子文本,从语言工程角度出发,提出"分步骤、按领域"建设大规模双语平行语料库的思路,即选定领域专一、语言可靠、格式规范的文本,逐次建设特定领域的语料库,最后汇总成高质量、大规模、全领域的"高大全"式双语平行语料库。同时,围绕一个实例介绍如何利用Web资源建设特定领域双语平行语料库。  相似文献   

18.
基于语料库的双语词典编纂软件设计与实现   总被引:4,自引:0,他引:4  
CONULEXID是一个基于语料库的双语词典编纂软件系统,其目的是为词典编纂提供新鲜的语料,并且实现词典信息自动查找、自动派生词典、自动修订、自动排版等。介绍了该系统的数据来源、功能模块、系统设计以及SGML文档组织技术等相关实现技术。该系统是语料库语言学在双语词典编纂领域的一个应用实例。  相似文献   

19.
专利文献中包含了大量的技术、经济与法律信息,国外官方专利网站数据库是专利信息检索的重要资源.论文对欧洲专利局、日本专利局和俄罗斯专利局网站提供的免费专利信息检索系统及检索方法和技巧进行了详细介绍.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号