首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
基于K-近邻方法的科技文献分类   总被引:4,自引:1,他引:3  
鲍文  胡清华  于达仁 《情报学报》2003,22(4):451-456
本文提出了一种在小样本数据下、无需分词处理的科技文献分类器建造方法.分析了科技文献的特点,提出了抽取科技文献的关键词作为分类特征词条,以文献的标题、关键词和摘要作为文档主题信息进行词频统计分析建立分类器.最后分别进行了基于最近邻决策和K-邻近决策的分类效果实验研究,实验证明基于欧氏距离相似性测度和基于余弦相似性测度的文本分类效果并不存在显著的差别,K-邻近决策的分类效果要优于最近邻决策的分类效果.  相似文献   

2.
研究利用数据挖掘中的关联规则挖掘分析及论文数据库,进行相关文献推荐,提出适用于进行相关文献推荐的改进的混合加权关联规则挖掘算法,并通过用户行为分析确定相关文献集和垂直权重,采用Google搜索引擎的PageRank算法确定水平权重,获得一些有意义的分析结果。  相似文献   

3.
分析了开展科技文献要素关联与揭示研究的重要价值,从引文、关键词、作者、期刊、多个文献要素等要素关联角度对国内外相关研究进行了述评,指出了当前研究存在的问题及未来研究的重点。  相似文献   

4.
基于Apriori算法的关联规则,在高校图书馆,对学生的借阅数据进行深度的挖掘和分析,得出相关联的书籍,从而为学生提供潜在需求的服务,打造个性化图书馆服务,为学生提供了便利的同时,也提高了图书馆资源的利用率。  相似文献   

5.
地方文献分类思想研究   总被引:12,自引:1,他引:11  
本文列举并分析了国内图书馆地方文献分类工作的现状,从地方文献的概念、内容及其性质的角度对地方文献的分类思想进行了探讨,并在实践的基础上提出了地方文献的分类模式.  相似文献   

6.
文章研究了社会学文献分类的三个问题社会学文献的分类标准;社会学文献分类的体系;社会学文献的分类方法.  相似文献   

7.
章研究化学献分类的三个问题:化学献的分类标准,化学献的分类体系,化学献的分类方法。  相似文献   

8.
章研究了天学献分类的三个问题:天学献的分类标准;天学献的分类体系;天学献的分类方法。  相似文献   

9.
白国应 《河北科技图苑》2003,16(3):42-45,61
研究晶体学文献分类的三个问题:(1)晶体学文献的分类标准;(2)晶体学文献的分类体系;(3)晶体学文献的分类方法。  相似文献   

10.
文章研究了海洋学文献分类的三个问题:海洋学文献的分类标准;海洋学文献的分类体系;海洋学文献的分类方法。  相似文献   

11.
基于关键词的科技文献聚类研究   总被引:1,自引:0,他引:1  
描述一种基于改进TF IDF特征词加权算法的科技文献聚类方法:首先提取科技文献的特征词;然后根据特征词的词频、所在位置和词性为特征词加权,建立科技文献的向量空间模型;接着使用基于密度的聚类算法对科技文献向量空间模型数据进行聚类分析;最后使用主成分分析法对科技文献聚类的结果进行标识,利用F measure方法对聚类结果进行评价。实验表明,用提出的科技文献聚类方法能够从所检索的科技文献中发现热点研究领域,并能识别具有学科融合性质的研究方向。  相似文献   

12.
以民族类文献及其分类工作为出发点,针对《中图法》(第四版)民族文献的类目设置,建议增设民族学科相关类目和类目注释。  相似文献   

13.
传统文献分类法在实际应用过程中出现了实用性和科学性等问题。为了探索改进方法,文章首次从文献使用人的角度对文献分类对象"图书"、"资料"和"信息"的含义进行了详细分析,并将所有文献分类对象都归入"图书类"、"狭义资料类"和"狭义信息类"。并在此基础上,将基于知识分类和基于使用目的两种分类方式有效地组合成一种完整的新文献分类法。通过分析,新文献分类法可以有效解决传统文献分类法存在的不足。  相似文献   

14.
张琴 《晋图学刊》2009,(6):4-7,13
心理学学科体系庞大,分为基础心理学与应用心理学两大部分,它们又各自分化、衍生出许多分支学科。众多分支学科之间相互联系造成心理学文献分类的复杂性。理顺心理学各学科分支的相互关系,能准确地对心理学文献进行分类标引。  相似文献   

15.
在研究文献资源数据库分析功能和分析学术科研过程各阶段对文献需求特性的基础上,将多个常用文献数据库分析功能进行分解和重组,构建贯穿于整个科研过程的文献资源数据库功能重组与服务模式,实现单一文献数据库纵向服务模式到多个数据库功能重组后的横向服务模式的根本转变,从而最大程度地发挥现有资源面向科研服务的效能。  相似文献   

16.
Text Categorization Based on Regularized Linear Classification Methods   总被引:5,自引:0,他引:5  
A number of linear classification methods such as the linear least squares fit (LLSF), logistic regression, and support vector machines (SVM's) have been applied to text categorization problems. These methods share the similarity by finding hyperplanes that approximately separate a class of document vectors from its complement. However, support vector machines are so far considered special in that they have been demonstrated to achieve the state of the art performance. It is therefore worthwhile to understand whether such good performance is unique to the SVM design, or if it can also be achieved by other linear classification methods. In this paper, we compare a number of known linear classification methods as well as some variants in the framework of regularized linear systems. We will discuss the statistical and numerical properties of these algorithms, with a focus on text categorization. We will also provide some numerical experiments to illustrate these algorithms on a number of datasets.  相似文献   

17.
[目的/意义]潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)在科技情报分析中用来发现学科主题、挖掘研究热点以及预测研究趋势等。对常见的科学文献文本语料库(关键词、摘要、关键词+摘要)进行LDA主题抽取效果的评价,以揭示不同语料库的主题抽取效果,提高LDA在科技情报分析中的应用效果。[方法/过程]对上述3种语料库下的LDA主题模型进行对比研究,采用基于查全率、查准率、F值以及信息熵的定量分析和基于主题抽取的广度和主题粒度的定性分析相结合的方法对主题抽取效果进行评价。[结果/结论]通过国内风能领域的科学文献数据实证研究发现,无论是从定量分析还是从定性分析来看,摘要和关键词+摘要作为语料的LDA主题抽取的效果均优于关键词作为语料的LDA主题抽取效果,并且前者在主题抽取的广度方面表现更好,而后者抽取的主题粒度更细。  相似文献   

18.
首先分析文本分类的现状,根据文本分类算法的要求和稀疏表示分类算法(SRC)的思想,设计基于元样本的稀疏表示分类器(MSRC),并应用于文本分类研究。实验结果表明,该MSRC算法具有较好的文本分类效果,有助于提高基于内容的信息检索效率。  相似文献   

19.
随着撤销论文数量地不断增加,科学文献数据库对撤销论文标注地日益规范以及学术界对撤销论文现象地逐步重视,相关研究越来越多。本文以Web of Science数据库中撤销论文数据为研究对象,从年份、学科、国家、期刊、机构及作者等6个方面对撤销论文的分布规律及特点进行分析总结。以期在揭示国际科学文献数据库中撤销论文分布特点的同时,提高我国科研管理部门、文献数据库商、期刊编辑和科研人员等对撤销论文及其不良影响的关注,进一步规范对撤销论文的标注。促进学术期刊出版机构及科研管理部门建立健全相应的管理机制,制定行之有效的管理措施,遏制我国学术不端行为的发生。  相似文献   

20.
杨兴菊 《图书馆论坛》2006,26(2):173-175
从医药、卫生新兴学科文献归类问题、类目的设置问题、类目的注释问题、多学科交叉文献归类问题等几方面进行研究探讨,提出相应的建议及解决办法,力求科学准确归类。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号