共查询到19条相似文献,搜索用时 62 毫秒
1.
郝慧 《现代图书情报技术》2015,(1):89-95
【目的】通过对科技查新中的跨库检索结果进行去重,提高查新检索效率。【方法】选取不同数据库检索记录中唯一性的特征四元组{论文名称,期刊名,发表时间,第一作者}信息,用改进的I-Match中的对比算法构建检索记录特征字串作为去重的计算依据。【结果】跨库检索去重算法对数据库检索结果进行初步分析和去重,提高查新检索效率。通过测试,算法去重准确率较高,而召回率受数据库收录信息完善度的影响,还有提高的空间。【局限】算法处理效果依赖于从数据库检索记录中提取特征四元组,由于不同数据库的检索返回结果存在差异,需要针对不同论文数据库定制检索记录特征抽取模板。【结论】通过实验测试,算法具有较高的去重准确率和处理效率,符合预定科技查新需求。 相似文献
2.
殷波 《现代图书情报技术》2008,(Z1)
以去除冗余网页为目标,分析搜索引擎工作原理,讨论现有的去重算法,并提出基于Suffix Tree的倒排索引改进算法.实验表明该算法有着优秀的判断文档相似度的特性.最后对现有去重算法进行分析总结并提出网页去重新思路,以便进行下一步研究. 相似文献
3.
谈查新工作中查新员与查新委托人的合作 总被引:1,自引:0,他引:1
对查新委托人的角色进行了分析,并对查新工作中查新员与查新委托人如何正确合作,发挥查新委托人在查新工作中的积极作用,避免委托人带来的一些负面影响进行了详细的分析和探讨。 相似文献
4.
5.
6.
科技查新中查新点的分析与提炼 总被引:18,自引:1,他引:18
本文从科技查新和查新点的定义入手,指出查新点是影响科技查新质量的一个重要因素,并结合实际案例探讨了如何准确分析、把握、提炼查新点,同时提出了提高查新质量对查新人员综合素质的要求。 相似文献
7.
8.
9.
针对大规模信息采集,运用Bloom Filter及其改进算法,在误差允许的条件下,通过URL散列运算可以有效地对同源网页进行去重.实践证明,通过对其参数进行合理的调整,可以达到满意的结果. 相似文献
10.
基于Bloom Filter的超大规模网页去重策略研究 总被引:1,自引:0,他引:1
丁振国吴宝贵辛友强 《现代图书情报技术》2008,24(3):45-50
针对大规模信息采集,运用Bloom Filter及其改进算法,在误差允许的条件下,通过URL散列运算可以有效地对同源网页进行去重。实践证明,通过对其参数进行合理的调整,可以达到满意的结果。 相似文献
11.
从文献计量的角度,分析科技查新的研究现状。通过获取核心期刊为来源的相关文献作为样本,对其年
代、机构、作者、关键词分别进行计量与共现分析。研究结果发现:相关研究论文数量有所回落;合作发表的论文较
少且相对封闭;研究主题主要集中在查新报告质量、查新机构现状、创新服务模式等。最后针对存在的问题提出相应
的对策和建议。 相似文献
12.
13.
14.
15.
科技查新的学术原理探讨 总被引:3,自引:1,他引:2
检索策略是科技查新的科学依据,检索方法是科技查新的技术保障,情报分析研究是科技查新的学术体现。这是科技查新的学术原理和核心问题,应予以重视。 相似文献
16.
17.
当前查新工作质量影响因素探析 总被引:12,自引:0,他引:12
文章从查新体制、查新人员、查新范围和手段等方面出发,探讨了目前查新工作中存在的问题和不足以及其对查新工作带来的不利影响,并就此提出相关解决方法. 相似文献
18.
论文对教育部查新站L08 2005-2010年间受理的国内外查新674件查新委托书的查新来源、查新目的、查新项目隶属学科和领域进行了统计分析,得出我国绝大多数查新站的国内外查新都是一个薄弱环节,尤其是社科类查新少之又少的结论.说明国内外查新尤其是社科查新应给予加强,要建立完善的国内外查新体系,以保证查新的查全和查准率. 相似文献