首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
论文设计实现中文搜索网页分类系统,包括:关键字搜索结果网页类型判断方法,网页主题内容提取.对于不容易分类的网页,采用基于摘要的网页搜索结果聚类和基于学习的网页搜索结果分类器设计方法.最后,构造中文文本分类器,并编程实现,通过实例测试分类器性能.  相似文献   

2.
为了提高用户对网站使用的效率,提高网站本体模型的搜索性能,研究一种高效的网页语义概念树构建方法,进行搜索覆盖度层状拓展。传统方法中,使用搜索引擎的词语相似度算法进行搜索拓展,利用规则、聚类等技术对形式背景进行约简,无法有效简历概念间的上下位关系,性能不好。提出一种基于语义主题树特征匹配的搜索覆盖度层状拓展方法,进行Web语义模型和主题树构建,构建特征空间互信息区域文档词频向量模型,对数据库中记录的属性字段进行归类抽象,形成概念汇聚点,实现语义主题树构建搜索覆盖度拓展设计,构建语义主题树特征匹配算法,优化搜索引擎对文本特征的搜索敏感度,提高搜索覆盖度,实现文本搜索覆盖度层状拓展。实验分析得出,该方法具有较好的文本特征分类结果,语义层次结构清晰,可以有效提高文本数据召回率和查准率,展示了较好的应用价值。  相似文献   

3.
周莹 《科教文汇》2007,(5S):198-199
论文设计实现中文搜索网页分类系统,包括:关键字搜索结果网页类型判断方法,网页主题内容提取。对于不容易分类的网页,采用基于摘要的网页搜索结果聚类和基于学习的网页搜索结果分类器设计方法。最后,构造中文文本分类器,并编程实现,通过实例测试分类器性能。  相似文献   

4.
垂直搜索引擎系统的设计与实现   总被引:1,自引:0,他引:1  
面对日益专业和个性化的信息检索需求,通用搜索引擎存在的问题暴露无遗。垂直搜索技术作为搜索引擎发展的一个主要方向,正在受到越来越多的关注。在给出一个垂直搜索引擎总体结构的基础上,详细分析了所涉及的关键技术:网页抓取、中文分词、文本分类等。并将分词和分类算法加入到Nutch中,实现了系统原型。实验证明,该系统主题相关度达到94%以上。  相似文献   

5.
本文分析了正方法,查询修正中的用户信息行为,吸收网页抓取、检索与浏览并重的思想,综合考虑用户Web搜索过程中的行为特点、查询修正所用词汇的可用来源,给出一个新的面向Web搜索的查询修正解决方案.  相似文献   

6.
针对传统的基于Web图的垂直搜索策略Authorities and Hubs,提出了一种融合了网页内容评价和Web图的启发式垂直搜索策略,此外,引入向量空间模型进行针对网页内容的主题相关度判断,进一步提高主题网页下载的准确率.实验表明,文中算法有效地提高了主题网页的聚合程度,且随着网页下载数量的增加,垂直搜索引擎的准确率逐渐递增,并在下载网页达到一定数量后,准确率趋于稳定,算法具有较好的鲁棒性,可以应用到相关垂直搜索引擎系统中.  相似文献   

7.
上下文对用户搜索行为的影响   总被引:1,自引:0,他引:1  
何秀  牛之贤  孙静宇 《情报杂志》2012,(10):122-125,130
用户的搜索是在特定搜索上下文中进行的,虽然个性化搜索、社会化搜索可以利用一部分上下文信息,但有时搜索效果因搜索引擎未有效利用其他上下文信息而让人无法接受.论文采用发放问卷调查的方式,探索上下文信息对用户搜索行为的影响.首先针对用户上下文、查询上下文、页面上下文分别设计一定数量的调查题目;其次在新浪等五个网站发放问卷,收集为期一个月的互联网用户反馈结果,得到数据集;最后,分析三类Web上下文信息对用户搜索行为的影响.结果显示:查询上下文影响权重最大、用户上下文次之、页面上下文的影响最小,这一结果可为有效利用上下文信息提供一定的借鉴作用.  相似文献   

8.
解决用户的模糊查询问题一直以来是信息检索领域研究的热点。为了解决不同用户间的查询差异,一种称为个性化搜索的技术得以提出,其通过获取用户的喜好来识别查询意图,但研究发现很少有用户愿意直接或间接提供个人信息。本文提出一种基于用户点击历史信息自动获取用户兴趣进而对搜索结果进行个性化呈现的Web搜索系统架构。基于主题相关PageRank技术,设计了用户兴趣学习算法和个性化搜索页面排序算法。实验表明该算法能有效学习用户的兴趣信息,提高了个性化Web搜索质量。  相似文献   

9.
用户当前正在浏览的网页内容有助于说明用户的即时信息需求.在现有相关研究的基础上提出了一种基于上下文的Web即时信息检索方法,该方法允许用户从正在浏览的网页中选择一段文本作为原始检索条件,由检索系统从其上下文中提取一级扩展词和二级扩展词来形成新的检索条件进行检索,并将检索结果按相似度从大到小的顺序呈现给用户.  相似文献   

10.
邵晓良  刘红 《情报杂志》2004,23(7):14-16
介绍了解放军第二军医大学网络信息中心设计的军事主题信息采集系统的一项核心工作——军事主题信息的识别。主题识别算法从构造专业性较强的军事主题词典着手,充分分析和考虑Web网页文本的特点,从而大大提高了军事主题信息采集的效率和精度,该算法同样适用于其他领域的主题信息识别。  相似文献   

11.
科学与技术是两个不同的概念。“知识经济”的实质是,现代高新技术和人的智力是经济发展的决定因素。而现代技术的基础是科学,科学的基础是哲学,因此我们要想真正把科学和技术搞上去,就必须学习和移植代表理论思维结晶的各种哲学思想,而不能仅仅学习和移植科学和技术。此外,哲学思想也是孕育创造性思维的土壤。  相似文献   

12.
对比中外期刊 找差距 谈对策   总被引:6,自引:2,他引:4  
以国外有代表性的材料科学期刊各9种为研究对象,进行了比较与分析,找出差距,结合国外科技期刊的最新发展动向,提出了发展我国科技期刊的对策。  相似文献   

13.
于敏 《情报杂志》2003,22(7):90-91
在分析图书情报机构与ISP各自竞争优势和劣势的基础上,初步探讨了图书情报机构与ISP相互融合的总体趋势以及在实现融合的过程中,图书情报机构所需要做出的努力。  相似文献   

14.
科学技术是第一生产力,但是,它的作用能否得到充分发挥,却有赖于管理。其管理的范围就是对人财物的管理。管理的好,可能起到较好的作用,管理的不好,则可能造成极大的损失。  相似文献   

15.
16.
17.
信用的起源、发展、形成与应用型态   总被引:1,自引:0,他引:1  
从经济学的角度探讨了信任、信誉、信用三者之间的关系及信用在经济活动中的应用。信任起源于人与人之间的交往,信誉是正向信任的累积效应,信用则是信誉的长期积累并具有商品特性,尤其是具有货币的流通、贮藏、支付等功能。  相似文献   

18.
国家基金委资助西藏高原能量水循环研究项目近日,中科院青藏高原研究所申请的国家自然科学基金重大国际(地区)合作研究项目———“西藏高原能量水循环降雨共同观测研究”获得了国家基金委资助。该项目将在中日双方长期的合作基础上,与中科院寒区旱区环境与工程研究所的相关研究人员一起,通过对青藏高原大气、冰川和冻土进行不同空间和时间尺度的实验及长期监测,经过数值模拟和卫星遥感资料的应用,在3到5年内,争取较为全面了解该地区不同下垫面及不同季节的地气相互作用规律和能量水循环过程。为改善有关GCM模式中青藏高原地区陆面过程参…  相似文献   

19.
胡锦涛指示 :把推动自主创新摆在全部科技工作突出位置新年伊始 ,科技部党组召开了今年部党组中心组第一次学习会议 ,深入学习贯彻胡锦涛总书记最近一个时期关于科技工作的一系列重要指示精神 ,统一思想 ,统一认识 ,明确今后一段时期科技工作的总体思路 ,把胡锦涛总书记的讲话落实到今后的具体科技工作中。科技部党组成员、机关各司局和事业单位的主要负责同志参加了学习。胡锦涛总书记 2 0 0 4年 12月 2 4日分别看望著名科学家朱光亚、杨乐 ,12月 2 7日主持中共中央政治局第十八次集体学习 ,12月 2 9日考察中国科学院知识创新工程试点工作…  相似文献   

20.
本文主要论述了职业教育和培训与创新过程的关系,认为创新需与教育结合,而教育本身也在经理创新的过程,指出了导致后现代科学现代化压力的发展趋势及其对教育和培训体系的挑战.针对这种现状,文章重点考察了德国职业教育和培训体系,分析了德国体系的特点和结构以及近三十年来的主要危机与改革的措施.文章指出每次危机的发生都带动了创新和改革的发展,特别介绍了今年来最重要的改革发展步骤,即所谓的"实地学习概念",文中详细介绍了教学模块创新的基本思想和原则.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号