首页
|
本学科首页
官方微博
|
高级检索
全部专业
教育
科学、科学研究
世界各国文化与文化事业
体育
文化理论
信息与知识传播
学报及综合类
按
中文标题
英文标题
中文关键词
英文关键词
中文摘要
英文摘要
作者中文名
作者英文名
单位中文名
单位英文名
基金中文名
基金英文名
杂志中文名
杂志英文名
栏目英文名
栏目英文名
DOI
责任编辑
分类号
杂志ISSN号
检索
垂直搜索引擎爬虫系统DIPRE算法及改进
引用本文:
赵君.垂直搜索引擎爬虫系统DIPRE算法及改进[J].教育技术导刊,2016,15(8):30-32.
作者姓名:
赵君
作者单位:
武汉设计工程学院 信息工程学院,湖北 武汉 430205
摘 要:
针对垂直搜索引擎中精确抽取网页中特定字段的问题,对DIPRE算法进行了研究和改进。阐述了DIPRE算法在垂直搜索引擎中的重要作用,探讨了DIPRE算法在抽取复杂结构网页时的不足,并提出了改进,包括种子定位方式,将单模匹配扩展成多模匹配并引入定位索引,再根据已有技术对改进后的算法进行了实验验证。结果表明,改进后的算法在精度和效率上都符合预期。
关 键 词:
垂直搜索引擎
DIPRE算法
种子定位
单模匹配
多模匹配
定位索引
点击此处可从《教育技术导刊》浏览原始摘要信息
点击此处可从《教育技术导刊》下载
免费
的PDF全文
设为首页
|
免责声明
|
关于勤云
|
加入收藏
Copyright
©
北京勤云科技发展有限公司
京ICP备09084417号