一种基于语义的Web挖掘方法研究 |
| |
引用本文: | 李伟,赵庆展,邓红涛.一种基于语义的Web挖掘方法研究[J].人天科学研究,2014(1):54-55. |
| |
作者姓名: | 李伟 赵庆展 邓红涛 |
| |
作者单位: | 石河子大学信息科学与技术学院,新疆石河子832003 |
| |
基金项目: | 国家科技支撑计划项目(2012BAH27803);石河子大学自然科学与技术创新联合资助一般项目(zRKXYB-LH23) |
| |
摘 要: | 在已有的基于Dom—Tree的网页信息提取算法基础上,通过对Html标签进行分类,逐个分析各Html标签所包含的结构信息,设计了一种自底向上的网页分块方法,并在此基础上,实现了文本相似度比较的网页主题内容信息块识别算法,提高了主题内容信息块的识别精确度。
|
关 键 词: | 语义Web Web挖掘 网页分块 |
本文献已被 维普 等数据库收录! |
|