首页
|
本学科首页
官方微博
|
高级检索
全部专业
教育
科学、科学研究
世界各国文化与文化事业
体育
文化理论
信息与知识传播
学报及综合类
按
中文标题
英文标题
中文关键词
英文关键词
中文摘要
英文摘要
作者中文名
作者英文名
单位中文名
单位英文名
基金中文名
基金英文名
杂志中文名
杂志英文名
栏目英文名
栏目英文名
DOI
责任编辑
分类号
杂志ISSN号
检索
基于启发式规则的多记录页面分隔符识别方法
引用本文:
胡大洋.基于启发式规则的多记录页面分隔符识别方法[J].教育技术导刊,2009,8(9):50-51.
作者姓名:
胡大洋
作者单位:
盐城工学院计算机应用中心;
摘 要:
从半结构化或者非结构化的Web文档中提取信息时通常要求指定记录集的边界符,如果不根据记录边界符将包含多记录的页面分成单个记录块,那么记录的提取就不能成功。介绍了一种根据启发式的规则发现Web文档中的记录分隔符的方法,能够很好地解决多记录页面记录分割的问题。
关 键 词:
信息提取
半结构化信息
非结构化信息
记录边界
记录分隔符
本文献已被
CNKI
维普
等数据库收录!
点击此处可从《教育技术导刊》浏览原始摘要信息
点击此处可从《教育技术导刊》下载
免费
的PDF全文
设为首页
|
免责声明
|
关于勤云
|
加入收藏
Copyright
©
北京勤云科技发展有限公司
京ICP备09084417号