新闻正文信息在线提取方法研究 |
| |
引用本文: | 王年丰,费潇潇.新闻正文信息在线提取方法研究[J].教育技术导刊,2017,16(4):9-13. |
| |
作者姓名: | 王年丰 费潇潇 |
| |
作者单位: | 华中师范大学 物理科学与技术学院,湖北 武汉 430079 |
| |
摘 要: | 新闻正文信息提取对信息检索、存储和舆情监测等具有极其重要的意义。为实现新闻信息的正确提取,考虑到DOM等几种技术的优势,结合DOM技术、动态型网页信息抽取技术和行块分布算法等技术优点,重点研究了新闻信息的提取方法,尤其针对动态网页的信息提取,设计了一套有效的新闻正文信息提取方法。实验结果表明,该方法能有效实现新闻的正文信息抽取,准确率高,具有一定推广价值。
|
关 键 词: | 信息抽取 DOM技术 动态型网页 行块分布算法 |
|
| 点击此处可从《教育技术导刊》浏览原始摘要信息 |
| 点击此处可从《教育技术导刊》下载免费的PDF全文 |
|