一种基于隐马尔可夫聚类的信息提取方法 |
| |
引用本文: | 金砚硕,迟呈英,战学刚.一种基于隐马尔可夫聚类的信息提取方法[J].情报杂志,2008,27(3):96-98. |
| |
作者姓名: | 金砚硕 迟呈英 战学刚 |
| |
作者单位: | 辽宁科技大学,鞍山,114051 |
| |
摘 要: | 为了通过统计的学习来得到最优的模型参数,我们通过基于形式的聚类方法将训练数据聚成几个类,每个类的数据被用来训练一个初始概率和一个转移概率矩阵.在进行文本信息提取时,结合每一个初始概率矩阵、每一个转移概率矩阵,使用Viterbi算法来找出最优的标记序列.结果这些最优的标记序列中概率最大的标记序列将被作为最终输出.实验表明,新的算法在一定条件下能提高文本信息提取的精确度和召回率.
|
关 键 词: | 聚类 信息提取 隐马尔可夫模型 |
A Method for Text Information Extraction Based on Hidden Markov Model Clustering |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|