基于随机森林的偷漏税行为自动识别 |
| |
引用本文: | 吴超,罗璟.基于随机森林的偷漏税行为自动识别[J].教育技术导刊,2018,17(8):13-16. |
| |
作者姓名: | 吴超 罗璟 |
| |
作者单位: | 昆明理工大学 机电工程学院,云南 昆明 650050 |
| |
摘 要: | 企业偷漏税手段呈多样化、专业化、普遍化、隐蔽化趋势。为更好地识别企业是否存在偷漏税行为,基于Python语言,在Anaconda集成开发环境下通过机器学习的Scikit-Learn包构建随机森林模型,通过交叉验证算法选择最优模型。对汽车销售行业纳税人是否存在偷漏税行为进行自动识别。结果表明,基于随机森林模型的偷漏税行为自动识别相对于其它常见的分类模型(k-近邻算法、逻辑回归模型、决策树模型和Adaboost算法),具有较高的准确率,分类性能更好,可以满足偷漏税行为的自动识别需求。
|
关 键 词: | 随机森林 机器学习 偷漏税行为 分类算法 |
|
| 点击此处可从《教育技术导刊》浏览原始摘要信息 |
| 点击此处可从《教育技术导刊》下载免费的PDF全文 |
|