您当前的位置: 首页 >  算法

川川菜鸟

暂无认证

  • 4浏览

    0关注

    969博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

机器学习(十五):异常检测之隔离森林算法(IsolationForest)

川川菜鸟 发布时间:2022-08-03 21:07:03 ,浏览量:4

异常值值会影响回归模型和分类模型的准确性,因此检测和删除它们是机器学习过程中的重要一步。在较大的数据集上,检测和去除异常值要困难得多,因此数据科学家经常应用自动异常检测算法(例如隔离森林)来帮助识别和去除异常值。

顾名思义,隔离森林是一种基于树的异常检测算法。它使用无监督学习方法来检测异常数据点,然后可以将其从训练数据中删除。在移除异常值的数据集上重新训练模型通常会提高性能。

隔离森林(Isolation Forest) 又名孤立森林,是一种从异常点出发,通过指定规则进行划分,根据划分次数进行判断的异常检测方法。由周志华教授等人提出。该算法对较大数据集的异常值处理有着很大效果,同样适合小数据集。

文章目录
    • 一、隔离森林
      • 1.1 介绍
      • 1.2 特点
      • 1.3 什么是异常检测
      • 1.4 什么是隔离森林
    • 二、模块导入
    • 三、导入数据
    • 四、数据处理
    • 五、训练集和测试集拆分
    • 六、数据缩放
    • 七、搭建模型
    • 八、训练并预测
    • 九、调整最优隔离森林模型
    • 十、运行调整后的隔离森林模型
    • <
关注
打赏
1665165634
查看更多评论
立即登录/注册

微信扫码登录

0.0396s