特征筛选之—IV值

特征筛选之—IV值一 定义 IV InfromationV 信息价值 用来表示特征对目标预测的贡献程度 即特征的预测能力 一般来说 IV 值越高 该特征的预测能力越强 信息贡献程度越高

大家好,欢迎来到IT知识分享网。

一.定义

IV(Infromation Value),信息价值,用来表示特征对目标预测的贡献程度,即特征的预测能力,一般来说,IV值越高,该特征的预测能力越强,信息贡献程度越高。

二.限定条件

IV值的计算有一定的限定条件:

(1)面向的任务必须是有监督的任务;

(2)预测目标必须是二分类的。

三.IV取值区间及常用评价基准

IV值的取值区间为:[0,正无穷)。

IV值取值含义:

(1)IV<0.02:无用特征

(2)0.02<IV<0.1:弱价值特征

(3)0.1<IV<0.3:中价值特征

(4)0.3<IV<0.5:强价值特征

(5)IV>0.5:价值过高,不真实

四.计算方式

由于IV值的计算是以WOE值为基础的,所以计算IV值之前,首先得计算WOE值。

(1)WOE

  • WOE定义:Weight Of Evidence,证据权重,表示描述一个可预测的变量与二分类变量之间的关系。
  • 使用:在使用WOE之前,需要对变量进行分箱处理,分箱的操作包括:对于连续型变量可以采用:等距分箱,等频分箱,自定义间隔;对于离散型变量,如分箱太多&

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/118792.html

(0)
上一篇 2025-11-10 13:45
下一篇 2025-11-10 14:10

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信