老饼讲解:一步一步上手学习
encode.woe.get_woe_dict用于计算单个或多个变量的woe编码,返回woe映射表。
完整调用格式如下:
woe_dict = encode.woe.get_woe_dict(x,y)x:进行计算woe的变量数据,这里的x必须是枚举值(例如分箱后的数据)。
数据类型:pandas.DataFrame
y:样本标签。
数据类型:pandas.core.series
woe_dict:各个变量的woe映射字典。
备注:本函数返回的是woe字典格式,这是因为dict数据类型更方便使用与计算,但对于查看、写报告,dict就不太方便,此时可用encode.woe.woe_dict_to_tb来将它转换为表格格式。
get_woe_dict使用示例如下:
import bbbrisk as br
# 加载数据
data = br.datasets.load_bloan_grp() # 加载数据
x = data.iloc[:,:-1] # 变量数据
y = data['is_bad'] # 标签数据
# 等样本分箱
woe_dict = br.encode.woe.get_woe_dict(x,y) # 计算各个变量的woe
woe_tb = br.encode.woe.woe_dict_to_tb(woe_dict) # 转换为表格形式
print('\nwoe_dict:\n',woe_dict) # 显示woe字典
print('\nwoe_tb:\n',woe_tb) # 显示woe字典表格
运行结果如下:

好了,以上就是encode.woe.get_woe_dict函数的使用方法了~
评论