目录
老饼讲解:一步一步上手学习

【说明】函数说明-bins.batch.bin_stats

作者 : 老饼 发表日期 : 2026-03-21 01:05:57 更新日期 : 2026-05-13 00:50:00
老饼讲解-简单易懂,干货满满,爽过嗦螺!


API说明:bins.batch.bin_stats- 分箱的分布统计

一、函数说明

bins.batch.autoBins用于将变量进行自动分箱。

完整调用格式如下:

 bin_stats = bins.batch.bin_stats(x,y,bin_sets)
  • 入参说明

x:变量数据

        数据类型:pandas.DataFrame

y:样本标签,0为好,1为坏

        数据类型:单列pandas.core.series

bin_sets:各个变量的分箱配置

        数据类型:dict

  • 出参说明

bin_stats:数据在各个变量分箱中的分布

        数据类型:dict

二、函数示例

bin_stats使用示例如下:

import  bbbrisk  as br

# 加载数据                                                                     
data = br.datasets.load_bloan()                                      # 加载数据
x,y  = data[['rev','age']],data['is_bad']                            # 变量与标签

# 变量的分箱
bin_sets = {
    'rev'     :[['-',0.1],[0.1,1.2],[1.2,2],[2,'+']]
    ,'age'    :[[80,'+'],[60,80],[45,60],['-',45]]
    }
bin_stats = br.bins.batch.bin_stats(x,y,bin_sets)                    # 统计各个变量的分箱情况
for var in bin_stats:                                                # 逐个变量打印分箱结果
    print('\n变量'+var+'的分箱结果:\n',bin_stats[var])               # 打印当前变量的分箱统计结果

代码运行结果如下:

bins.batch.autoBins的代码示例


好了,以上就是bins.bin_stats函数的使用方法了~




图标 评论
添加评论