目录
老饼讲解:一步一步上手学习

【说明】函数说明-bins.merge.eDist

作者 : 老饼 发表日期 : 2026-03-21 01:17:42 更新日期 : 2026-05-13 00:50:20
老饼讲解-简单易懂,干货满满,爽过嗦螺!


API说明:bins.merge.eDist- 等距分箱

一、函数说明

bins.merge.eDist用于将样本进行等距分箱,返回分箱的结果。

完整调用格式如下:

 bin_set = bins.merge.eDist(x,bin_num=10)
  • 入参说明

x:需要进行分箱的变量

        数据类型:单列pandas.core.series或numpy.array

bin_num:目标分箱个数

        数据类型:正整数或列表

bin_num = 10时,代表将整体等距分为10个箱。
bin_num = [('-',1,5),(1,10,1),(10,'+',1)]时,代表<=1分为5箱,(1,10]分为1箱,>10分为1箱
  • 出参说明

bin_set:等距分箱的结果。

二、函数示例

eDist使用示例如下

  • 示例一:将整体进行等距分箱 
import bbbrisk as br					
           
# 加载数据                    
data = br.datasets.load_bloan()                               # 加载数据
x,y  = data['rev'],data['is_bad']                             # 变量与标签		

# 等距分箱				           
bin_set  = br.bins.merge.eDist(x,bin_num=10)                  # 将变量进行等距分箱
bin_stat = br.bins.Bins(bin_set).binStat(x,y)                 # 统计分箱结果

# 显示结果
br.display.pd.set(width=300,max_colwidth=30,max_rows=30)      # 美化pandas的显示方式
print('\n分箱结果:\nbin_set = ',bin_set)                      # 显示分箱结果
print('\n样本在分箱的分布:\n',bin_stat)                       # 显示样本分布

运行结果如下:

bins.merge.eDist等距分箱的效果

  • 示例二:将整体进行分段等距分箱
import bbbrisk as br					
           
# 加载数据                    
data = br.datasets.load_bloan()                                         # 加载数据
x,y      = data['rev'],data['is_bad']                                   # 变量与分箱		

# 等距分箱				           
bin_set  = br.bins.merge.eDist(x,[('-',1,5),(1,1000,1),(1000,'+',1)])   # 将变量进行等距分箱
bin_stat = br.bins.Bins(bin_set).binStat(x,y)                           # 统计分箱结果

# 显示结果
br.display.pd.set(width=300,max_colwidth=30,max_rows=30)                # 美化pandas的显示方式
print('\n分箱结果:\nbin_set = ',bin_set)                                # 显示分箱结果
print('\n样本在分箱的分布:\n',bin_stat)                                 # 显示样本分布

运行结果如下:

bins.merge.eDist分段等距分箱的效果


好了,以上就是bins.merge.eDist函数的使用方法了~



图标 评论
添加评论