Python绘制KS曲线的实现方法_pythonks曲线,python画ks曲线资源-CSDN下载

1星 35 浏览量 2020-09-20 04:28:42 上传评论收藏 108KB PDF 举报

在介绍Python绘制KS曲线的实现方法之前，我们先来解释一下什么是KS曲线。KS曲线，全称为Kolmogorov-Smirnov曲线，是一种在信用评分模型评估中常用的统计工具。KS曲线能够提供信用评分模型区分好坏客户的能力，即模型的辨别力。在KS曲线中，横轴通常代表累计坏客户的比例，纵轴代表累计好客户的比例，通过对比两个累积率的差值（即KS值）来判断模型的好坏。KS值越大，表示模型的区分能力越强。现在，我们来看看如何利用Python绘制KS曲线。需要一个实现KS曲线的基础函数，代码如下： ```python def PlotKS(preds, labels, n, asc): # preds 是预测值，labels 是真实标签，1 表示坏客户，0 表示好客户 # n 是分位数的数量 # asc 表示是升序还是降序，1 为升序，0 为降序 # 将标签转为二进制：1为坏客户，0为好客户 bad = labels ksds = DataFrame({'bad': bad, 'pred': preds}) ksds['good'] = 1 - ksds.bad # 根据asc参数对数据进行排序 if asc == 1: ksds1 = ksds.sort_values(by=['pred', 'bad'], ascending=[True, True]) elif asc == 0: ksds1 = ksds.sort_values(by=['pred', 'bad'], ascending=[False, True]) ksds1.index = range(len(ksds1.pred)) ksds1['cumsum_good1'] = 1.0 * ksds1.good.cumsum() / sum(ksds1.good) ksds1['cumsum_bad1'] = 1.0 * ksds1.bad.cumsum() / sum(ksds1.bad) if asc == 1: ksds2 = ksds.sort_values(by=['pred', 'bad'], ascending=[True, False]) elif asc == 0: ksds2 = ksds.sort_values(by=['pred', 'bad'], ascending=[False, False]) ksds2.index = range(len(ksds2.pred)) ksds2['cumsum_good2'] = 1.0 * ksds2.good.cumsum() / sum(ksds2.good) ksds2['cumsum_bad2'] = 1.0 * ksds2.bad.cumsum() / sum(ksds2.bad) # 计算累积率并进行平均 ksds = ksds1[['cumsum_good1', 'cumsum_bad1']] ksds['cumsum_good2'] = ksds2['cumsum_good2'] ksds['cumsum_bad2'] = ksds2['cumsum_bad2'] ksds['cumsum_good'] = (ksds['cumsum_good1'] + ksds['cumsum_good2']) / 2 ksds['cumsum_bad'] = (ksds['cumsum_bad1'] + ksds['cumsum_bad2']) / 2 ksds['ks'] = ksds['cumsum_bad'] - ksds['cumsum_good'] ksds['tile0'] = range(1, len(ksds.ks) + 1) ksds['tile'] = 1.0 * ksds['tile0'] / len(ksds['tile0']) qe = list(np.arange(0, 1, 1.0 / n)) qe.append(1) qe = qe[1:] ks_index = Series(ksds.index) ks_index = ks_index.quantile(q=qe) ks_index = np.ceil(ks_index).astype(int) ks_index = list(ks_index) ksds = ksds.loc[ks_index] ksds = ksds[['tile', 'cumsum_good', 'cumsum_bad', 'ks']] ksds0 = np.array([[0, 0, 0, 0]]) ksds = np.concatenate([ksds0, ksds], axis=0) ksds = DataFrame(ksds, columns=['tile', 'cumsum_good', 'cumsum_bad', 'ks']) ks_value = ksds.ks.max() ks_pop = ksds.tile[ksds.ks.idxmax()] print('ks_value is ' + str(np.round(ks_value, 4)) + ' at pop = ' + str(np.round(ks_pop, 4))) # 绘制KS曲线 plt.plot(ksds.tile, ksds.cumsum_good, label='cum_good', color='blue', linestyle='solid') plt.plot(ksds.tile, ksds.cumsum_bad, label='cum_bad', color='red', linestyle='solid') plt.xlabel('Population') plt.ylabel('Cumulative Good/Bad Rate') plt.title('KS Curve') plt.legend(loc='upper right') plt.show() ``` 在这个函数中，我们首先导入了必要的库，并定义了函数`PlotKS`，它接受四个参数：`preds`代表预测分数，`labels`代表实际好坏标签，`n`代表需要计算的分位数个数，`asc`代表排序方式。函数体内部首先创建了一个数据框`DataFrame`，将好客户和坏客户的标签分别转换为1和0，并进行排序。接着，函数计算了坏客户和好客户的累积比率，并通过`plt.plot`函数绘制了KS曲线。在绘制过程中，分别绘制了好坏客户的累积曲线，并为它们设置了不同的颜色和线型，以便区分。通过设置`plt.xlabel`和`plt.ylabel`设置了坐标轴的名称，`plt.title`设置了图表的标题，并且通过`plt.legend`设置了图例的位置。函数输出了KS值以及在人口百分比中达到最大值的位置，并调用`plt.show()`显示了最终的KS曲线图。以上就是使用Python绘制KS曲线的完整过程，通常这个过程是在模型评估阶段进行的。在数据分析和模型评估过程中，KS曲线是一个非常重要的工具，因为它能够直观地显示出模型的区分能力，是检验模型效果的重要指标之一。通过观察KS曲线，可以确定模型对于不同风险等级客户群体的区分效果，进而对模型进行调优。

资源推荐

资源详情

资源评论

Python绘制绘制KS曲线的实现方法曲线的实现方法

本篇文章主要介绍了Python绘制KS曲线的实现方法，小编觉得挺不错的，现在分享给大家，也给大家做个参

考。一起跟随小编过来看看吧

python实现KS曲线，相关使用方法请参考上篇博客-R语言实现KS曲线

代码如下：

####################### PlotKS ##########################

def PlotKS(preds, labels, n, asc):

# preds is score: asc=1

# preds is prob: asc=0

pred = preds # 预测值

bad = labels # 取1为bad, 0为good

ksds = DataFrame({'bad': bad, 'pred': pred})

ksds['good'] = 1 - ksds.bad

if asc == 1:

ksds1 = ksds.sort_values(by=['pred', 'bad'], ascending=[True, True])

elif asc == 0:

ksds1 = ksds.sort_values(by=['pred', 'bad'], ascending=[False, True])

ksds1.index = range(len(ksds1.pred))

ksds1['cumsum_good1'] = 1.0*ksds1.good.cumsum()/sum(ksds1.good)

ksds1['cumsum_bad1'] = 1.0*ksds1.bad.cumsum()/sum(ksds1.bad)

if asc == 1:

ksds2 = ksds.sort_values(by=['pred', 'bad'], ascending=[True, False])

elif asc == 0:

ksds2 = ksds.sort_values(by=['pred', 'bad'], ascending=[False, False])

ksds2.index = range(len(ksds2.pred))

ksds2['cumsum_good2'] = 1.0*ksds2.good.cumsum()/sum(ksds2.good)

ksds2['cumsum_bad2'] = 1.0*ksds2.bad.cumsum()/sum(ksds2.bad)

# ksds1 ksds2 -> average

ksds = ksds1[['cumsum_good1', 'cumsum_bad1']]

ksds['cumsum_good2'] = ksds2['cumsum_good2']

ksds['cumsum_bad2'] = ksds2['cumsum_bad2']

ksds['cumsum_good'] = (ksds['cumsum_good1'] + ksds['cumsum_good2'])/2

ksds['cumsum_bad'] = (ksds['cumsum_bad1'] + ksds['cumsum_bad2'])/2

# ks

ksds['ks'] = ksds['cumsum_bad'] - ksds['cumsum_good']

ksds['tile0'] = range(1, len(ksds.ks) + 1)

ksds['tile'] = 1.0*ksds['tile0']/len(ksds['tile0'])

qe = list(np.arange(0, 1, 1.0/n))

qe.append(1)

qe = qe[1:]

ks_index = Series(ksds.index)

ks_index = ks_index.quantile(q = qe)

ks_index = np.ceil(ks_index).astype(int)

ks_index = list(ks_index)

ksds = ksds.loc[ks_index]

ksds = ksds[['tile', 'cumsum_good', 'cumsum_bad', 'ks']]

ksds0 = np.array([[0, 0, 0, 0]])

ksds = np.concatenate([ksds0, ksds], axis=0)

ksds = DataFrame(ksds, columns=['tile', 'cumsum_good', 'cumsum_bad', 'ks'])

ks_value = ksds.ks.max()

ks_pop = ksds.tile[ksds.ks.idxmax()]

print ('ks_value is ' + str(np.round(ks_value, 4)) + ' at pop = ' + str(np.round(ks_pop, 4)))

# chart

plt.plot(ksds.tile, ksds.cumsum_good, label='cum_good',

color='blue', linestyle='-', linewidth=2)

plt.plot(ksds.tile, ksds.cumsum_bad, label='cum_bad',

color='red', linestyle='-', linewidth=2)

plt.plot(ksds.tile, ksds.ks, label='ks',

color='green', linestyle='-', linewidth=2)

plt.axvline(ks_pop, color='gray', linestyle='--')

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余1页未读，立即下载

评论收藏

内容反馈

qq_48398222

2020-12-24

没用，浪费积分

weixin_38641339

粉丝: 12

Python绘制KS曲线的实现方法

Python使用matplotlib绘制动态正弦曲线图 保存为gif动图

python绘制贝塞尔曲线

利用python绘制数据曲线图的实现

python实现从串口读取数据并绘制动态曲线，同时保存数据，曲线绘制可实现暂停

利用Python计算KS的实例详解

利用Python画ROC曲线和AUC值计算

R语言KS曲线函数

使用python动态生成波形曲线的实现

【纠错】从零开始学Python数据分析与挖掘.docx

python 判断一组数据是否符合正态分布

normal-distribution:从随机掷骰子中绘制数据，识别数据中的钟形曲线图案，绘制其他类型的数据，并识别类似的钟形曲线图案

Python分类模型评估.pdf

Python超越函数积分运算以及绘图实现代码

python绘制爱心曲线

python 绘制拟合曲线并加指定点标识的实现

python实现同时绘制两条曲线，可暂停可放大，同时保存数据到文件可

Python环境下利用matplotlib绘制发动机万有特性曲线.zip

使用python绘制3维正态分布图的方法

基于python进行抽样分布描述及实践详解

Python基于Logistic回归建模计算某银行在降低贷款拖欠率的数据示例

python大作业 含爬虫、数据可视化、地图、报告、及源码（2016-2021全国各地区粮食产量）.rar

《点燃我温暖你》中李峋的同款爱心代码

Python金融量化的高级库：TA-Lib-0.4.24（包含python3.7、3.8、3.9、3.10的32位和64位版本）

DeepSeek+wxauto+Python 实现最简单的微信自动回复机器人（极简实现）

Python学习笔记(干货) 中文PDF完整版.pdf

大模型微调自我认知数据集

Python教程2020版 完全入门 达到Python工程师水平 笔记+代码+课件+资料

抢购haiwei.rar

conda 创建环境及运用

编程语言设计的核心概念与实践

最新资源

Python使用matplotlib绘制动态正弦曲线图保存为gif动图

python大作业含爬虫、数据可视化、地图、报告、及源码（2016-2021全国各地区粮食产量）.rar

Python教程2020版完全入门达到Python工程师水平笔记+代码+课件+资料