心脏病监测分析
数据来源:kaggle
数据获取方式:
关注公众号:YOLO的学习进阶日常
回复:心脏病
为什么想做这个分析案例?
心脏病已经成为人类健康的三大杀手之一,为找到心脏病的病因,特此参考了一些公众号推文和知乎,kaggle这些平台的文章来做一个关于心脏病的分析。本文只涉及数据分析,数据处理和可视化,没有机器学习和深度学习,适合初学者的案例练手,大佬就不用过多参考这篇推文了。
import pandas as pd
import warnings
import seaborn as sns
sns.axes_style("dark")
warnings.filterwarnings('ignore')
data=pd.read_csv("heart.csv",engine='python',sep=',')
data.head(2)
| age | sex | cp | trestbps | chol | fbs | restecg | thalach |
exang | oldpeak | slope | ca | thal | target |
---|---|---|---|---|---|
0 | 63 | 1 | 3 | 145 | 233 |
0 | 1 | 1 | |||
1 | 37 | 1 | 2 | 130 | 250 |
0 | 2 | 1 |
列名解释:
age:年龄
sex:性别(1=男,0=女)
cp:疼痛类型(0=典型心绞痛;1=非典型心绞痛;2=非心绞痛;3=没有症状)
trestbps:静息血压(解释:静息心率指在清醒、不活动的安静状态下,每分钟心跳的次数。
静息血压就是在此状态下的测量血压)
chol:胆固醇
fbs: 人的空腹血糖(> 120 mg/dl=1; 0=假)解释:空腹血糖(饭前/餐前血糖): 80 - 130mg/dL. 餐后2小时血糖: 80
- 160mg/dL.
restecg:心电图(0=正常,1=患有ST-T波异常,2=根据Estes的标准显示可能或确定的左心室肥大,严重的情况)
thalach:最大的心率
exang:运动引起的心绞痛(1=是;0=不是)
oldpeak:相对于休息来说运动引起的ST段抑制 解释:(http://heart.dxy.cn/article/143557)
slope:运动高峰的心电图(1=上坡,2=平坦,3=下坡)
ca: 萤光显色的主要血管数目(0-4)荧光显色主要是跟糖尿病有一些关系
thal: 一种称为地中海贫血的血液疾病(3=正常; 6=固定缺陷; 7=可逆缺陷)
target: 心脏病(0=否,1=是)
医学知识科普时间:
地中海贫血:https://zh.wikipedia.org/wiki/%E5%9C%B0%E4%B8%AD%E6%B5%B7%E8%B2%A7%E8%A1%80
地中海贫血(Thalas