熵权法python(python实现信息熵的计算代码)
导读:1、什么是信息熵?...
1、什么是信息熵?
1948年香农提出了信息熵(Entropy)的概念。
信息理论:
1、从信息的完整性上进行的描述:
当系统的有序状态一致时,数据越集中的地方熵值越小,数据越分散的地方熵值越大。
2、从信息的有序性上进行的描述:
当数据量一致时,系统越有序,熵值越低;系统越混乱或者分散,熵值越高。
“信息熵” (information entropy)是度量样本集合纯度最常用的一种指标。
二、python实现信息熵的计算代码
1、导入库
importnumpyasnp importpandasaspd2、 准备数据
data=pd.DataFrame( {学历:[专科,专科,专科,专科,专科,本科,本科,本科,本科,本科, 研究生,研究生,研究生,研究生,研究生], 婚否:[否,否,是,是,否,否,否,是,否,否,否,否,是,是,否], 是否有车:[否,否,否,是,否,否,否,是,是,是,是,是,否,否, 否], 收入水平:[中,高,高,中,中,中,高,高,很高,很高,很高,高,高, 很高,中], 类别:[否,否,是,是,否,否,否,是,是,是,是,是,是,是,否]})3、定义信息熵函数
#定义计算信息熵的函数:计算Infor(D) definfor(data): a=pd.value_counts(data)/len(data) returnsum(np.log2(a)*a*(-1)) #print(infor(data["学历"]))#测试结果为:1.584962500721156创心域SEO版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!