python中特殊字符(python特征生成中字符类型有哪些?)
导读:python特征生成中字符类型有...
python特征生成中字符类型有截取 、字符长度和频次 。
一 、python特征生成中字符类型
1 、截取
当字符类型的值过多 ,通常可对字符类型变量做截取 ,以减少模型过拟合 。如具体的家庭住址 ,可以截取字符串到城市级的粒度 。
2 、字符长度
统计字符串长度 。如转账场景中 ,转账留言的字数某些程度可以刻画这笔转账的类型 。
3 、频次
二 、python特征类型中字符使用
1 、截取第一位字符串
df[I1_0]=df[I1].map(lambdax:str(x)[:1])2 、字符长度
df[I1_len]=df[I1].apply(lambdax:len(str(x))) display(df.head()) df[I1].value_counts()创心域SEO版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!