pythonsklearn乳腺癌数据集(Python中SKlearn是什么)
说明
1 、是基于 Python 语言的机器学习工具包 。
Sklearn主要用Python编写 ,建立在 Numpy 、Scipy 、Pandas和Matplotlib 的基础上 ,也用 Cython编写了一些核心算法来提高性能 。
2 、有六大功能模块 ,分别是分类 、回归 、聚类 、数据降维 、模型选择和数据处理 。
分类(Classification):识别样本属于哪个类别 ,常用算法有 SVM(支持向量机) 、nearest neighbors(最近邻) 、random forest(随机森林)
回归(Regression):预测与对象相关联的连续值属性 ,常用算法有 SVR(支持向量机) 、 ridge regression(岭回归) 、Lasso
聚类(Clustering):对样本进行无监督的自动分类 ,常用算法有 k-Means(k均值)、spectral clustering(特征聚类) 、mean-shift(均值漂移)
数据降维(Dimensionality reduction):减少相关变量维数 ,常用算法有 PCA(主成分分析) 、feature selection(特征选择)、non-negative matrix factorization(非负矩阵分解)
模型选择(Model Selection):比较 ,验证 ,选择参数和模型 ,常用模块有 grid search(网格搜索) 、cross validation(交叉验证) 、 metrics(度量)
数据处理(Preprocessing):特征提取和归一化 ,常用模块有 preprocessing(预处理) ,feature extraction(特征提取)
这六个功能模块涉及 4类算法,分类 、回归 属于监督学习 ,聚类属于非监督学习 。
以上就是Python中SKlearn的介绍 ,希望对大家有所帮助 。更多Python学习指路:Python基础教程
创心域SEO版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!