二元logistic回归多分类变量结果解读（【机器学习】Logistic 分类回归算法（二元分类 & 多元分类））

时间2025-09-19 07:06:28分类IT科技浏览5488

导读：🤵‍♂️ 个人主页: @计算机魔术师 👨‍💻 作者简介：CSDN内容合伙人，全栈领域优质创作者。...

🤵‍♂️ 个人主页: @计算机魔术师

👨‍💻 作者简介：CSDN内容合伙人，全栈领域优质创作者。

该文章收录专栏 ✨— 机器学习 —✨

一、线性回归能用于分类吗？

logistic

logistic（数理逻辑）回归算法(预测离散值

y 的非常常用的学习算法

假设有如下的八个点(

或

)

y=1 或 0)

y=1或0),我们需要建立一个模型得到准确的判断，那么应该如何实现呢我们尝试使用之前文章所学的线性回归

(

)

∗

h_\theta(x) = \theta^T*x

hθ(x)=θT∗x 来拟合数据(

\theta

θ是参数列向量，注意这里的

x是关于

x_i

xi的向量,其中

即

∗

常数项

x_0=1, 即 x_0*\theta_0 = 常数项

x0=1,即x0∗θ0=常数项），并在0~1设置一个阈值

0.5

所对应的

0.5

值

y = 0.5 所对应的 x_{0.5} 值

y=0.5所对应的x0.5值，

x 大于

0.5

x_{0.5}

x0.5 的点则为1 ，否则为0 ，预测会得到如下粉丝直线 ，

上一篇文章：【机器学习】浅谈正规方程法&梯度下降

假设我们再增加一个数据点 ，如下图右方，按照如上算法对应的拟合直线

(

)

h_\theta(x)

hθ(x)则如下蓝色直线 ，此时得到错误的预测 (对于结果为1也小于

0.5

x_{0.5}

x0.5

)

所以综上所诉，用线性回归来用于分类问题通常不是一个好主意，并且线性回归的值会远远偏离0或1 ，这显示不太合理。

所以梯度下降算法中引出 logistic regression 算法

二、二元分类

2.1假设函数

我们希望能把

(

)

∗

h_\theta(x) = \theta^T*x

hθ(x)=θT∗x 结果在 0 ~ 1 之间，

这里引入

sigmoid

sigmoid 函数 (也叫做

logistic

logistic 函数) ——

(

)

−

g(x) = \frac{1}{1 + e ^{-x}}

g(x)=1+e−x1

sigmoid

sigmoid函数图像是一个区间在 0 ~ 1的S型函数，

⇒

∞

x \Rightarrow\infty

x⇒∞则

⇒

y\Rightarrow1

y⇒1 ，

⇒

−

∞

x \Rightarrow-\infty

x⇒−∞则

⇒

y\Rightarrow0

y⇒0 令

(

)

(

∗

)

−

∗

h_\theta(x) =g( \theta^T*x) = \frac{1}{1 + e ^{- \theta^T*x}}

hθ(x)=g(θT∗x)=1+e−θT∗x1 那么我们的函数结果结果就会在0 ~ 1 之间

那现在我们所要做的便是需要求得参数

\theta

θ 拟合模型

如下图，假设肿瘤案例，如下

x为一个病人同样的用列向量表示

x的参数，那么参数一tumorSize便是肿瘤的大小，那么我们可以假设输出结果为 0.7 ，意思就是医生会告诉这个病人很不幸，会有很大（70%）的概率得到肿瘤。那么公式可以表示为

(

)

（

∣

;

）

h_\theta(x) = P（y=1|x;\theta）

hθ(x)=P（y=1∣x;θ）即在
x

x
x的条件下求给定
y

y
y (概率参数为
θ

\theta
θ)的概率

那么在

y只有 0 和 1 的情况下，有如下公式（二者为对立事件，符合全概率公式）

（

∣

;

）

（

∣

;

）

P（y=1|x;\theta）+ P（y=0 |x;\theta）= 1

P（y=1∣x;θ）+P（y=0∣x;θ）=1

−

（

∣

;

）

（

∣

;

）

1 - P（y=0 |x;\theta）= P（y=1|x;\theta）

1−P（y=0∣x;θ）=P（y=1∣x;θ）

概率结果只在0 ~ 1中

假设如下

那么此时我们可以设置阈值

(

)

g(z)

g(z) = 0.5 ，大于 0.5 的点则为1 ，否则为0

即在

z<0

z<0（即

∗

\theta^T*x

θT∗x）中

(

)

g(z)

g(z)< 0.5, 此时预测为0 ，在

z>0

z>0（即

∗

\theta^T*x

θT∗x）时,

(

)

g(z)>0

g(z)>0 预测值为1

2.1.1 案例一

我们假设他的各个

\theta

θ 参数向量参数为-3，1 ，1

此时如果满足

(

)

g(z)

g(z)> 0.5 , 也就是横坐标

z(这里的
z

z
z 是对应线性方程

）大于零，预测 y 为 1 条件则如下：

化简为条件

x_1 + x_2 >=3

x1+x2>=3 , 这个条件所对应的几何意义：

即一条切割线的右侧，此时

函数的

坐标

sigomid函数的z坐标>0

, y值大于0.5

此时该切割线分割除了两个区域，分别是

与

y=0 与 y=1

y=0与y=1的情况,我们把这条边界，称为决策边界

，这些都是关于假设函数的属性，决定于其参数，与数据集属性无关

2.1.2例子二

有数据集如下：

我们假设函数为多项式高阶函数，并对其参数假设赋值如下。

那我们的预测y=1时，

sigomid

sigomid横坐标

满足条件为

可以得到其决策边界decision boundory ——

x_1^2+x_2^2 =1

x12+x22=1 强调：决策边界并不是数据集的属性，而是假设函数以及其参数的属性 ，数据集则是用于拟合参数

\theta

不同的高阶多项式会得到不一样的决策边界

如：

2.2 拟合logistic回归参数
θ

i

\theta_i
θi

代价函数

我们给定如数据集

有

m个样本，同样将每一个

x用

n+1

n+1维向量表示（向量每个元素即特征，其中

为

x0为1

x0为1 ) 分类标签

y只有 0 ，1结果那么我们如何选择参数

\theta

θ呢?

在往篇文章中我们线性回归的均方差代价函数

可以变化如下：

简化函数，我们省略上标

因为

sigomid

sigomid 是复杂的非线性函数，如果直接以函数作为代价函数 ，那么所求模型对应代价函数为非凹函数，会有非常多的局部最优

，如下图

我们不能保证其可以下降到函数最优

我们往往希望找到如下的凹型代价函数，以可以找到参数最优。

故我们需要找到另外的代价函数保证我们可以找到全局最小值

三、logistic代价函数

3.1 当
y

=

1

y=1
y=1代价函数图像

对该代价函数 ，我们可以画出当

y=1

y=1时的图像。（由于

sigomid

sigomid 函数值域

在0~1 ，对应代价函数横坐标为0 ~1)

为了方便理解我们可以画出，对数函数的图像

(

)

log(z)

log(z) (

(

)

z = h_\theta(x))

z=hθ(x)) ) 从图中我们也可以看到作为代价函数 很好的性质

当

⇒

Cost \Rightarrow 0

Cost⇒0时，即代价函数为0 ，此时有
h

θ

(

x

)

⇒

1

h_\theta(x)\Rightarrow1
hθ(x)⇒1 即模型拟合优秀

当

⇒

∞

Cost \Rightarrow\infty

Cost⇒∞时，即代价函数

⇒

∞

\Rightarrow\infty

⇒∞ ，此时

(

)

⇒

h_\theta(x) \Rightarrow 0

hθ(x)⇒0即为。此时说明模型拟合非常差

显然当

y=1

y=1 时这个代价函数满足我们的要求

3.2 当
y

=

y=0
y=0代价函数图像

对应

y=0

的情况下：

如下图

当

⇒

Cost \Rightarrow 0

Cost⇒0时，即代价函数为

⇒

\Rightarrow0

⇒0 ，此时有
h

θ

(

x

)

⇒

h_\theta(x)\Rightarrow0
hθ(x)⇒0 即模型拟合优秀

当

展开全文READ MORE

安装电脑系统有多少种方法（如何安装电脑系统？有什么好的方法？）

二元logistic回归多分类变量结果解读（【机器学习】Logistic 分类回归算法 （二元分类 & 多元分类））

一               、线性回归能用于分类吗？

二                     、二元分类

2.1假设函数

2.1.1 案例一

2.1.2例子二

2.2 拟合logistic回归参数 θ i \theta_i θi​

三        、logistic代价函数

3.1 当 y = 1 y=1 y=1代价函数图像

3.2 当 y = y=0 y=0代价函数图像

二元logistic回归多分类变量结果解读（【机器学习】Logistic 分类回归算法（二元分类 & 多元分类））

一、线性回归能用于分类吗？

二、二元分类

2.2 拟合logistic回归参数
θ

i

\theta_i
θi

三、logistic代价函数

3.1 当
y

=

1

y=1
y=1代价函数图像

3.2 当
y

=

y=0
y=0代价函数图像