线性回归,在数学、统计学上的概念,主要是能够构成线性关系的一些数值,知道其中一部分数值,去预测未知的值。这里的线性是直线,不是曲线、抛物线,类似于xy坐标轴上,散点分布坐标点,通过一条直线表示趋势走向,不过这条线要尽可能与这些点接近。
线性回归的场景较多,比如身高体重、房价等。线性回归分为单变量、多变量。这个变量相当于特征。
线性回归的公式可以从单变量再到多变量去演变。
单变量公式:y = kx + b 其中x是特征值,y是目标值,k、b作为系数,数学上k是斜角,b是截距。
考虑多个特征值的情况,多变量是进一步将公式抽象化,这时k、b不是只有一个值。因此,构建线性回归公式时需要数据集选择足够合适的值计算出k、b。
在机器学习里,k称为权重weight,b称为偏置bios。