黄阿信的个人博客

前言

生活中常常遇到线性模型的例子，例如房子的价格与占地面积几乎是呈线性，它还可能和卧室数量相关；又如一个学生是否具备获取奖学金资格与学生成绩、参与竞赛经历、班干部任职经历都相关；又如一个大学生是否能够在大学中脱单，与个人相貌、为人处事能力、生活习惯都有联系。

回归实现

简单起见，我们假设只有一个特征，即只有一个x，而不是有x1,x2,...我们首先生成一组线性数据，为了更符合实际，我们加入随机偏差：

def data():
    x = np.linspace(-20, 20, 50)
    y = 2*x + 3 + np.random.randn(len(x)) * 3
    x = x.reshape(-1, 1)
    y = y.reshape(-1, 1)
    return x, y

然后初始化我们的参数w,b

def init():
    w, b = np.random.randn(), np.random.randn()
    # 参数合并
    return np.array([[w],
                     [b]])

定义误差函数

def l(W, X, y):
    WX = np.dot(X, W) - y
    return WX ** 2 / 2.0

定义损失函数：

def loss(W, X, y):
    l_value = l(W, X, y)
    n = X.shape[0]
    return np.sum(l_value) / n

梯度下降法：

def gradient_descent(W, X, y):
    n = y.shape[0]
    A = np.dot(X, W) - y
    return np.dot(X.T, A) / n

开始我们的训练：

def train():
    learning_rate, epoch = 0.01, 100
    W = init()
    x, y = data()
    one = np.ones((x.shape[0],1))
    X = np.c_[x, one]
    loss_x, loss_y = np.zeros((epoch, 1)), np.zeros((epoch, 1))
    for i in range(epoch):
        loss_value = loss(W, X, y)
        print("epoch = ", i, "loss = ", loss_value)
        loss_x[i] = i
        loss_y[i] = loss_value
        
        grad = gradient_descent(W, X, y)
        W = W - learning_rate * grad
    plt.subplot(1, 2, 1)
    plt.scatter(x, y)
    plt.plot(X[:, 0], np.dot(X, W), color='red')
    
    plt.subplot(1, 2, 2)
    plt.title("loss")
    plt.plot(loss_x, loss_y)

结果

可以发现，拟合效果还是挺不错的，损失值下降得也挺快，前面的急剧下降是因为我们是随机初始化的参数，该参数对应的导数可能比较大，因此更新得比较快。前面的急剧下降是因为我们是随机初始化的参数，该参数对应的导数可能比较大，因此更新得比较快。

numpy实现线性回归模型

前言

相关原理

回归实现

结果