机器学习算法Python实现--线性回归分析-机器学习-技术-爱吧机器人网

机器学习算法Python实现--线性回归分析

2018-03-19 mp:统计学家浏览量：

1、代价函数

其中：

下面就是要求出theta，使代价最小，即代表我们拟合出来的方程距离真实值最近

共有m条数据，其中代表我们要拟合出来的方程到真实值距离的平方，平方的原因是因为可能有负值，正负可能会抵消

前面有系数2的原因是下面求梯度是对每个变量求偏导，2可以消去

实现代码：

# 计算代价函数
def computerCost(X,y,theta):
    m = len(y)
    J = 0
    J = (np.transpose(X*theta-y))*(X*theta-y)/(2*m) #计算代价J
    return J
注意这里的X是真实数据前加了一列1，因为有theta(0)

2、梯度下降算法

代价函数对求偏导得到：

所以对theta的更新可以写为：

其中为学习速率，控制梯度下降的速度，一般取0.01,0.03,0.1,0.3.....

为什么梯度下降可以逐步减小代价函数

假设函数f(x)

泰勒展开：f(x+△x)=f(x)+f'(x)*△x+o(△x)

令：△x=-α*f'(x) ,即负梯度方向乘以一个很小的步长α

将△x代入泰勒展开式中：f(x+x)=f(x)-α*[f'(x)]²+o(△x)

可以看出，α是取得很小的正数，[f'(x)]²也是正数，所以可以得出：f(x+△x)<=f(x)

所以沿着负梯度放下，函数在减小，多维情况一样。

实现代码

# 梯度下降算法
def gradientDescent(X,y,theta,alpha,num_iters):
    m = len(y)
    n = len(theta)
    temp = np.matrix(np.zeros((n,num_iters)))   # 暂存每次迭代计算的theta，转化为矩阵形式
    J_history = np.zeros((num_iters,1)) #记录每次迭代计算的代价值
    for i in range(num_iters): # 遍历迭代次数
        h = np.dot(X,theta)     # 计算内积，matrix可以直接乘
        temp[:,i] = theta - ((alpha/m)*(np.dot(np.transpose(X),h-y)))   #梯度的计算
        theta = temp[:,i]
        J_history[i] = computerCost(X,y,theta)      #调用计算代价函数
        print '.',
    return theta,J_history

3、均值归一化

目的是使数据都缩放到一个范围内，便于使用梯度下降算法

其中为所有此feture数据的平均值

可以是最大值-最小值，也可以是这个feature对应的数据的标准差

实现代码：

# 归一化feature
def featureNormaliza(X):
    X_norm = np.array(X)            #将X转化为numpy数组对象，才可以进行矩阵的运算
    #定义所需变量
    mu = np.zeros((1,X.shape[1]))
    sigma = np.zeros((1,X.shape[1]))
    mu = np.mean(X_norm,0)          # 求每一列的平均值（0指定为列，1代表行）
    sigma = np.std(X_norm,0)        # 求每一列的标准差
    for i in range(X.shape[1]):     # 遍历列
        X_norm[:,i] = (X_norm[:,i]-mu[i])/sigma[i] # 归一化
    return X_norm,mu,sigma

注意预测的时候也需要均值归一化数据

4、最终运行结果

代价随迭代次数的变化

5、使用scikit-learn库中的线性模型实现

导入包
from sklearn import linear_model
from sklearn.preprocessing import StandardScaler    #引入缩放的包
归一化
    # 归一化操作
    scaler = StandardScaler()
    scaler.fit(X)
    x_train = scaler.transform(X)
    x_test = scaler.transform(np.array([1650,3]))
线性模型拟合
    # 线性模型拟合
    model = linear_model.LinearRegression()
    model.fit(x_train, y)
预测
    #预测结果
    result = model.predict(x_test)

实例及数据请入传送门：
https://github.com/lawlite19/MachineLearning_Python/tree/master/LinearRegression

精选推荐

机器人工程师具体都做什么？

[2017-12-08] 机器人工程师是幕后设计师，负责创建机器人和机器人系统，能够执行人类无法完成或不愿意完成的任务。通过他们的创造，机器人工程师帮助工作更安全，更轻松，更高效，特别是......

Waymo：人性和行为心理学才是无人驾驶最大的挑战

[2019-11-03] 自动驾驶汽车作为AI领域内最大的挑战之一，谷歌致力于其研发已有十余载，现在他们逐渐意识到，最困难的是如何让人们享受驾驶的乐趣。这是一 ...

人工智能民主化能否实现取决于科技巨头

[2017-12-29] 我们经常听到像谷歌和微软这样的公司说他们希望人工智能民主化。这是一个很好的词，民主化。但这些公司如何界定“民主化”还不清楚，像AI本身一样，它似乎有点炒作的味道...

德国研发出一种能在你体内工作的微型机器人

[2018-01-26] 纽约时报的报道，德国的研究人员已经开发出一种长约七分之一英寸的机器人，首先看起来不过是一小块橡皮条。然后它开始移动。机器人走路，跳跃，爬行，滚动和游泳。它甚至爬出......

深度神经网络揭示了大脑喜欢看什么

[2019-11-06] 爱吧机器人网编者按：近日，《自然-神经科学》发表了一篇论文，研究人员创建了一种深度人工神经网络，能够准确预测生物大脑对视觉刺激所产 ...

CES 2018：英特尔推出49量子位芯片争夺量子霸权

[2018-01-10] 在与Google、IBM的一场关于建立量子计算系统的马拉松比赛中，英特尔通过了一个关键的里程碑。近日，这个科技巨头已经推出了一个49个量子位 ...

亚马逊CEO杰夫·贝佐斯操控巨型有人驾驶机器人（巨型机甲）

[2017-03-21] 近日，亚马逊CEO杰夫·贝佐斯实现了每一个6岁儿童都会有的梦想，他控制了一个巨大的机甲机器人。据国外媒体Verge报道，前天（3月19日），贝 ...

机器人从工业走向家庭库卡KUKA目标是引领中国市场

[2017-12-08] 机器人正在改变着人们的生活方式，而库卡KUKA想要在中国这个大蛋糕中占有一块大份额，库卡公司正在引领市场...

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系[email protected]，我们会立即处理。谢谢配合！

本周栏目热点

顶级AI会议NIPS压轴2017（附PPT、视频、代码大汇总）

[2017-12-19] NIPS，全称神经信息处理系统大会(Conference and Workshop on Neural Information Processing Systems)，是一个关于机器学习和计算神经科学的国际会议。该会议固定在每年的12月举行...

机器学习选择深层模型的原因

[1970-01-01] 深度学习采用的模型为深层神经网络（Deep Neural Networks，DNN）模型，即包含多个隐藏层（Hidden Layer，也称隐含层）的神经网络（Ne ...

机器学习—自由编码器

[1970-01-01] 一种常见的深层模型是由自编码器（Auto-Encoder）构造的。自编码器可以利用一组无标签的训练数据{x(1), x(2), &hellip }（其中x(i)是一个n ...

【NIPS最佳论文出炉】冷扑大师能战胜AlphaZero吗？No（Science论文）

[2017-12-19] 拿下NIPS2017 最佳论文，登上Science，“冷扑大师”最近有点热。18日，两位作者，CMU博士生Noam Brown和Tuomas Sandholm教授在Reddit上回答问题。对“为什么不使用深度学习......

日本开发团队给机器人嵌入神经网络

[2016-08-18] 　　近日在日本国立科学博物馆展出的机器人 Alter，可谓是目前世界上最为先进的机器人之一，因为它是一款嵌入了神经网络的机器人，来自日本 ...