当阿法狗击败世界围棋冠军,谷歌无人驾驶车开始上路后,人工智能这个词就开始进入了普罗大众的视野,,当然阿法狗和无人驾驶车是深度学习的产物,今天我主要是来普及下机器学习到底是什么?
那么机器学习是什么呢?举个通俗的栗子,我们可以通过一个人的头发长短、衣着打扮及其它身体特征来辨别其他人的性别,这是我们几千年以来经验总结出来的结果。为什么机器就不能通过这些已经存在的经验来总结归纳出一套模型,用来预测某一事物的发展规律呢?机器学习就是用来做这个事情,下面举一个具体的栗子来详细说明。
就拿最近火热的房地产市场来说,假如某地区的房价如下表所示:
我们把这些数据放在平面坐标系中,可以看到下图这样:
中学时代我们都学习过很简单的一个线性方程y=ax+b,这是一个一元一次方程,在上图的平面坐标系中我们可以看到一条蓝色的线条,可以看到这条线条不是正好就是一元一次线性方程在坐标系中的图么?这里应该明白我要说的是什么意思了吧,房价每个点的走势基本上拟合在这一条直线上,假如我从没卖过120平米的房子,那这120平的房子应该是卖多少钱才合适呢?机器学习就是要做一件这样的事情,拟合房价的历史数据,得到一条最优的直线来预测120平的房子应该卖什么价格,这条最优的直线我们称之为模型。当然上图可以看出并不是所有的点都在这一条直线上,所以我们需要通过一些损失评估方法来尽可能的降低损失,而且房屋的价格也并不是只受房屋面积的影响,例如还有房屋户型、学区房、交通、地理位置等,这些影响因素我们称为特征。