您当前的位置: 首页 >  分类

惊鸿一博

暂无认证

  • 3浏览

    0关注

    535博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

机器学习_回归和分类的区别

惊鸿一博 发布时间:2020-10-09 10:28:44 ,浏览量:3

回归和分类的区别

首先假设线性回归是个黑盒子,那按照程序员的思维来说,这个黑盒子就是个函数。我们只要往这个函数传一些参数作为输入,就能得到一个结果作为输出。那回归是什么意思呢?其实就是这个黑盒子输出的结果是个连续的、不固定的值。如果输出不是个连续值而是个离散、固定的那就叫分类。那什么叫做连续值呢?非常简单,举个栗子:比如我告诉你我这里有间房子,这间房子有40平,然后你来猜一猜我的房子总共值多少钱?这就是连续值,因为房子可能值80万,也可能值80.2万,也可能值80.21万。再比如,我告诉你我有间房子,120平,总共值180万,然后你来猜猜我这间房子会有几个卧室?那这就是离散值了。因为卧室的个数只可能是1, 2, 3,4,充其量到5个封顶了,这样预测的值就是固定的那几个,而且卧室个数也不可能是什么1.1, 2.9个。所以只要知道我要完成的任务是预测一个连续值的话,那这个任务就是回归问题,离散值的话就是分类问题。

机器学习中的回归和分类是什么?

数据科学家使用许多不同类型的机器学习算法来发现大数据中的模式,这些模式可带来切实可行的见解。 从较高的层次上讲,这些不同的算法可以根据它们“学习”数据进行预测的方式分为两类:监督学习和无监督学习。

有监督的机器学习:大多数实际的机器学习都使用有监督的学习。 在监督学习中,您具有输入变量(x)和输出变量(Y),并使用一种算法来学习从输入到输出的映射函数Y = f(X)。 目标是很好地近似映射函数,以便在拥有新的输入数据(x)时可以预测该数据的输出变量(Y)。

监督机器学习算法的技术包括线性和逻辑回归,多类分类,决策树和支持向量机。 有监督的学习要求用于训练算法的数据已被正确答案标记。 例如,分类算法将在经过训练的图像数据集上学会识别动物,该图像数据集已正确标记了动物的种类和某些识别特征。

监督学习问题可以进一步分为回归和分类问题。 这两个问题的目标都是构建一个简洁的模型,该模型可以根据属性变量来预测从属属性的值。 两项任务之间的区别在于,从属属性对于回归而言是数值的,而对于分类则是分类的。

回归

回归问题是当输出变量是实数或连续值时,例如“工资”或“权重”。 可以使用许多不同的模型,最简单的是线性回归。 它试图使数据适合通过这些点的最佳超平面。

举些例子: 以下哪项是回归任务?

预测一个人的年龄 预测一个人的国籍 预测公司的股价明天是否会上涨 预测文件是否与目击不明飞行物有关?

答案:预测一个人的年龄。

分类

分类问题是当输出变量是类别时,例如“红色”或“蓝色”或“疾病”和“没有疾病”。 分类模型试图从观测值得出一些结论。 给定一个或多个输入,分类模型将尝试预测一个或多个结果的价值。 例如,当过滤电子邮件为“垃圾邮件”或“非垃圾邮件”时,在查看交易数据时为“欺诈性”或“授权”。 简而言之,分类要么预测分类类别标签,要么根据训练集和分类属性中的值(分类标签)对数据分类(构建模型),并将其用于分类新数据。 有许多分类模型。 分类模型包括逻辑回归,决策树,随机森林,梯度提升树,多层感知器,朴素贝叶斯。

例如 : 以下哪个是分类问题?

通过他/她的笔迹样式预测一个人的性别

根据面积预测房价

预测明年的季风是否正常

预测下个月将出售音乐专辑的份数

答案:预测一个人的性别预测明年的季风是否正常。 另外两个是回归。

参考:
  • 通俗理解线性回归(一)
  • 回归问题简介以及与分类问题的区别
  • 数据科学&机器学习
关注
打赏
1663399408
查看更多评论
立即登录/注册

微信扫码登录

0.0354s