1、机器学习的定义:
机器学习 (Machine (Machine Learning, Learning, Learning,ML) 是一门多领域交叉学科 ,涉及概 涉及概 涉及概 率论 、统计学 、逼近论 、凸分析 、算法复杂度理论等多门学科 。专 门研究计算机怎样模拟或实现人类的学习行为 ,以获取新的知识或 技能 ,重新组织已有的知识结构 (利用数据或经验等 )使之不断改善自身的性能。
2、机器学习的本质:机器学习(基于数据的):模型自动的从数据学习规律(训练)
标签的角度:有监督,无监督,半监督,强化学习
模型的类型:KNN,决策树,SVM,随机森林,深度学习
解决的问题:分类,回归,聚类,降维
参数角度:有参数模型,无参数模型
数据获取——>数据预处理——>模型学习——>模型评估——>新数据预测 (下图 从 数据预处理开始)
数据的形式是 m*n的 行(n)是一个一个的样本 列(n)是一个一个的特征 和标签