Python机器学习回归简介,本视频简要介绍了回归的概念和应用。回归是一种预测连续值的方法,其中包括因变量和一个或多个自变量。回归模型可以用来预测汽车的二氧化碳排放量,房价,销售额等连续值。回归分析在销售预测、心理学、金融、医疗保健等领域都有应用。虽然有许多不同的回归算法,但本课程介绍了一些基本的回归技术,为进一步探索提供了基础知识。
看看这个数据集,这与不同汽车的二氧化碳排放有关。它包括发动机尺寸、气缸数量、各种车型的燃油消耗和二氧化碳排放。
问题是,给定这个数据集,我们可以预测汽车的二氧化碳排放量吗,使用其他字段,如发动机尺寸或气缸?
假设我们有来自不同汽车的历史数据,假设一辆汽车,比如,但他还没有制造出来,但我们有兴趣估计其生产后的二氧化碳排放量。有可能吗?
我们可以使用回归方法来预测连续值,如二氧化碳排放,使用一些其他变量。实际上,回归是预测连续值的过程。
在回归中,有两种类型的变量,因变量和一个或多个自变量。因变量,可以看作是状态,目标,或我们研究的最终目标,并尝试预测,和自变量,也称为解释变量,可以被视为这些状态的原因。自变量通常用X表示,因变量用Y表示。
我们的回归模型与Y相关,或因变量,X的函数,即自变量。
回归中的关键点,我们的依赖值应该是连续的并且不能是离散值。然而,自变量或变量,可以根据分类、或连续测量标尺。
因此,我们想在这里做的是使用一些汽车的历史数据,使用它们的一个或多个特征并从该数据中创建模型。我们用回归来建立这样的回归估计模型,然后使用该模型预测新车或未知车的预期二氧化碳排放量。
基本上,有两种类型的回归模型。简单回归和多元回归。简单回归是当用一个自变量来估计因变量。它可以是线性的,也可以是非线性的。例如,使用发动机尺寸变量预测二氧化碳排放。
回归的线性,基于自变量和因变量之间的关系。当存在多个自变量时,该过程称为多元线性回归。例如,使用发动机尺寸预测二氧化碳排放,以及任何给定汽车中的气缸数量。同样,根据因变量和自变量之间的关系,它可以是线性回归,也可以是非线性回归。
让我们来看看回归的一些示例应用程序。
本质上,当我们想要估计连续值时,我们使用回归。例如回归分析可以用于销售预测领域。您可以尝试从自变量中预测销售人员的年度总销售额,比如年龄、教育程度、和多年的经验。它也可以用于心理学领域,例如,根据人口统计学和心理因素确定个人满意度。我们可以使用回归分析来预测某一地区的房价,根据其大小,卧室数量等。我们甚至可以用它来预测就业收入,对于工作时间、教育、职业、性别、年龄、经验年限等。
事实上,您可以找到许多关于这些和许多其他领域的回归分析,或金融等领域,医疗保健、零售等。
我们有许多回归算法。它们都有自己的重要性,以及其应用最适合的特定条件,虽然我们在本课程中只介绍了其中的几个,它为您提供了足够的基础知识来探索不同的回归技术。
Python机器学习回归简介 推荐