在本文中,我们将讨论如何创建一个假估计量,只是为了与模型估计量进行比较。我们将讨论监督学习中的两种类型的虚拟模型,即回归和分类。
这个概念来自 sklearn 的度量和评分部分。
它用于根据简单规则进行预测,以了解比较回归变量的简单基线,但不用于实际问题。
DummyRegressor 中的参数
主要参数如下所示:
- **策略:**用于根据其不同的自变量生成预测。
- 均值: 用于预测训练集的均值。
- 中位数: 用于预测训练集的中位数。
- 分位数: 用于预测训练集的分位数范围。
- 常量: 是用户定义的预测常量值。
python 的例子
#import the libraries
import numpy as np
from sklearn.dummy import DummyRegressor#Assign the value to X and y
X = np.array([1.0, 2.0, 3.0, 4.0])
y = np.array([2.0, 3.0, 5.0, 10.0])# Using the dummy regressor
dummy_regr = DummyRegressor(strategy="mean")
dummy_regr.fit(X, y)dummy_regr.predict(X)#output:
array([5., 5., 5., 5.])
pub.towardsai.net](/part-ii-pre-processing-techniques-in-image-processing-with-python-17fb628453ff) [## 使用 Python 中的 Keras 逐步基本了解神经网络
pub.towardsai.net](/step-by-step-basic-understanding-of-neural-networks-with-keras-in-python-94f4afd026e5)
它用于对简单规则进行预测,以了解比较分类器的简单基线,但不用于实际问题。
dummy classifier 中的参数
主要参数如下所示:
- **策略:**用于生成预测。
- 分层: 用于根据训练集中的类分布生成预测。
- 最频繁: 用于预测训练集的最频繁标签。
- 先验: 用于预测类别先验最大化的类别。
- 均匀: 用于随机均匀地生成预测。
- 常量: 是用户定义的预测常量标签值。这是非常有用的度量评估时间为非多数阶级。
Python 的例子
#import the libraries
import numpy as np
from sklearn.dummy import DummyClassifier#Assign the value to X and y
X = np.array([-1, 1, 1, 1])
y = np.array([0, 1, 1, 1])# Using the dummy classifer
dummy_clf = DummyClassifier(strategy="most_frequent")
dummy_clf.fit(X, y)
dummy_clf.predict(X)#output:
array([1, 1, 1, 1])
这篇文章只是一个关于哑估计量的基本概念。
pub.towardsai.net](/hypothesis-testing-in-statistics-with-examples-844d698d99d5)
我希望你喜欢这篇文章。通过我的 LinkedIn 和 twitter 联系我。
1。NLP —零到英雄用 Python 2。 Python 数据结构数据类型和对象 3。数据预处理概念同 Python 4。用 Python 进行主成分分析降维 5。用 Python 全面讲解 K-means 聚类 6。用 Python 充分解释了线性回归 7。用 Python 充分解释了 Logistic 回归 8。用 Python 做时间序列的基础知识 9。与 Python 的数据角力—第一部分10。机器学习中的混淆矩阵