分类树#

算法描述链接:决策树

class interpret.glassbox.ClassificationTree(feature_names=None, feature_types=None, max_depth=3, **kwargs)#

浅层深度分类树。

初始化为低深度的树。

参数:
  • feature_names – 特征名称列表。

  • feature_types – 特征类型列表。

  • max_depth – 树的最大深度。

  • **kwargs – 传递给树的 __init__() 方法的关键字参数。

explain_global(name=None)#

提供模型的全局解释。

参数:

name – 用户定义的解释名称。

返回:

一个解释对象,将特征-值对可视化为水平条形图。

explain_local(X, y=None, name=None)#

为提供的实例提供局部解释。

参数:
  • X – 用于解释的 X 的 Numpy 数组。

  • y – 用于解释的 y 的 Numpy 向量。

  • name – 用户定义的解释名称。

返回:

一个解释对象。

fit(X, y, sample_weight=None, check_input=True)#

将模型拟合到提供的实例。

参数:
  • X – 用于训练实例的 Numpy 数组。

  • y – 作为训练标签的 Numpy 数组。

  • sample_weight (可选[np.ndarray]) – (n_samples,) 样本权重。如果为 None (默认),则样本权重相等。在每个节点中搜索分割点时,将忽略那些会导致子节点净权重为零或负数的分割点。

  • check_input (bool) – default=True. 允许绕过多个输入检查。除非您知道自己在做什么,否则不要使用此参数。

返回:

对象本身。

predict(X)#

对提供的实例进行预测。

参数:

X – 用于实例的 Numpy 数组。

返回:

每个实例的预测类别标签。

predict_proba(X)#

对提供的实例进行概率估计。

参数:

X – 用于实例的 Numpy 数组。

返回:

实例对每个类别的概率估计。

score(X, y, sample_weight=None)#

返回给定测试数据和标签上的平均准确率。

在多标签分类中,这是子集准确率,这是一个严格的指标,因为它要求对每个样本正确预测每个标签集。

参数:
  • X (形状类似 array (n_samples, n_features)) – 测试样本。

  • y (形状类似 array (n_samples,) 或 (n_samples, n_outputs)) – X 的真实标签。

  • sample_weight (形状类似 array (n_samples,), default=None) – 样本权重。

返回:

scoreself.predict(X) 相对于 y 的平均准确率。

返回类型:

浮点数