measure_interactions#

interpret.utils.measure_interactions(X, y, interactions=None, init_score=None, sample_weight=None, feature_names=None, feature_types=None, max_interaction_bins=64, min_samples_leaf=4, min_hessian=0.0001, reg_alpha=0.0, reg_lambda=0.0, max_delta_step=0.0, objective=None)#

运行 FAST 算法并以字典形式返回排序后的交互及其强度。

参数:
  • X – 训练样本数组

  • y – 训练目标数组

  • interactions – 要评估的交互。可以是特征索引的元组列表,或表示返回的最大对数的整数。None 表示评估所有成对交互。

  • init_score – 可以生成分数的模型或每个样本的初始化分数。如果提供样本分数,其长度应与 X 和 y 相同。

  • sample_weight – 可选的每个样本权重数组。其长度应与 X 和 y 相同。

  • feature_names – 特征名称列表

  • feature_types – 特征类型列表,例如 “continuous” 或 “nominal”。

  • max_interaction_bins – 每个交互项的最大 bin 数量

  • min_samples_leaf – 计算增益时用于树分割的最小样本数

  • min_hessian – 考虑潜在分割有效所需的最小 Hessian 值

  • reg_alpha – L1 正则化。

  • reg_lambda – L2 正则化。

  • max_delta_step – 用于限制树叶的最大输出。<=0.0 表示无约束。

  • objective – None (rmse 或 log_loss), “rmse” (回归默认值), “log_loss” (分类默认值), “poisson_deviance”, “tweedie_deviance:variance_power=1.5”, “gamma_deviance”, “pseudo_huber:delta=1.0”, “rmse_log” (具有对数链接函数的 rmse)

返回值:

包含项的特征索引元组和交互强度的列表,

例如 [((1, 2), 0.134), ((3, 7), 0.0842)]。按交互强度降序排列。