Pred_leaf much slower than simpler predict

dacian-dataheroes · October 24, 2023, 3:14pm

Why predicting the leaf is way slower than actual predicting? Doesn’t xgboost have to get the leaf anyway for the predicted value?

X, y = make_regression(n_samples = 100000, n_features = 10)
dmatrix = xgb.DMatrix(X, label = y)

model = xgb.XGBRegressor(n_estimators = 20, max_depth = 6)
model.fit(X, y)
booster = model.get_booster()

%%timeit 
booster.predict(dmatrix, pred_leaf = True)
 # 22.9 ms ± 626 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)

%%timeit 
booster.predict(dmatrix)
# 385 µs ± 26 µs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)

(Isolating a single booster produces similar results)