Есть ли в statsmodels WLS функция get_influence()?

Как получить кредитное плечо/get_influence от модели WLS, подходящей для статистических моделей Python

Взяв пример из http://statsmodels.sourceforge.net/stable/index.html

# Load data
dat = sm.datasets.get_rdataset("Guerry", "HistData").data

# Fit regression model (using the natural log of one of the regressors)
results_ols = smf.ols('Lottery ~ Literacy + np.log(Pop1831)', data=dat).fit()
results_w = smf.wls('Lottery ~ Literacy + np.log(Pop1831)', data=dat).fit()

я могу позвонить

results_ols.get_influence 

но не results_wls.get_influence()

Есть ли аналог для wls?

Меня также интересуют любые решения за пределами статистических моделей.


person user196711    schedule 15.11.2016    source источник


Ответы (1)


Вы можете получить меры влияния и выбросов для взвешенных переменных, используя OLS для взвешенных переменных.

Например, если mod_wls — это ваша модель WLS (экземпляр модели, а не экземпляр результатов), то

res = sm.OLS(mod_wls.wendog, mod_wls.wexog).fit()
infl = res.get_influence()

Насколько мне известно, большинство или все меры влияния будут правильными, но они основаны на взвешенных переменных и наблюдениях. Есть некоторые определения некоторых показателей влияния в терминах исходных переменных, но они будут недоступны. Например, есть два способа определить матрицу шляпы для WLS, один из которых соответствует использованию взвешенных переменных, как указано выше, а другой имеет влияние с точки зрения исходной переменной.

(Аналогичная проблема возникает в GLM и RLM, которые основаны на методе наименьших квадратов с повторным взвешиванием, например https://github.com/statsmodels/statsmodels/issues/808

Статистика влияния и выбросов не была распространена на другие модели в основном из-за отсутствия ссылки на статистическую литературу, в которой явно рассматривается этот случай, и из-за того, что не было известно об эталонной реализации в другом пакете, которую можно было бы использовать для модульных тестов.

обновление
Теперь в GLM есть некоторые необычные показатели влияния https://www.statsmodels.org/dev/generated/statsmodels.genmod.generalized_linear_model.GLMResults.get_influence.html

но все еще ничего явно для WLS)

person Josef    schedule 17.11.2016