Винзоризованное среднее

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис

Винсоризованное среднее представляет собой винсоризованную статистическую меру центральной тенденции как некую конволюцию среднего арифметического и усеченного среднего.

Расчет винсоризованного среднего сводится к тому, что k% наибольших и k% наименьших значений (обычно от 5% до 25%) заменяется наименьшими и наибольшими значениями из оставшегося массива данных, после чего рассчитывается среднее арифметическое.

Преимущества

Винсоризованное среднее менее чувствительна к "выбросам" (аутлайерам) чем простое среднее арифметическое при этом оставаясь приемлемой оценкой в ряде статистических моделей. Относится к разряду устойчивых (робастных) мер центральной тенденции.

Недостатки

Применимость винсоризованного среднего (как и усеченного среднего) весьма сомнительна в случаях с небольшим количеством наблюдений. Кроме того, замена одних значений другими не всегда содержательно обоснована.

Пример

Пусть имеется набор данных (отсортированных по возрастанию): 2, 3, 4, 5, 7, 9, 10, 12, 14, 30

Расчет 20% винсоризованного среднего в нашем примере предполагает перед вычислением среднего арифметического замену первых двух и последних двух значений в ряду данных (2, 3 и 14, 30): 4, 4, 4, 5, 7, 9, 10, 12, 12, 12.

После замены и расчета среднего результат = 7,9.

Ссылки

  • Wilcox, R.R.; Keselman, H.J. (2003). "Modern robust data analysis methods: Measures of central tendency". Psychological Methods 8 (3): 254–274. doi:10.1037/1082-989X.8.3.254.