Z-оценка

Стандартизированная оценка (z-оценка, англ. : Standard score, z-score) - это мера относительного разброса наблюдаемого или измеренного значения, которая показывает, сколько стандартных отклонений составляет его разброс относительного среднего значения. Это безразмерный статистический показатель, используемый для сравнения значений разной размерности или шкалой измерений.

Основные сведения

В теории вероятности и статистике, стандартизованная случайная величина[1] - это случайная величина, математическое ожидание которой равно нулю, а стандартное отклонение - единице. Любая случайная величина x с математическим ожиданием μ {\displaystyle \mu } и стандартным отклонением σ {\displaystyle \sigma } может быть приведена к стандартизованной случайной величине z {\displaystyle z} по формуле: x μ σ {\displaystyle {x-\mu \over \sigma }} . Это преобразование включает центрирование случайной величины (разность ( x μ ) {\displaystyle {(x-\mu )}} между данной случайной величиной x и ее математическим ожиданием μ {\displaystyle \mu } ) и нормирование (отношение x σ {\displaystyle {x \over \sigma }} данной случайной величины x к ее стандартному отклонению  σ {\displaystyle \sigma } ). Распределение стандартизованной нормальной случайной величины z {\displaystyle z} называется стандартным нормальным распределением N ( 0 , 1 ) {\displaystyle N(0,1)} с функцией плотности f ( z ) = 1 2 π exp ( z 2 2 ) {\displaystyle f(z)={\frac {1}{\sqrt {2\pi }}}\exp \left({\frac {-z^{2}}{2}}\right)} .

Понятие стандартизованной случайной величины является частным случаем приведенной случайной величины, определяемой относительного центрального значения и параметра масштаба, отличных от математического ожидания и стандартного отклонения.

В практических задачах, любое множество данных x i {\displaystyle x_{i}} со средним значением X ¯ {\displaystyle {\bar {X}}} и стандартным отклонением S {\displaystyle S} можно преобразовать в другое множество со средним 0 {\displaystyle 0} и стандартным отклонением 1 {\displaystyle 1} таким образом, что преобразованные значения z {\displaystyle z} будут непосредственно выражаться в отклонениях исходных значений от среднего, измеренных в единицах стандартного отклонения.

Принадлежность z-оценок стандартному нормальному распределению N ( 0 , 1 ) {\displaystyle N(0,1)} , обеспечивает возможность применения z-оценок для сравнения неоднородных значений первичных измерений. Большинство статистических методов основываются на предположении о нормальности распределения данных, поэтому применение z-оценок совместно с  трансформацией к нормальности значительно расширяет возможности для дальнейшего анализа и исследований. 

Способ расчёта

Стандартизованная оценка величины x {\displaystyle x} рассчитывается по формуле[2]:

z = x X ¯ S x {\displaystyle z={x-{\bar {X}} \over S_{x}}}

где X ¯ {\displaystyle {\bar {X}}} - среднее значение, S x {\displaystyle S_{x}} - стандартное отклонение вычисленные для множества данных x i {\displaystyle xi} .

Значения X ¯ {\displaystyle {\bar {X}}} и S x {\displaystyle S_{x}} могут быть вычислены по выборочным данным, или получены в генеральной совокупности, или установлены для некоторой популяции.

Интерпретация

Абсолютное значение z представляет собой оценку (в единицах стандартного отклонения) расстояния между x и его средним значением μ в общей совокупности. Если z меньше нуля, то x ниже средней, если z больше нуля, то x расположен выше средней μ.

Значения z {\displaystyle z} не только удобное средство информации о положении некоторого значения, связанного со средним и измеренного в единицах стандартного отклонения, но и шаг вперед к преобразованию множества x i {\displaystyle xi} в произвольную шкалу с удобными характеристиками среднего и стандартного отклонения.

Процентильный эквивалент z-оценок

соответствие z-оценок и процентилей

Поскольку распределение z-оценок аппроксимируется стандартным нормальным распределением, то  существует однозначное соответствие процентилей (квантилей порядка q) и значений z. Это позволяет однозначно переводить шкалу ранговых градаций или баллов в значения z-оценки и обратно (так значению z=-3 соответствует 0,13 процентиль, z=- 2 {\displaystyle \Rightarrow } 2,3-й процентиль, z=-1 {\displaystyle \Rightarrow } 15,9-й процентиль и т.д.).

Практическое применение

Существует множество шкал измерения с произвольными средними и стандартными отклонениями, которые распространены в общественных науках.

Педагогика и психология

Распространены шкальные оценки, когда оценки результатов теста устанавливаются на основе его места на специальной шкале, которая содержит данные о внутригрупповых нормах выполнения теста. Оценки интеллектуального теста часто преобразуются в шкалу со средним 100 и стандартным отклонением 15 или 16. Значения T {\displaystyle T} - показателя[3], вычисленные как 10 z + 50 {\displaystyle 10z+50} имеют широкое применение.

нормальная кривая, процентили и стандартные оценки в различных шкалах

Другим примером нелинейного преобразования в стандартную шкалу являются станайны (англ. standart nine), когда первичные показатели ранжируют по возрастанию и делят на группы с числом, пропорциональным определённым частотам оценок нормальном распределении, получаемые оценки принимают значения от 1 до 9 ( μ {\displaystyle \mu } =5, σ {\displaystyle \sigma } =2). Существует много шкал, опирающихся на стандартизованные оценки.

Педиатрия

Для описания характеристик пациентов с учетом их неоднородности используется нормирование. В педиатрической практике был распространен коэффициент стандартного отклонения (sds – standard deviation score), который вычисляется x X ¯ S x {\displaystyle {x-{\bar {X}} \over S_{x}}} на основе выборочного среднего значения X ¯ {\displaystyle {\bar {X}}} и стандартного отклонения S x {\displaystyle S_{x}} справочных показателей ребенка данного пола и возраста[4].  Отклонение распределений показателей физического развития  от нормального привело к использованию центрирования измеренных значений медианой вместо среднего x M e P r 90 P r 10 {\displaystyle {x-Me \over Pr90-Pr10}} , где  M e {\displaystyle Me} – медиана и P r 10 , P r 90 {\displaystyle Pr10,Pr90} - 10-й и 90-й процентиль справочного показателя ребенка того же пола и возраста. 

Необходимость учета формы распределений показателей физического развития[5], привела к применению z-оценки вычисляемой как

z = { ( y / M ) L 1 ) L   S , если  L 0 1 S l n ( y / M ) ,  если  L = 0 {\displaystyle z={\begin{cases}{\frac {(y/M)^{L}-1)}{L\ S}},&{\text{если }}L\neq 0\\{\frac {1}{S}}ln(y/M),&{\text{ если }}L=0\end{cases}}}

где y – измеренное значение показателя, L {\displaystyle L} – коэффициент трансформации Бокса-Кокса к нормальности, M {\displaystyle M} - медиана, S {\displaystyle S} – коэффициент вариации справочного или стандартного показателя ребенка того же пола и возраста.

В современных методических рекомендация ВОЗ представлены стандартные и справочные значения коэффициентов L, M, S для исследования физического развития детей[6] и разработано программное обеспечение WHO ANTHROPlus[7] для работы с ними.

См. также

  • Вариация (статистика)

Примечания

  1. ГОСТ Р 50779.10-2000 (ИСО 3534.1-93) Статистические методы. Вероятность и основы статистики. Термины и определения
  2. Мелник М. Основы прикладной статистики. — Москва: Энергоатомиздат, 1983. — 416 с.
  3. Дж. Гласс, Дж. Стэнли. Статистические методы в педагогике и психологии. — Прогресс, 1976. — 496 с.
  4. Вельтищев Ю. Е. Объективные показатели нормального развития и состояния здоровья ребенка (нормативы детского возраста). — Москва, 2002. — С. 96. — ISBN НЛА 575/БН2-25072017/89.
  5. Borghi E. Construction of the World Health Organization child growth standards: selection of methods for attained growth curves // Statistics in Medicine. — 2006. — Т. 25. — С. 247–265.
  6. Разработанные ВОЗ нормы роста детей  (неопр.). World Health Organization. Дата обращения: 23 октября 2017. Архивировано 22 октября 2017 года.
  7. Программное средство ВОЗ Anthro для персональных компьютеров  (неопр.). WHO Child Growth Standards. Дата обращения: 23 октября 2017. Архивировано 21 октября 2017 года.