Энциклопедия Turbo Pascal. Главы 5-8
Страница 9. Дисперсия и стандартное отклонение


Дисперсия и стандартное отклонение

     Хотя для  оценки всей выборки очень удобно использовать лишь
одно значение /такое как среднее  значение,  мода  или  медиана/,
этот подход легко может привести к неправильным выводам. Нетрудно
понять, что причина такого положения лежит не в самой величине, а
в том,  что одна величина никак не отражает разброс значений дан-
ных. Например, в выборке

         1 1 1 1 9 9 9 9

среднее значение равно 5.  Однако,  в самой выборке нет ни одного
элемента  со значением 5.  Возможно вам потребуется знать степень
близости каждого элемента выборки к ее  среднему  значению.  Или,
другими словами,  вам потребуется знать дисперсию значений.  Зная
степень изменения данных вы можете лучше интерпретировать среднее
значение,  медиану и моду. Степень изменения значений выборки оп-
ределяется путем вычисления их дисперсии и стандартного  отклоне-
ния.
     Дисперсия и квадратный корень из дисперсии, называемый стан-
дартным отклонением, характеризуют среднее отклонение от среднего
значения выборки.  Среди этих двух величин наиболее важное значе-
ние имеет стандартное отклонение.  Это значение можно представить
как среднее расстояние, на котором находятся элементы от среднего
элемента выборки.
     Дисперсию трудно   интерпретировать  содержательно.  Однако,
квадратный корень из этого значения является стандартным отклоне-
нием и хорошо поддается интерпретации. Стандартное отклонение вы-
числяется путем определения сначала дисперсии и затем  вычисления
квадратного корня из дисперсии.
     Например, для выборки

     11 20 40 30 99 30 50

будут получены следующие значения:

            D             D-M          (D-M)
           11             -29           841
           20             -20           400
           40              0            0
           30             -10           100
           99              59           3491
           30             -10           100
           50              10           100
Сумма      280              0           5022
Среднее
значение    40              0           717,42

     Здесь среднее значение квадратов разностей равно 717,42. Для
получения стандартного отклонения осталось лишь  взять квадратный
корень  из этого числа.  Результат составит приблизительно 26,78.
Следует помнить,  что стандартное отклонение интерпретируется как
среднее  расстояние,  на  котором  находятся элементы от среднего
значения выборки.
     Стандартное отклонение показывает,  насколько хорошо среднее
значение описывает всю выборку. Если вы являетесь владельцем кон-
фетной  фабрики и в полученном отчете говорится,  что дневной вы-
пуск за последний месяц составил 2500 упаковок,  но при стандарт-
ном отклонении в 2000,  то вы будете знать,  что производственная
линия требует лучшего управления.
     Если ваша выборка подчиняется стандартному нормальному зако-
ну распределения,  то около 68% значений выборки будут находиться
в рамках одного стандартного отклонения от  среднего  значения  и
около 95% будут находиться в рамках двух стандартных отклонений.
     Ниже приводится функция,  которая вычисляет стандартное отк-
лонение для заданной выборки:

    { вычислить стандартное отклонение }
    function StdDev(data: DataArray; num: integer):real;
    var
      t: integer;
      std, avg: real;

    begin
      avg:= mean(data, num);
      std := 0;
      for t := 1 to num do
       std := std+(data[t]-avg)*(data[t]-avg));

      std := std/num;
      StdDev := sqrt(std);
    end; { конец функции вычисления стандартного отклонения }

 
« Предыдущая статья   Следующая статья »