Энциклопедия Turbo Pascal. Главы 5-8
Страница 8. Применение среднего значения, медианы и моды


Применение среднего значения, медианы и моды

 

     Среднее значение,  медиана и мода служат одной цели, а имен-
но,  обеспечению одного значения, обобщающего все значения выбор-
ки. Однако, каждое из них представляет выборку по разному. Обычно
чаще  всего используется среднее значение выборки.  Поскольку при
вычислении среднего значения делается суммирование  всех значений
выборки, оно является действительно отражением всех элементов вы-
борки.  Основным недостатком среднего значения является  чувстви-
тельность к одному экстремальному значению. Например, пусть в не-
кой фирме "Уидгeт" заработок владельца составляет 100000 долларов
в  год,  а  заработок каждого из девяти рабочих составляет 10 000
долларов в год. Средний заработок в этой фирме будет равен 19 000
долларов в год, однако эта цифра недостаточно правильно описывает
ситуацию в фирме.
     В случаях,  аналогичных  описанному,  иногда вместо среднего
значения используется мода. Мода заработков в фирме "Уидгeт" рав-
на 10 000 долларов в год и эта цифра более правильно отражает ре-
альную ситуацию в фирме.  Однако, мода также может вводить в заб-
луждение.   Пусть   некоторая   автомобильная   фирма  производит
автомобили пяти различных цветов.  За некоторую неделю было полу-
чено
     - 100 зеленых автомобилей;
     - 100 оранжевых автомобилей;
     - 150 синих автомобилей;
     - 200 черных автомобилей;
     - 190 белых автомобилей.

     Здесь модой  выборки  являются черные автомобили,  поскольку
было произведено 200 черных автомобилей,  что превышает число ав-
томобилей любого другого цвета.  Однако, неправильно делать вывод
о том,  что автомобильная фирма производит в основном  автомобили
черного цвета.
     Медиана представляет интерес для тех случаев, когда оправда-
но предположение о нормальном распределении.  Например,  если вы-
борка представляет собой следующий набор:

     1 2 3 4 5 6 7 8 9 10

то медианой будет 5 или 6,  а среднее значение 5,5. В этом случае
медиана близка к среднему значению. Однако, в следующей выборке

    1 1 1 1 5 100 100 100 100

медиана по-прежнему  равна  5,  а среднее значение приблизительно
равно 46.
     В определенных случаях ни среднее значение,  ни медиана,  ни
мода не могут дать достоверную картину.  Это приводит к использо-
ванию  двух  наиболее важных статистических величин - дисперсии и
стандартного отклонения.

 
« Предыдущая статья   Следующая статья »