Энциклопедия Turbo Pascal. Главы 5-8
Страница 3. Выборки, генеральные совокупности, распределения вероятностей и переменные



Выборки, генеральные совокупности, распределения вероятностей и переменные

     Прежде чем перейти к статистическому анализу, следует позна-
комиться с некоторыми ключевыми понятиями.  Для получения статис-
тических данных сначала  берется  выборка  определенных  значений
данных,  на  основании  которой затем делаются обобщающие выводы.
Каждая выборка берется из генеральной совокупности,  представляю-
щей собой все возможные значения,  которые могут быть в исследуе-
мой ситуации. Например, если оценивать результаты работы фабрики,
выпускающей ящики, по данным выпуска только за каждую среду и де-
лая по ним вывод о выпуске за весь год,  то здесь выборка  предс-
тавляет  собой  данные  о  выпуске по всем средам года и является
частью генеральной совокупности данных о  ежедневном  выпуске  за
год.
     Выборка может совпадать с генеральной совокупностью и в этом
случае она будет исчерпывающей.  Для приведенного примера выборка
будет совпадать с генеральной совокупностью в том  случае,  когда
будут  использоваться данные о выпуске по всем пяти дням в неделю
в течение года.  Если выборка меньше генеральной совокупности, то
всегда результат может иметь ошибку. Однако, в большинстве случа-
ев можно определить вероятность этой ошибки. В этой главе предпо-
лагается,  что  выборка совпадает с генеральной совокупностью,  и
следовательно, такие ошибки не рассматриваются.
     При оценке  результатов выборов и проведении опросов общест-
венного мнения результаты относительно  небольшой  выборки  расп-
ространяются на все население.  Например, статистическую информа-
цию о курсе акций Дау Джонса можно использовать для  оценки курса
акций на всем рынке.  Конечно,  достоверность таких выводов может
меняться в широком диапазоне. В других случаях выборка, совпадаю-
щая или почти совпадающая с генеральной совокупностью,  использу-
ется для суммирования большого набора чисел и упрощения  обработ-
ки.  Например,  в  отчетах  органов образования обычно приводятся
средние оценки для класса вместо индивидуальных  оценок учащихся.
     Статистика зависит  от распределения случайных событий в ге-
неральной совокупности.  Из нескольких широко распространенных  в
природе  наиболее  важным  (и единственным рассматриваемым в этой
главе) является  нормальное  распределение.  Наиболее  вероятными
значениями  являются  средние значения.  И действительно,  график
этого распределения полностью симметричен относительно своей вер-
шины,  которая  представляет  также среднее значение.  Чем дальше
расстояние от среднего значения,  тем меньше вероятность события.
Многие ситуации в реальной жизни описываются нормальным распреде-
лением.
     В любом статистическом процессе имеется независимая перемен-
ная, которая является предметом изучения, и зависимая переменная,
которая является фактором,  влияющим на независимую переменную. В
этой  главе  в  качестве  зависимой переменной используется время
(как промежуток между соседними  событиями).  Например,  исследуя
курсы акций,  вы можете захотеть рассмотреть их изменения в тече-
ние дня.  Вам поэтому потребуется изучить изменения курса акций в
течение  заданного  периода без относительно к действительной ка-
лендарной дате.
     В этой  главе  будут  разработаны  отдельные  статистические
функции и затем они будут объединены в  одну  программу,  которая
работает  с помощью меню.  Эта программа может использоваться для
разнообразного статистического анализа. Она также может использо-
ваться для вывода графиков на экран.
     Элементы выборки в дальнейшем будут обозначаться буквой  D с
индексом от I до N, где N является номером последнего элемента.

 
« Предыдущая статья   Следующая статья »