Страница 3 из 37
Выборки, генеральные совокупности, распределения вероятностей и переменные Прежде чем перейти к статистическому анализу, следует позна- комиться с некоторыми ключевыми понятиями. Для получения статис- тических данных сначала берется выборка определенных значений данных, на основании которой затем делаются обобщающие выводы. Каждая выборка берется из генеральной совокупности, представляю- щей собой все возможные значения, которые могут быть в исследуе- мой ситуации. Например, если оценивать результаты работы фабрики, выпускающей ящики, по данным выпуска только за каждую среду и де- лая по ним вывод о выпуске за весь год, то здесь выборка предс- тавляет собой данные о выпуске по всем средам года и является частью генеральной совокупности данных о ежедневном выпуске за год. Выборка может совпадать с генеральной совокупностью и в этом случае она будет исчерпывающей. Для приведенного примера выборка будет совпадать с генеральной совокупностью в том случае, когда будут использоваться данные о выпуске по всем пяти дням в неделю в течение года. Если выборка меньше генеральной совокупности, то всегда результат может иметь ошибку. Однако, в большинстве случа- ев можно определить вероятность этой ошибки. В этой главе предпо- лагается, что выборка совпадает с генеральной совокупностью, и следовательно, такие ошибки не рассматриваются. При оценке результатов выборов и проведении опросов общест- венного мнения результаты относительно небольшой выборки расп- ространяются на все население. Например, статистическую информа- цию о курсе акций Дау Джонса можно использовать для оценки курса акций на всем рынке. Конечно, достоверность таких выводов может меняться в широком диапазоне. В других случаях выборка, совпадаю- щая или почти совпадающая с генеральной совокупностью, использу- ется для суммирования большого набора чисел и упрощения обработ- ки. Например, в отчетах органов образования обычно приводятся средние оценки для класса вместо индивидуальных оценок учащихся. Статистика зависит от распределения случайных событий в ге- неральной совокупности. Из нескольких широко распространенных в природе наиболее важным (и единственным рассматриваемым в этой главе) является нормальное распределение. Наиболее вероятными значениями являются средние значения. И действительно, график этого распределения полностью симметричен относительно своей вер- шины, которая представляет также среднее значение. Чем дальше расстояние от среднего значения, тем меньше вероятность события. Многие ситуации в реальной жизни описываются нормальным распреде- лением. В любом статистическом процессе имеется независимая перемен- ная, которая является предметом изучения, и зависимая переменная, которая является фактором, влияющим на независимую переменную. В этой главе в качестве зависимой переменной используется время (как промежуток между соседними событиями). Например, исследуя курсы акций, вы можете захотеть рассмотреть их изменения в тече- ние дня. Вам поэтому потребуется изучить изменения курса акций в течение заданного периода без относительно к действительной ка- лендарной дате. В этой главе будут разработаны отдельные статистические функции и затем они будут объединены в одну программу, которая работает с помощью меню. Эта программа может использоваться для разнообразного статистического анализа. Она также может использо- ваться для вывода графиков на экран. Элементы выборки в дальнейшем будут обозначаться буквой D с индексом от I до N, где N является номером последнего элемента.
|