Описательная статистика
О назначении описательной статистики можно судить по ее названию: она имеет дело с числами, характеризующими ту или иную интересующую нас ситуацию. Вот примеры статистической информации: • уровень преступности в регионе; Ценность описательной статистики заключается прежде всего в том, что она дает сжатую и концентрированную характеристику изучаемого явления. Рассмотрим следующий пример. Пусть на некотором предприятии работает 1500 человек. Бухгалтерская ведомость на зарплату довольно большая. Информация о том, что средняя месячная зарплата работников этого предприятия составляет 8200 рублей, дает определенное, хотя и неполное представление об уровне заработной платы на этом предприятии. Предмет исследований во многих сферах отличается исключительной сложностью, изменчивостью, индивидуальным многообразием явлений и процессов. Эти процессы происходят неоднозначно. Поэтому применение одинаковых подходов, средств, технологий дает в каждом конкретном случае различные результаты в зависимости от субъективных факторов, от обстоятельств, которые нельзя контролировать и которые влияют на протекание процесса. Неоднозначность протекания процесса порождается наличием присущего ему случайного. Но это не означает отсутствие общих закономерностей в изучаемых процессах и явлениях. Например, невысокая скорость чтения у отдельного учащегося является случайным событием, но у ученика, любящего читать, она встречается существенно реже, чем у того, кто редко берет книгу в руки. Эта устойчивость появления тех или других случайных событий уже является закономерностью. Информационная функция описательной статистики состоит из сбора, обобщения и представления всем заинтересованным лицам достоверной, своевременной информации об исследуемом явлении. В связи с тем, что иногда исследованию подлежат тысячи объектов, необходимым является переход от сплошного изучения к выборочному по многим показателям. Поэтому важное значение приобретают технологии сбора, обработки и анализа данных, которые позволяют использовать информационные возможности частичных первоначальных данных для разработки обобщенной информации о том или ином процессе. 2) Теория оценивания Статистическое оценивание совокупность способов, употребляемых в математической статистике (См. Математическая статистика) для приближённого определения неизвестных распределений вероятностей (или каких-либо их характеристик) по результатам наблюдений. В наиболее распространённом случае независимых наблюдений их результаты образуют последовательность X1, X2,..., Xn,... (1) независимых случайных величин (См. Случайная величина) (или векторов), имеющих одно и то же (неизвестное) Распределение вероятностей с функцией распределения F (x). Часто предполагают, что функция F (x) зависит неизвестным образом от одного или нескольких параметров и определению подлежат лишь значения самих этих параметров [например, значительная часть теории, особенно в многомерном случае, развита в предположении, что неизвестное распределение является нормальным распределением (См. Нормальное распределение), у которого все параметры или какая-либо часть их неизвестны (см. Статистический анализ многомерный)]. Два основных вида С. о. — т. н. точечное оценивание и оценивание с помощью доверительных границ (См. Доверительные границы). В первом случае в качестве приближённого значения для неизвестной характеристики выбирают какую-либо одну функцию от результатов наблюдений, во втором — указывают интервал значений, с высокой вероятностью «накрывающий» неизвестное значение этой характеристики. В более общих случаях интервалы, образуемые доверительными границами (доверительные интервалы), заменяются более сложными доверительными множествами. О С. о. функции распределения F (x) см. Непараметрические методы в математической статистике; о С. о. параметров см. Статистические оценки. Разработаны также методы С. о. и для случая, когда результаты наблюдений (1) зависимы, и для случая, когда индекс n заменяется непрерывно меняющимся аргументом t, т. е. для случайных процессов (См. Случайный процесс). В частности, широко используется С. о. таких характеристик случайных процессов, как корреляционная функция и спектральная функция. В связи с задачами регрессионного анализа (См. Регрессионный анализ) был развит новый метод С. о. — Стохастическая аппроксимация. При классификации и сравнении способов С. о. исходят из ряда принципов (таких, как состоятельность, несмещенность, инвариантность и др.), которые в их наиболее общей форме рассматривают в Статистических решений теории (См. Статистических решений теория). Лит.: Крамер Г., Математические методы статистики, пер. с англ., 2 изд., М., 1975; Рао С. Р., Линейные статистические методы и их применения, пер. с англ., М., 1968.
|