) задач математической статистики .

Предположим, что имеется параметрическое семейство распределений вероятностей (для простоты будем рассматривать распределение случайных величин и случай одного параметра). Здесь - числовой параметр, значение которого неизвестно. Требуется оценить его по имеющейся выборке значений, порожденной данным распределением.

Различают два основных типа оценок: точечные оценки и доверительные интервалы .

Точечное оценивание

Точечное оценивание - это вид статистического оценивания, при котором значение неизвестного параметра приближается отдельным числом. То есть необходимо указать функцию от выборки (статистику)

,

значение которой будет рассматриваться в качестве приближения к неизвестному истинному значению .

К общим методам построения точечных оценок параметров относятся: метод максимального правдоподобия , метод моментов , метод квантилей .

Ниже приводятся некоторые свойства, которыми могут обладать или не обладать точечные оценки.

Состоятельность

Одно из самых очевидных требований к точечной оценке заключается в том, чтобы можно было ожидать достаточно хорошего приближения к истинному значению параметра при достаточно больших значениях объема выборки . Это означает, что оценка должна сходиться к истинному значению при . Это свойство оценки и называется состоятельностью . Поскольку речь идет о случайных величинах, для которых имеются разные виды сходимости, то и данное свойство может быть точно сформулировано по-разному:

Когда употребляют просто термин состоятельность , то обычно имеется в виду слабая состоятельность, т.е. сходимость по вероятности.

Условие состоятельности является практически обязательным для всех используемых на практике оценок. Несостоятельные оценки используются крайне редко.

Несмещенность и асимптотическая несмещенность

Оценка параметра называется несмещенной , если ее математическое ожидание равно истинному значению оцениваемого параметра:

.

Более слабым условием является асимптотическая несмещенность , которая означает, что математическое ожидание оценки сходится к истинному значению параметра с ростом объема выборки:

.

Несмещенность является рекомендуемым свойством оценок. Однако не следует слишком переоценивать его значимость. Чаще всего несмещенные оценки параметров существуют и тогда стараются рассматривать только их. Однако могут быть такие статистические задачи, в которых несмещенных оценок не существует. Наиболее известным примером является следующий: рассмотрим распределение Пуассона с параметром и поставим задачу оценки параметра . Можно доказать, что для этой задачи не существует несмещенной оценки.

Сравнение оценок и эффективность

Для сравнения между собой различных оценок одного и того же параметра применяют следующий метод: выбирают некоторую функцию риска , которая измеряет отклонение оценки от истинного значения параметра, и лучшей считают ту, для которой эта функция принимает меньшее значение.

Чаще всего в качестве функции риска рассматривают математическое ожидание квадрата отклонения оценки от истинного значения

Для несмещенных оценок это есть просто дисперсия .

Существует нижняя граница на данную функцию риска, называемая неравенство Крамера-Рао .

(Несмещенные) оценки, для которых достигается эта нижняя граница (т.е. имеющие минимально возможную дисперсию), называются эффективными . Однако существование эффективной оценки есть довольно сильное требование на задачу, которое имеет место далеко не всегда.

Более слабым является условие асимптотической эффективности , которое означает, что отношение дисперсии несмещенной оценки к нижней границе Крамера-Рао стремится к единице при .

Заметим, что при достаточно широких предположениях относительно исследуемого распределения, метод максимального правдоподобия дает асимптотически эффективную оценку параметра, а если существует эффективная оценка - тогда он дает эффективную оценку.

Достаточные статистики

Статистика назвается достаточной для параметра , если условное распределение выборки при условии того, что , не зависит от параметра для всех .

Важность понятия достаточной статистики обуславливается следующим утверждением . Если - достаточная статистика, а - несмещенная оценка параметра , тогда условное математическое ожидание является также несмещенной оценкой параметра , причем ее дисперсия меньше или равна дисперсии исходной оценки .

Напомним, что условное математическое ожидание есть случайная величина, являющаяся функцией от . Таким образом, в классе несмещенных оценок достаточно рассматривать только такие, которые являются функциями от достаточной статистики (при условии, что такая существует для данной задачи).

(Несмещенная) эффективная оценка параметра всегда является достаточной статистикой.

Можно сказать, что достаточная статистика содержит в себе всю информацию об оцениваемом параметре, которая содержится в выборке .

Распределения в математической статистике характеризуется многими статистическими параметрами. Оценка неизвестных параметров распределения на основе различных данных выборки позволяет построить распределения случайной величины.

Найти статистическую оценку неизвестного параметра распределения -- найти функцию от наблюдаемых случайных величин, которая даст приближенное значение оцениваемого параметра.

Статистические оценки можно разделить на несмещенные, смещенные, эффективные и состоятельные.

Определение 1

Несмещенная оценка -- статистическая оценка $Q^*$, которая при любом значении объема выборки, имеет математическое ожидание, равное оцениваемому параметру, то есть

Определение 2

Смещенная оценка -- статистическая оценка $Q^*$, которая при любом значении объема выборки, имеет математическое ожидание, не равное оцениваемому параметру, то есть

Определение 4

Состоятельная оценка -- статистическая оценка, при которой при объеме выборки, стремящейся к бесконечности, стремится по вероятности к оцениваемому параметру $Q.$

Определение 5

Состоятельная оценка -- статистическая оценка, при которой при объеме выборки, стремящейся к бесконечности, дисперсия несмещенной оценки стремится к нулю.

Генеральная и выборочная средние

Определение 6

Генеральная средняя -- среднее арифметическое значений вариант генеральной совокупности.

Определение 7

Выборочная средняя -- среднее арифметическое значений вариант выборочной совокупности.

Величины генерального и выборочного среднего можно найти по следующим формулам:

  1. Если значения вариант $x_1,\ x_2,\dots ,x_k$ имеют, соответственно, частоты $n_1,\ n_2,\dots ,n_k$, то
  1. Если значения вариант $x_1,\ x_2,\dots ,x_k$ различны, то

С этим понятием связано такое понятие как отклонение от средней. Данная величина находится по следующей формуле:

Среднее отклонение обладает следующими свойствами:

    $\sum{n_i\left(x_i-\overline{x}\right)=0}$

    Среднее значение отклонения равно нулю.

Генеральная, выборочная и исправленная дисперсии

Еще одними из основных параметров является понятие генеральной и выборочной дисперсии:

Генеральная дисперсия:

Выборочная дисперсия:

С этими понятия связаны также генеральная и выборочная средние квадратические отклонения:

В качестве оценки генеральной дисперсии вводится понятие исправленной дисперсии:

Также вводится понятие исправленного стандартного отклонения:

Пример решения задачи

Пример 1

Генеральная совокупность задана следующей таблицей распределения:

Рисунок 1.

Найдем для нее генеральное среднее, генеральную дисперсию, генеральное среднее квадратическое отклонение, исправленную дисперсию и исправленное среднее квадратическое отклонение.

Для решения этой задачи для начала сделаем расчетную таблицу:

Рисунок 2.

Величина $\overline{x_в}$ (среднее выборочное) находится по формуле:

\[\overline{x_в}=\frac{\sum\limits^k_{i=1}{x_in_i}}{n}\]

\[\overline{x_в}=\frac{\sum\limits^k_{i=1}{x_in_i}}{n}=\frac{87}{30}=2,9\]

Найдем генеральную дисперсию по формуле:

Генеральное среднее квадратическое отклонение:

\[{\sigma }_в=\sqrt{D_в}\approx 1,42\]

Исправленная дисперсия:

\[{S^2=\frac{n}{n-1}D}_в=\frac{30}{29}\cdot 2,023\approx 2,09\]

Исправленное среднее квадратическое отклонение.

План лекции:

    Понятие оценки

    Свойства статистических оценок

    Методы нахождения точечных оценок

    Интервальное оценивание параметров

    Доверительный интервал для математического ожидании при известной дисперсии нормально распределённой генеральной совокупности.

    Распределение хи-квадрат и распределение Стьюдента.

    Доверительный интервал для математического ожидании случайные величины, имеющей нормальное распределение при неизвестной дисперсии.

    Доверительный интервал для среднего квадратического отклонения нормального распределения.

Список литературы:

    Вентцель, Е.С. Теория вероятностей [Текст] / Е.С. Вентцель. – М.: Высшая школа, 2006. – 575 с.

    Гмурман, В.Е. Теория вероятностей и математическая статистика [Текст] / В.Е. Гмурман. - М.: Высшая школа, 2007. - 480 с.

    Кремер, Н.Ш. Теория вероятностей и математическая статистика [Текст] / Н.Ш. Кремер - М: ЮНИТИ, 2002. – 543 с.

П.1. Понятие оценки

Такие распределения, как биномиальное, показательное, нормальное, являются семействами распределений, зависящими от одного или нескольких параметров. Например, показательное распределение с плотностью вероятностей , зависит от одного параметра λ, нормальное распределение
- от двух параметровm и σ. Из условий исследуемой задачи, как правило, ясно, о каком семействе распределений идёт речь. Однако остаются неизвестными конкретные значения параметров этого распределения, входящие в выражения интересующих нас характеристик распределения. Поэтому необходимо знать хотя бы приближённое значение этих величин.

Пусть закон распределения генеральной совокупности определён с точностью до значений входящих в его распределение параметров
, часть из которых может быть известна. Одной из задач математической статистики является нахождение оценок неизвестных параметров по выборке наблюдений
из генеральной совокупности. Оценка неизвестных параметров заключается в построении функции
от случайной выборки, такой, что значение этой функции приближённо равно оцениваемому неизвестному параметруθ . Функция называетсястатистикой параметра θ .

Статистической оценкой (в дальнейшем просто оценкой ) параметраθ теоретического распределения называется его приближённое значение, зависящего от данных выбора.

Оценка является случайной величиной, т.к. является функцией независимых случайных величин
; если произвести другую выборку, то функция примет, вообще говоря, другое значение.

Существует два вида оценок – точечные и интервальные.

Точечной называется оценка, определяемая одним числом. При малом числе наблюдений эти оценки могут приводить к грубым ошибкам. Чтобы избежать их, используют интервальные оценки.

Интервальной называется оценка, которая определяется двумя числами – концами интервала, в котором с заданной вероятностью заключена оцениваемая величина θ .

П. 2 Свойства статистических оценок

Величину
называютточностью оценки . Чем меньше
, тем лучше, точнее определён неизвестный параметр.

К оценке любого параметра предъявляется ряд требований, которым она должна удовлетворять, чтобы быть «близкой» к истинному значению параметра, т.е. быть в каком-то смысле «доброкачественной» оценкой. Качество оценки определяют, проверяя, обладает ли она свойствами несмещённости, эффективности и состоятельности.

Оценка параметраθ называется несмещённой (без систематических ошибок), если математическое ожидание оценки совпадает с истинным значением θ :

. (1)

Если равенство (1) не имеет места, то оценка называетсясмещённой (с систематическими ошибками). Это смещение может быть связано с ошибками измерения, счёта или неслучайным характером выборки. Систематические ошибки приводят к завышению или занижению оценки.

Для некоторых задач математической статистики может существовать несколько несмещённых оценок. Обычно предпочтение отдают той, которая обладает наименьшим рассеянием (дисперсией).

Оценка называетсяэффективной , если она имеет наименьшую дисперсию среди всех возможных несмещённых оценок параметра θ .

Пусть D () – минимальная дисперсия, а
– дисперсия любой другой несмещённой оценкипараметраθ . Тогда эффективность оценки равна

. (2)

Ясно, что
. Чем ближе
к 1, тем эффективнее оценка. Если
при
, то оценка называетсяасимптотически эффективной .

Замечание : Если оценка смещённая, то малости её дисперсии ещё не говорит о малости её погрешности. Взяв, например, в качестве оценки параметраθ некоторое число , получим оценку даже с нулевой дисперсией. Однако в этом случае ошибка (погрешность)
может быть сколь угодно большой.

Оценка называетсясостоятельной , если с увеличением объема выборки (
) оценка сходится по вероятности к точному значению параметраθ , т.е. если для любого

. (3)

Состоятельность оценки параметраθ означает, что с ростом n объема выборки качество оценки улучшается.

Теорема 1. Выборочная средняя является несмещённой и состоятельной оценкой математического ожидания.

Теорема 2. Исправленная выборочная дисперсия является несмещённой и состоятельной оценкой дисперсии.

Теорема 3. Эмпирическая функция распределения выборки является несмещённой и состоятельной оценкой функции распределения случайной величины.

Тема 7. Статистические оценки параметров распределения: точечные и интервальные оценки

Смысл статистических методов заключается в том, чтобы по выборке ограниченного объема, то есть по некоторой части генеральной совокупности, высказать обоснованное суждение о ее свойствах целиком.

Естественно, что замена исследования генеральной совокупно­сти исследованием выборки порождает ряд вопросов:

1. В какой степени выборка отражает свойства генеральной совокупности, т. е. в какой степени выборка репрезентативна по отношению к генеральной совокупности?

2. Какую информацию о значениях параметров генеральной совокупности могут дать параметры выборки?

3. Можно ли утверждать, что полученные выборочным путем статистические характеристики (средние величины, дисперсия или любые другие производные величины) равны тем характе­ристикам, которые могут быть получены из генеральной сово­купности.

Проверка показывает, что значения параметров, полученных для разных выборок из одной генеральной совокупности, обыч­но не совпадают. Рассчитанные выборочным путем числовые значения параметров выборок являются лишь результатом при­ближенного статистического оценивания значений этих парамет­ров в генеральной совокупности. Статистическое оценивание, в силу изменчивости наблюдаемых явлений, позволяет получать только их приближенные значения.

Примечание. Строго говоря, в статистике оценка - это правило вычисления оцениваемого параметра, а термин оценить, т. е. провести оценивание, означает указать приближенное значе­ние.

Различают оценки точечные и оценки интервальные .

Точечная оценка параметров распределения

Пусть x 1 , x 2 , …, x n – выборка объема n из генеральной совокупности с функцией распределения F (x ).

Числовые характеристики этой выборки называются выборочными (эмпирическими ) числовыми характеристиками.

Отметим, что выборочные числовые характеристики являются характеристиками данной выборки, но не являются характеристиками распределения генеральной совокупности. Однако эти характеристики можно использовать для оценок параметров генеральной совокупности.

Точечной называют статистическую оценку, которая определяется одним числом.

Точечная оценка характеризуется свойствами: несмещенность, состоятельность и эффективность.

Несмещенной называют точечную оценку, математическое ожидание которой равно оцениваемому параметру при любом объеме выборки.

Точечная оценка называется состоятельной , если при неограниченном увеличении объема выборки (n ® ¥) она сходится по вероятности к истинному значению параметра, то есть стремится к истинному значению оцениваемого параметра генеральной совокупности.

Эффективной называют точечную оценку, которая (при заданном объеме выборки n ) имеет наименьшую возможную дисперсию, те есть гарантирует наименьшее отклонение выборочной оценки от такой же оценки генеральной совокупности..

В математической статистике показывается, что состоятельной, несмещенной оценкой генерального среднего значения а является выборочное средне:

где х i – варианта выборки, n i – частота варианты х i , – объем выборки.

Несмещенной оценкой генеральной дисперсии служит исправления выборочная дисперсия

,

Более удобна формула  .

Оценка s 2 для генеральной дисперсии является также и состоятельной, но не является эффективной. Однако в случае нормального распределения она является «асимптотически эффективной», то есть при увеличении n отношение ее дисперсии к минимально возможной неограниченно приближается к единице.

Итак, если дана выборка из распределения F (x ) случайной величины Х с неизвестным математическим ожиданием а и дисперсией s 2 , то для вычисления значений этих параметров мы имеем право пользоваться следующими приближенными формулами:

Точечные оценки имеют тот недостаток, что при малом объеме выборки могут значительно отличаться от оцениваемых параметров. Поэтому, чтобы получить представление о близости между параметром и его оценкой, в математической статистике вводятся, так называемые, интервальные оценки.

Доверительный интервал

Если при статистической обработке результатов требуется найти не только точечную оценку неизвестного параметра θ, но и охарактеризовать точность этой оценки, то находится доверительный интервал.

Доверительный интервал – это интервал, в котором заранее заданной доверительной вероятностью находится неизвестный параметр генеральной совокупности.

Доверительная вероятность – это вероятность, с которой неизвестный параметр генеральной совокупности принадлежит доверительному интервалу.

Длина доверительного интервала характеризует точность интервального оценивания и зависит от объема выборки и доверительной вероятности. При увеличении объема выборки длина доверит. интервала уменьшается (точность увеличивается), а при стремлении доверительной вероятности к 1 длина доверит. интервала увеличивается (точность уменьшается) Наряду с доверительной вероятностью р часто на практике используют уровень значимости α = 1 - p.

Обычно принимают р = 0,95 или (реже) 0,99. Эти вероятности признаны достаточными для уверенного суждения о генеральных параметрах на основании известных выборочных показателей.

Доверительный интервал для математического ожидания имеет вид: где S – СКО, - критическое значение распределения Стьюдента (Смотри ПРИЛОЖЕНИЕ 1 к Теме 7)

Вопросы статистической оценки связывают в единое целое такие проблемные аспекты математической статистики, как научная методология, случайные величины, статистические распределения и др. Для любой выборки присущи ошибки, обусловленные неполнотой охвата единиц, ошибками измерения и тому подобными причинами. Такие ошибки в реальной жизни придают каждой гипотезе (в частности, сформулированной на базе экономических выводов) случайный, стохастический характер. Независимо от количества переменных, предусмотренных теоретическими гипотезами, делается предположение, что влияние различных видов ошибок может быть достаточно точно описан с помощью только одной составляющей. Такой методологический подход позволяет ограничиться одномерным распределением вероятностей при одновременном оценивании нескольких параметров.

Статистическая оценка - это один из двух типов статистического суждения (второй тип - проверка гипотез). Она представляет собой особого рода метод суждения о числовых значения характеристик (параметров) распределения генеральной совокупности по данным выборки из этой совокупности. То есть, имея результаты выборочного наблюдения, мы пытаемся оценить (с наибольшей точностью) значения определенных параметров, от которых зависит распределение признака (сменной), которая нас интересует, в генеральной совокупности. Поскольку выборка включает только часть единиц генеральной совокупности (иногда очень малое их число), существует риск допустить ошибку. Несмотря на уменьшение такого риска с увеличением числа единиц наблюдения, он все же имеет место при выборочном наблюдении. Отсюда, принятым по результатам выборки решением предоставляют вероятностный характер. Но было бы неверным рассматривать статистические суждения только с позиций вероятностей. Такой подход не всегда оказывается достаточным для построения правильных теоретических предположений относительно параметров генеральной совокупности. Часто нужен еще ряд дополнительных суждений, которые бы обеспечили более глубокое обоснование. Например, нужно оценить с возможно большим приближением значения средней численности квалифицированных рабочих на предприятиях региона. При этом оценивается средняя арифметическая переменной х из генеральной совокупности, которая имеет нормальное распределение. Получив выборку по данному признаку в количестве п единиц, необходимо решить вопрос: какую величину по данным выборки необходимо принять как наиболее близкую к средней в генеральной совокупности? Таких величин, математическое ожидание которых равна искомому параметру (или близкое к нему), можно привести несколько: а) средняя арифметическая; б) мода; в) медиана; г) средняя, исчисленная по размаху вариации, и т.д.

С вероятностной точки зрения каждой из названных выше величин можно считать дают наилучшее приближение к искомому параметра генеральной совокупности (х), поскольку математическое ожидание каждой из этих функций (особенно для больших выборок) равна генеральной средней. Обусловлено такое предположение тем, что при многократном повторении выборки из той же генеральной совокупности будет получен "в среднем" верный результат.

Правильность "в среднем" объясняется равенством повторений положительных и отрицательных отклонений возникающих ошибок оценки генеральной средней, то есть средняя ошибка оценки будет равна нулю.

В практических условиях, как правило, организуют одну выборку, поэтому исследователя интересует вопрос о более точную оценку искомого параметра по результатам конкретной выборки. Для решения такой задачи, кроме выводов, которые вытекают непосредственно из отвлеченного вычисления вероятностей, нужны дополнительные правила мотивации наилучшего приближения оценки к искомому параметра генеральной совокупности.

Существует достаточное количество способов оценки констант по выборочным наблюдениям. Какие из них лучшие в решении конкретных задач исследования - занимается теория статистического оценивания. Она исследует условия, которым должна подчиняться та или иная оценка, ориентирует на оценки, более предпочтительны при данных обстоятельствах. Теория оценок указывает на превосходство одной оценки по сравнению с другой.

Как известно, информация, полученная на основе выборки, не носит категорического характера в заключении. Если, например, изучаемых 100 голов животных по их заболевания здоровыми оказались 99, то существует вероятность, что одно животное, которое осталось необследованной именно носит в себе вирус предполагаемого заболевания. Поскольку это маловероятно, делается вывод об отсутствии данного заболевания. В большинстве случаев такой вывод полностью оправдывается.

Руководствуясь подобными выводами в практической деятельности, экспериментатор (исследователь) опирается не на достоверность информации, а только на ее вероятность.

Другая сторона выборочного наблюдения, как уже отмечалось, решает задачи возможно более объективного определения степени надежности получаемых выборочных оценок. Решению этой задачи пытаются предоставить как можно более точный вероятностный выражение, то есть речь идет об определении степени точности оценки. Здесь исследователь определяет границы возможного расхождения между оценкой, полученной при выборке, и действительным значением ее величины в генеральной совокупности.

Точность оценки обусловлено способом ее расчета по данным выборки и способом отбора единиц в выборочную совокупность.

Способ получения оценок предполагает любую вычислительную процедуру (метод, правило, алгебраическую формулу). Это приоритет теории статистического оценивания. Способы отбора ведут к вопросам техники осуществления выборочного исследования.

Изложенное выше позволяет дать определение понятию "статистическая оценка".

Статистическая оценка - это приближенное значение искомого параметра генеральной совокупности, которое получено по результатам выборки и обеспечивает возможность принятия обоснованных решений о неизвестных параметры генеральной совокупности.

Предположим, что ^ "- статистическая оценка неизвестного параметра ^ теоретического распределения. По многократно осуществляемыми одинакового

Объем выборки из генеральной совокупности найдены оценки и 2 ^ ""п,

имеющих разные значения. Поэтому оценку ^ ", можно рассматривать как

случайную величину, а +17 две, 3 ~ "п - как ее возможные значения. Как случайная величина, она характеризуется определенной функцией плотности вероятностей. Поскольку эта функция обусловлена результатом выборочного наблюдения (эксперимента), то ее называют выборочным распределением. Такая функция описывает плотность вероятности для каждой из оценок, используя определенное число выборочных

наблюдений. Если предположить, что, статистическая оценка ^ ", - это алгебраическая функция от определенного набора данных и такой набор будет получен при осуществлении выборочного наблюдения, то в

общем виде оценка получит выражение: ® п = f (Xl.X2, ^ 3, ... Х т).

По окончании выборочного обследования данная функция уже не является оценкой общего вида, а принимает - конкретное значение, то есть становится количественной оценке (числом). Иначе говоря, из вышеприведенного выражения функции следует, что любой из показателей, характеризующих результаты выборочного наблюдения, можно считать оценкой. Выборочная средняя является оценкой генеральной средней. Рассчитана по выборке дисперсия или вычислено с нее значение среднего квадратического отклонения являются оценками соответствующих характеристик генеральной совокупности и т.д

Как уже отмечалось, расчет статистических оценок не гарантирует исключения ошибок. Суть заключается в том, что последние не должны быть систематическими. Наличие их должно носить случайный характер. Рассмотрим методологическую сторону этого положения.

Допустим, оценка ^ "дает неточное значение оценки ^ генеральной совокупности с недостатком. В этом случае каждое вычислено значение = 1,2,3, ..., п) будет меньше действительное значение величины $.

По этой причине математическое ожидание (среднее значение) случайной величины в будет меньше, чем в, то есть (М (^ п. И, наоборот, если дает оценку с избытком, то и математическое ожидание

случайной ^ "станет больше, чем $.

Отсюда следует, что использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, приводит к систематическим погрешностям, то есть до неслучайных ошибок, которые искривляют результаты измерений в одну сторону.

Возникает естественное требование: математическое ожидание оценки ^ "должно равняться оцениваемому параметру. Соблюдение этого требования не устраняет ошибок в целом, поскольку выборочные значения оценки могут быть больше или меньше действительного значения оценки генеральной совокупности. Но ошибки в один и другую сторону от значений ^ будут встречаться (согласно теории вероятностей) с одинаковой частотой. Следовательно, соблюдение этого требования, математическое ожидание выборочной оценки должно равняться оцениваемому параметру, исключает получение систематических (неслучайных) ошибок, то есть

М (в) = 6.

Выбор статистической оценки, которая дает наилучшее приближение оцениваемого параметра, представляет собой важную задачу в теории оценивания. Если известно, что распределение исследуемой случайной величины в генеральной совокупности соответствует закону нормального распределения, то по выборочным данным необходимо оценить математическое ожидание и среднее квадратическое отклонение. Объясняется это тем, что названные две характеристики полностью определяют основы, на которых построено нормальное распределение. Если исследуемая случайная величина распределена по закону Пуассона, оценивают параметр ^, поскольку он определяет это распределение.

Математическая статистика различает такие методы получения статистических оценок по выборочным данным: метод моментов, метод максимума правдоподобия.

При получении оценок методом моментов моменты генеральной совокупности заменяются моментами выборочной совокупности (вместо вероятностей при весе используют частоты).

Чтобы статистическая оценка давала "наилучшее приближение" к генеральной характеристики, она должна иметь ряд свойств. О них речь пойдет ниже.

Возможность выбора наилучшей оценки обусловлено знанием их основных свойств и умением классифицировать оценки по этим свойствам. В математической литературе "свойства оценок" иногда называют "требования к оценкам" или "критерии оценок" .В основных свойств статистических оценок относятся: Несмещенность, эффективность, способность, достаточность.

Если принять, что выборочная средняя (~) и выборочная дисперсия

(Ств) являются оценками соответствующих генеральных характеристик (^), то есть их математическим ожиданием, учитываем, что при большом количестве

единиц выборки названы характеристики (~) будут приближены к их математических ожиданий. Если же число единиц выборки небольшой, эти характеристики могут значительно отличаться от соответствующих математических ожиданий.

Если среднее значение выборочных характеристик, выбранных в качестве оценки, соответствует значению генеральной характеристики, оценка называется несмещенной. Доказательством того, что математическое ожидание выборочной средней равна генеральной средней (м (х) = х), свидетельствует о том, что величина ~ является несмещенной генеральной

средней. Иначе обстоит дело с избирательной дисперсией (o). ее

М (СТ 2) = - о-2. .

математическое ожидание п, не равна генеральной

дисперсии. Итак, а ч является смещенной оценкой а ". Чтобы устранить систематическую ошибку и получить несмещенную оценку, выборочную

дисперсию умножают на поправку п - 1 (это следует из образования

в 2 _ 2 п п - 1 "п -1

приведенного выше уравнения: п).

Таким образом, при немногочисленной выборке дисперсия равна:

2 Цх, - ~) 2 п Е (х и - ~) 2

сг в = х - = -.

п п - 1 п -1

Дробь (п - 1) называют поправкой Бесселя. Математик Бесселя первого установил, что выборочная дисперсия является смещенной оценкой генеральной дисперсии и применил указанную поправку для корректировки

оценок. Для малых выборок поправка (п - 1) значительно отличается от 1. С увеличением числа единиц наблюдения она быстро приближается к 1. При п <> 50 разница между оценками исчезает, то есть

° ~ "- .С всего вышесказанного вытекают следующие определения требований несмещенности.

Несмещенной называют статистическую оценку, математическое ожидание которой при любом объеме выборки равен значению

параметра генеральной совокупности, то есть м (^) = 9; м (х) = х.

Категорию "математическое ожидание" изучают в курсе теории вероятностей. Это числовая характеристика случайной величины. Математическое ожидание приближенно равно среднему значению случайной величины. Математическим ожидания дискретной случайной величины называют сумму произведений всех ее возможных значений на их вероятности. Допустим, выполнено п исследований, в которых случайная величина х приняла ш 1 раз значение ш 2 раз значение Ш и раз значение Х к. При этом Ш 1 + Ш 2 + Ш 3 + ... + Ш к = п. Тогда сумма всех значений, принятых х, равна

х 1 ш 1 + х 2 ш 2 + х 3 ш 3 + ... + х к ш к

Средняя арифметическая этих значений составит:

Х 1 ш 1 + х 2 ш 2 + х 3 ш 3 + ... + х к ш к - ш 1 ^ ш 2 ^ ш 3 ^ ^ ш к

п или 1 п 2 п 3 п 1 п.

Поскольку п - относительная частота ^ значение х ^ п - относительная частота значения х 2 и т.д., приведенное выше уравнение примет вид:

Х = Х 1 № 1 + Х 2 № 2 + Х 3 № 3 + ... + Х к Н> к

При большом количестве выборочных наблюдений относительная частота примерно равна вероятности появления события, то есть

и> 1 = Л; ^ 2 = Щ = ™ к = Рк а потому х 2 х 1 р 1 + х 2 р 2 + Х 3 г. 3 + ... + Х КРК. Тогда

х ~ м (х) вероятностный смысл полученного результата расчетов заключается в том, что математическое ожидание приближенно равно (тем точнее, чем больше выборка) среднему арифметическому наблюдаемых значений случайной величины [М (х -) = ~ 1.

Критерий несмещенности гарантирует отсутствие систематических ошибок в оценке параметров генеральной совокупности.

Заметим, что выборочная оценка (^) - случайная величина, значение которой может меняться от одной выборки к другой. Мере ее вариации (рассеивания) вокруг математического ожидания параметра генеральной совокупности # характеризует дисперсия ст2 (^).

Пусть в-и В - - две несмещенные оценки параметра ^, то есть М (в ") = 6 и М (д,) = в. Дисперсии их в 1 -) и в г ф -). С двух 0 эти нок В Арто отдать предпочтение той, которая имеет меньшее рассеивание вокруг оцениваемого параметра. Если дисперсия оценки ^ "меньше дисперсии

оценки Сп, то за оценку & принимается первая, то есть ^ ".

Несмещенная оценка ^, что имеет наименьшую дисперсию среди всех возможных несмещенных оценок параметра ^, вычисленных по выборкам одинакового объема, называется эффективной оценкой. Это - второе свойство (требование) статистических оценок параметров генеральной совокупности. Надо, помнить, что эффективная оценка параметра генеральной совокупности, подчиненной определенному закону распределения, не совпадает с эффективной оценкой параметра второго раздела.

При рассмотрении выборок большого объема статистические оценки должны иметь свойство способности. Оценка способна (применяется также термин "пригодна" или "согласована") означает, что чем больше объем выборки, тем больше вероятность того, что ошибка оценки не превысит сколько угодно малого положительного

числа Е. Оценка 6 параметра ^ называется состоятельной, если она подчиняется закону больших чисел, то есть выполняется следующее равенство:

/ шг | г в-в <Е} = 1.

Как видим, способной называют такую статистическую оценку, которая при п приближается по вероятности к оцениваемому параметра. Другими словами, это значение показателя, полученное по выборке и приближающегося (совпадает по вероятности) вследствие закона больших чисел при увеличении объема выборки к своему математического ожидания. Например, если дисперсия несмещенной оценки при п стремится к нулю, то такая оценка оказывается и состоятельной, поскольку имеет наименьшее возможное дисперсию (при заданном объеме выборки).

Способными оценкам являются:

1) доля признака в выборочной совокупности, то есть частость как оценка доли признака в генеральной совокупности;

2) выборочная средняя как оценка генеральной средней;

3) выборочная дисперсия как оценка генеральной дисперсии;

4) выборочные коэффициенты асимметрии и эксцесса как оценка генеральных коэффициентов.

В литературе по математической статистике почему-то не всегда можно встретить описание четвертой свойства статистических оценок -достатнисть. Оценка достаточное (или исчерпывающая) - это оценка, которая приводит (обеспечивает) полноту охвата всей выборочной информации о неизвестном параметр генеральной совокупности. Таким образом, достаточное оценка включает всю информацию, которая содержится в выборке по исследуемой статистической характеристики генеральной совокупности. Ни одна из рассматриваемых ранее трех оценок не может дать необходимых дополнительных сведений об исследуемом параметр, как достаточное статистическая оценка.

Следовательно, средняя арифметическая выборочная ~ является несмещенной оценкой средней арифметической генеральной х. Фактор несмещенности этой оценки показывает: если с генеральной совокупности взять большое количество случайных выборок, то их средние * <отличались бы от генеральной средней в большую и меньшую сторону одинаково, то есть, свойство несмещенности хорошей оценки также показывает, что среднее значение бесконечно большого числа выборочных средних равно значению генеральной средней.

В симметричных рядах распределения медиана является несмещенной оценкой генеральной средней. А при условии, что численность выборочной совокупности приближается к генеральной (П ~ * N), медиана может быть в таких рядах и состоятельной оценкой генеральной середньои.Що же касается критерия эффективности относительно медианы как оценки средней арифметической генеральной совокупности, можно доказать, что в выборках большого объема среднеквадратичная ошибка медианы (Стме) равен 1,2533 среднеквадратичной ошибки выборочной средней

). То есть Стме *. Поэтому медиана не может быть эффективной оценкой средней арифметической генеральной совокупности, поскольку ее средняя квадратическая ошибка больше средней квадратичной ошибки средней арифметической выборки. К тому же средняя арифметическая удовлетворяет условиям несмещенности и способности, а, следовательно, является лучшей оценкой.

Возможна и такая постановка. Может средняя арифметическая выборки быть несмещенной оценкой медианы в симметричных распределениях совокупности, для которой совпадают значения средней и медианы? И будет выборочная средняя состоятельной оценкой медианы генеральной совокупности? В обоих случаях ответ будет положительным. Для медианы генеральной совокупности (с симметричным распределением) средняя арифметическая выборки является несмещенной и согласованной оценкой.

Помня, что Стме ~ 1,2533ст й, приходим к выводу: средняя арифметическая выборки, а не медиана, более эффективной оценкой медианы исследуемой генеральной совокупности.

Каждая характеристика выборки не обязательно является лучшей оценкой соответствующей характеристики генеральной совокупности. Знание свойств оценок позволяет решать вопрос не только выбора оценок, но и их улучшения. В качестве примера можно рассмотреть случай, когда расчеты показывают, что значения средних квадратичных отклонений нескольких выборок из одной генеральной совокупности во всех случаях оказываются меньше среднего квадратичного отклонения генеральной совокупности, причем величина разницы обусловлена объемом выборки. Умножив значение среднего квадратического отклонения выборки на поправочный коэффициент, получим улучшенную оценку среднего квадратического отклонения генеральной совокупности. За такой поправочный коэффициент используют поправку Бесселя

п а I п

(П - 1), то есть для устранения смещения оценки получают "п - 1 .Такой числовое выражение показывает, что среднее квадратическое отклонение выборки, использовано как оценка, дает заниженное значение параметра генеральной совокупности.

Как известно, статистические характеристики выборочной совокупности является приблизительным оценкам неизвестных параметров генеральной совокупности. Сама оценка может иметь форму одного числа или какой-либо определенной точки. Оценка, которая определяется одним числом, называется точечной. Так, выборочная средняя (~) является несмещенной и наиболее эффективной точечной оценкой генеральной средней (х), а выборочная дисперсия) - смещенной точечной оценкой генеральной

дисперсии () .Если обозначить среднюю ошибку выборочной средней т <> то точечную оценку генеральной средней можно записать в виде х ± т °. Это означает, что ~ - оценка генеральной средней х с ошибкой, равной т ". Понятно, что точечные статистические оценки х и o не должны иметь систематической ошибки в

ooo ~~ o <в 2

сторону завышения или занижения оцениваемых параметров х и. Как было сказано ранее, оценки, которые удовлетворяют такое условие, называются

несмещенными. Что же представляет собой ошибка параметра т "? Это средняя из множества конкретных ошибок:

Точечная оценка параметра генеральной совокупности заключается в том, что с разных возможных выборочных оценок сначала избирается та, которая имеет оптимальные свойства, а затем вычисляется значение этой оценки. Полученное расчетное значение последней рассматривается как наилучшее приближение к неизвестному истинному значению параметра генеральной совокупности. Дополнительные расчеты, связанные с определением возможной ошибки оценки, не всегда обязательные (в зависимости от виришування задач оценки), но, как правило, осуществляются практически всегда.

Рассмотрим примеры определения точечной оценки для средней исследуемых признаков и для их доли в генеральной совокупности.

Пример. Посевы зерновых культур района составляют 20000 га. При 10% -ном выборочном обследовании полей получили такие выборочные характеристики: средняя урожайность - 30 ц с I га, дисперсия урожайности - 4, площадь посевов высокоурожайных культур - 1200 гектаров.

Что знать о величине показателя средней урожайности зерновых культур в районе и которое числовое значение показателя доли (удельного веса) высокоурожайных культур в общей площади зерновых исследуемого

региона? То есть необходимо дать оценку названным параметрам (х, г) в генеральной совокупности. Для расчета оценок имеем:

N = 20000; - = 20000 х 0,1 = 2000; ~ = 30; <т = л / 4; № 2000,

Как известно, избирательная средняя арифметическая является эффективной оценкой

генеральной средней арифметической. Таким образом, можно принять, что

лучшая оценка генерального параметра (^) является 30. Чтобы определить степень

точности оценки необходимо найти среднюю (стандартную) ее ошибку:

иа. п ~ И апреля 2000 ч ППЛ

т = Л - (1--) = - (1--) = 0,04

v п N и2000 2000 ^

Полученная величина ошибки свидетельствует о большой точности оценки. Значение т здесь означает, что при многократном повторении таких выборок ошибка оценки параметра составила бы в среднем 0,04. То есть за точечной

оценке средняя урожайность в хозяйствах района будет х = 30 - 0,04 ц с I га.

Для получения точечной оценки показателя доли посевов высокоурожайных культур зерновых в общей площади зерновых за лучшую оценку может быть принято показатель доли в выборке ¥ = 0,6. Таким образом, можно сказать, что по результатам наблюдений лучшей оценкой искомого показателя структуры будет число 0,6. Уточняя вычисления, следует рассчитать среднюю ошибку этой оценки: т и (1 _ п) и 0.6 (1 - 0.б) (1 = 0,01

v п N v 2000 2000 а

Как видим, средняя ошибка оценки генеральной характеристики равна 0,01.

Полученный результат означает, что если бы многократно повторить выборку с объемом в 2000 га зерновых, средняя ошибка принятой оценки доли (удельного веса) высокоурожайных культур в площади зерновых культур предприятий района была бы ± 0,01. В таком случае Р = 0,6 ± 0,01. В процентном выражении доля высокоурожайных культур в общей площади зерновых района составит в среднем 60 ± I.

Расчеты показывают, что для конкретного случая лучшей оценкой искомого показателя структуры будет число 0,6, а средняя ошибка оценки в той или иной сторону будет примерно равняться 0,01. Как видим, оценка достаточно точна.

Известно несколько способов точечной оценки среднего квадратического отклонения в случаях, когда выборка осуществлена из генеральной совокупности единиц с нормальным распределением и параметр в неизвестен. Простой (наиболее легкой в вычислениях) оценкой является размах вариации (и °) выборки, умноженный на поправочный коэффициент, взятый по стандартным таблицами и который зависит от объема выборки (для малых выборок). Параметр среднего квадратического отклонения в генеральной совокупности можно оценить с помощью вычисленной выборочной дисперсии с учетом числа степеней свободы. Корень квадратный из этой дисперсии дает величину, которая будет использована как оценка генерального среднеквадратичного отклонения).

Используя значение параметра в "вычисляют среднюю ошибку оценки генеральной средней (х ") способом, рассмотренным выше.

Как указывалось ранее, в соответствии с требованием способности уверенность в точности той или иной точечной оценки повышается при увеличении численности выборки. Продемонстрировать это теоретическое положение на примере точечной оценки несколько затруднено. Влияние объема выборки на точность оценки очевиден при исчислении интервальных оценок. О них речь пойдет ниже.

В таблице 39 приведены наиболее часто используемые точечные оценки параметров генеральной совокупности.

Таблица 39

Основные точечные оценки _

Вычисленные различными способами значения оценок могут быть неодинаковы по величине. В этой связи в практических расчетах следует заниматься не последовательным вычислением возможных вариантов, а, опираясь на свойства различных оценок, выбрать одну из них.

При малом количестве единиц наблюдений точечная оценка в значительной мере случайно, следовательно, мало надежная. Поэтому в малых выборках она может сильно отличаться от оцениваемой характеристики генеральной совокупности. Такое положение приводит к грубым ошибкам в выводах, которые распространяются на генеральную совокупность по результатам выборки. По этой причине при выборках малого объема пользуются интервальными оценками.

В отличие от точечной интервальная оценка дает диапазон точек, внутри которого должен находиться параметр генеральной совокупности. Кроме того, в интервальной оценке указывается вероятность, а, следовательно, она имеет важное значение в статистическом анализе.

Интервального называют оценку, которая характеризуется двумя числами - границами интервала, который охватывает (покрывает) оцениваемый параметр. Такая оценка представляет собой некоторый интервал, в котором с заданной вероятностью находится искомый параметр. Центром интервала принимается выборочная точечная оценка.

Таким образом, интервальные оценки является дальнейшим развитием точечного оценивания, когда такая оценка при малом объеме выборки неэффективна.

Задачу интервального оценивания в общем виде можно сформулировать так: по данным выборочного наблюдения необходимо построить числовой интервал, в отношении которого ранее выбранным уровнем вероятности можно утверждать, что в пределах данного интервала находится оцениваемый параметр.

Если взять достаточно большое количество единиц выборки, то, пользуясь теоремой Ляпунова, можно доказать вероятность того, что ошибка выборки не превысит некоторую заданную величину а, то есть

И ~ "*!" А или И № "г. йА.

В частности, эта теорема дает возможность оценивать погрешности приближенных равенств:

- "Р (п и - частота) х" х. п

Если ^ * 2Xз..., х - ~ независимые случайные величины и п, то вероятность их средней (х) находится в пределах от а до 6 и может быть определена уравнениями:

р (а (е) 1 е 2 сии,

- Е (х); _ в - Е (х) ДЕ ° а

Вероятность Р при этом называют доверительной вероятностью.

Таким образом, доверительной вероятностью (надежностью) оценки генерального параметра по выборочной оценке называют вероятности, с которой осуществляются неравенства:

| ~ Х | <а; | и, ориентир | <д

где а - предельная ошибка оценки, согласно средней и доли.

Границы, в которых с этой заданной вероятностью может находиться генеральная характеристика, называют доверительными интервалами (доверительными границами). А границы этого интервала получили название границ доверия.

Доверительные (или толерантные) границы - это границы, выход за пределы которых данной характеристикой вследствие случайных колебаний имеет незначительную вероятность (Л ^ 0,5; р 2 <0,01; Л <0,001). Понятие "доверительный интервал" введено Дж.Нейман и К.Пирсоном (1950 г.). Это установленный по выборочным данным интервал, который с заданной вероятностью (доверительной вероятностью) охватывает (покрывает) настоящее, но неизвестно для нас значение параметра. Если уровня доверительной вероятности принять значения 0,95, то эта вероятность свидетельствует о том, что при частых приложениях данного способа (метода) вычислений доверительный интервал примерно в 95% случаев будет покрывать параметр. Доверительный интервал генеральной средней и генеральной доли определяется на основе приведенных выше неравенств, из которых

следует, что ~ _А - х - ~ + А; № _А - г. - № + А.

В математической статистике надежность того или иного параметра оценивают по значению трех следующих уровней вероятности (иногда называют "пороги вероятности»): Л = 0,95; ^ 2 = 0,99; Р 3 = 0,999. Вероятности, которыми решено пренебречь, то есть а 1 = 0.05;; а 2 = 0.01; "3 = 0,001 называют уровнями значимости, или уровнями существенности. Из приведенных уровней надежные выводы обеспечивает вероятность Р 3 = 0,999. Каждому уровню доверительной вероятности соответствует определенное значение нормированного отклонения (см. табл. 27). Если нет в распоряжении стандартных таблиц значений интервала вероятностей, то эту вероятность можно вычислить с определенной степенью приближения по формуле:

Р (<) = - = ^ = 1 е "~ й и.

На рисунке 11 заштрихованы те части общей площади, ограниченной нормальной кривой и осью абсцисс, которые соответствуют значению <= ± 1; <= ± 2; <= и 3 и для которых вероятности равны 0,6287, 0,9545; 0,9973. При точечном оценке рассчитывается, как уже известно, средняя ошибка выборки, при интервальном - предельная.

В зависимости от принципов отбора единиц (повторного или без повторного) структурные формулы расчета ошибок выборки

различаются по величине поправки (N).

Рис. 11. Кривая нормального распределения вероятностей

В таблице 40 приведены формулы расчетов ошибок оценок генерального параметра.

Рассмотрим конкретный случай интервальной оценки параметров генеральной совокупности по данным выборочного наблюдения.

Пример. При выборочном обследовании хозяйств района установлено, что среднесуточный надой коров (х) составляет 10 кг. Доля чистопородного скота в общей численности поголовья составляет 80%. Ошибка выборки с доверительной вероятностью Р = 0,954 оказалась равной 0,2 кг; для частного чистопородного скота 1%.

Таким образом, границы, в которых может находиться генеральная средняя

производительность, будут 9,8 <х <10,2; для генеральной доли скота -79 <Р <81.

Вывод: с вероятностью 0,954 можно утверждать, что разница между избирательной средней продуктивностью коров и генеральной производительностью составляет 0,2 кг. Предел среднесуточного надоя - 9,8 и 10,2 кг. Доля (удельный вес) чистопородного скота в предприятиях района находится в пределах от 79 до 81%, ошибка оценки не превышает 1%.

Таблица 40

Расчет точечных и интервальных ошибок выборки

При организации выборки важное значение имеет определение необходимой ее численности (п). Последняя зависит от вариации единиц обследуемой совокупности. Чем больше коливнисть, тем больше должна быть численность выборки. Обратная связь между численностью выборки и ее предельной ошибкой. Стремление получить меньшую ошибку требует увеличения численности выборочной совокупности.

Необходимая численность выборки определяется на основе формул предельной ошибки выборки (д) с заданным уровнем вероятности (Р). Путем математических преобразований получают формулы расчета численности выборки (табл. 41).

Таблица 41

Расчет необходимой численности выборки _

Следует отметить, что все изложенное в отношении статистических оценок основывается на предположении, что выборочная совокупность, параметры которой используются при оценке, полученная с использованием метода (способа) отбора, который обеспечивает получение вероятностей выборки.

При этом, выбирая доверительную вероятность оценки, следует руководствоваться тем принципом, что выбор ее уровня не является математическим задачам, а определяется конкретно решаемой проблемой. В подтверждение сказанному рассмотрим пример.

Пример. Предположим, на двух предприятиях вероятность выпуска готовой (качественной) продукции равна Р = 0,999, то есть вероятность получения брака продукции составит а = 0,001. Можно ли в рамках математических соображений, не интересуясь характером продукции, решить вопрос о том, имела ли большая вероятность нехватки а = 0,001. Допустим, одно предприятие выпускает сеялки, а второе - самолеты для обработки посевов. Если на 1000 сеялок случится одна бракованная, то с этим можно мириться, потому что переплавка 0,1% сеялок дешевле, чем перестройка технологического процесса. Если же на 1000 самолетов встретится один бракованный, это, безусловно, приведет к серьезным последствиям при его эксплуатации. Итак, в первом случае вероятность получения брака а = 0,001 может приниматься, во втором случае - нет. По этой причине выбор доверительной вероятности в расчетах вообще и при исчислении оценок, в частности, следует осуществлять исходя из конкретных условий задачи.

В зависимости от задач исследования может возникнуть необходимость вычисления одной или двух доверительных границ. Если особенности решаемой задачи требуют установки только одной из границ, верхней или нижней, можно убедиться, что вероятность, с которой устанавливается эта граница будет выше, чем при указании обоих границ для одного и того же значения коэффициента доверия 1

Пусть доверительные границы установлены с вероятностью Р = 0,95, то есть,

в 95% случаев генеральная средняя (х) будет не меньше нижнего

доверительного интервала х ™ - х "м и не более верхнего доверительного

интервала Хверх - = х + В этом случае только с вероятностью а = 0,05 (или 5%) средняя генеральная может выйти за указанные границы. Поскольку распределение X симметричный, то половина из этого уровня

вероятности, то есть 2,5% будет приходиться на случай, когда х (х ™ -а вторая половина - на случай когда, х ^ х "^ -. Из этого следует, что вероятность того, что средняя генеральная может быть меньше, чем значение верхней

доверительной границы Хвеи "-, равна 0,975 (то есть 0,95 +0,025). Следовательно, создаются условия, когда при двух доверительных границах мы пренебрегаем

значением х как меньше х "" *., так и большими или Хеерх. Называя

только одну доверительную границу, например, Хверх., мы пренебрегаем только теми ~, превышающих эту границу. Для одного и того же значения коэффициента доверия X уровень значимости а здесь оказывается в два раза меньше.

Если рассчитываются только значение признака, которые превышают

(или наоборот не превышают) значения искомого параметра х, доверительный интервал называется односторонним. Если рассматриваемые значения ограничиваются с обеих сторон, доверительный интервал носит название двустороннего. Из сказанного выше следует, что гипотезы и ряд критериев, в частности критерий Х-Стьюдента, нужно рассматривать как односторонние и двусторонние. Поэтому при двусторонней гипотезе уровень значимости для одного и того же значения X будет в два раза больше, чем односторонняя. Если мы хотим при односторонней гипотезе оставить таким же уровень значимости (и уровень доверительной вероятности), как при двусторонней гипотезе, то величину X следует взять меньше. Эта особенность учтена при составлении стандартных таблиц критериев Х-Стьюдента (приложение 1).

Известно, что с практической стороны чаще представляют интерес не столько доверительные интервалы возможной величины генеральной средней, сколько те максимальные и минимальные величины, больше или меньше которых с заданной (доверительной) вероятностью генеральная средняя быть не может. В математической статистике их называют гарантированным максимумом и гарантированным минимумом средней. Обозначив названные параметры

соответственно через и х ™, можно записать: ХШ ™ = х +; хшип = х ~.

При исчислении гарантированных максимальных и минимальных значений генеральной средней, как границы одностороннего доверительного интервала в приведенных выше формулах, величина 1 берется как критерий односторонний.

Пример. По 20 участках выборки установлена средняя урожайность сахарной свеклы 300 н / га. Данная выборочная средняя характеризует соответствующий

параметр генеральной совокупности (х) с ошибкой 10 н / га. Согласно избирательности оценок генеральная средняя урожайность может быть как больше, так и меньше выборочной средней х = 300. С вероятностью Р = 0,95 можно утверждать, что искомый параметр не будет больше ХШ "= 300 +1,73 х10 = 317,3 ц / га.

Величина 1 взята для числа степеней свободы ^ = 20-1 при односторонней критической области и уровне значимости а = 0,05 (приложение 1). Итак, с вероятностью Р = 0,95 гарантированный максимально возможный уровень генеральной средней урожайности оценивается в 317 н / га, то есть при благоприятных условиях средняя урожайность сахарной свеклы не превышает указанной величины.

В некоторых отраслях знаний (например, в естественных науках) теория оценки уступает теории проверки статистических гипотез. В экономической науке методы статистической оценки играют очень важную роль в деле проверки надежности результатов исследований, а также в разного рода практических расчетах. Прежде всего это касается использования точечной оценки исследуемых статистических совокупностей. Выбор можно лучшей оценки - основная проблема точечной оценки. Возможность такого выбора обусловлена знанием основных свойств (требований) статистических оценок.