Расчет среднеквадратичного отклонения формула. Оценка дисперсии, среднеквадратичное отклонение

Дисперсия. Среднее квадратическое отклонение

Дисперсия - это средняя арифметическая квадратов отклонений каждого значения признака от общей средней. В зависимости от исходных данных дисперсия может быть невзвешенной (простой) или взвешенной.

Дисперсия рассчитывается по следующим формулам:

· для несгруппированных данных

· для сгруппированных данных

Порядок расчета дисперсии взвешенную:

1. определяют среднюю арифметическую взвешенную

2. определяются отклонения вариант от средней

3. возводят в квадрат отклонение каждой варианты от средней

4. умножают квадраты отклонений на веса (частоты)

5. суммируют полученные произведения

6. полученную сумму делят на сумму весов

Формула для определения дисперсии может быть преобразована в следующую формулу:

- простая

Порядок расчета дисперсии простой:

1. определяют среднюю арифметическую

2. возводят в квадрат среднюю арифметическую

3. возводят в квадрат каждую варианту ряда

4. находим сумму квадратов вариант

5. делят сумму квадратов вариант на их число, т.е. определяют средний квадрат

6. определяют разность между средним квадратом признака и квадратом средней

Также формула для определения дисперсии взвешенной может быть преобразована в следующую формулу:

т.е. дисперсия равна разности средней из квадратов значений признака и квадрата средней арифметической. При пользовании преобразованной формулой исключается дополнительная процедура по расчету отклонений индивидуальных значений признака от х и исключается ошибка в расчете, связанная с округлением отклонений

Дисперсия обладает рядом свойств, некоторые из них позволяют упростить ее вычисления:

1) дисперсия постоянной величины равна нулю;

2) если все варианты значений признака уменьшить на одно и то же число, то дисперсия не уменьшится;

3) если все варианты значений признака уменьшить в одно и то же число раз ( раз), то дисперсия уменьшится в раз

Среднее квадратичное отклонение S - представляет собой корень квадратный из дисперсии:

· для несгруппированных данных:

;

· для вариационного ряда:

Размах вариации, среднее линейное и среднее квадратичное отклонение являются величинами именованными. Они имеют те же единицы измерения, что и индивидуальные значения признака.

Дисперсия и среднее квадратическое отклонение наиболее широко применяемые показатели вариации. Объясняется это тем, что они входят в большинство теорем теории вероятности, служащей фундаментом математической статистики. Кроме того, дисперсия может быть разложена на составные элементы, позволяющие оценить влияние различных факторов, обусловливающих вариацию признака.

Расчет показателей вариации для банков, сгруппированных по размеру прибыли, показан в таблице.

Размер прибыли, млн. руб. Число банков расчетные показатели
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Итого: 121,70 17,640 23,126

Среднее линейное и среднее квадратичное отклонение показывают на сколько в среднем колеблется величина признака у единиц и исследуемой совокупности. Так, в данном случае средняя величина колеблености размера прибыли составляет: по среднему линейному отклонению 0,882 млн. руб.; по среднему квадратическому отклонению - 1,075 млн. руб. Среднее квадратическое отклонение всегда больше среднего линейного отклонения. Если распределение признака, близко к нормальному, то между S и d существует взаимосвязь: S=1,25d, или d=0,8S. Среднее квадратическое отклонение показывает как расположена основная масса единиц совокупности относительно средней арифметической. Независимо от формы распределения 75 значений признака попадают в интервал х 2S, а по крайне мере 89 всех значений попадают интервал х 3S (теорема П.Л.Чебышева).

Определяется как обобщающая характеристика размеров вариации признака в совокупности. Оно равно квадратному корню из среднего квадрата отклонений отдельных значений признака от средней арифметической, т.е. корень из и может быть найдена так:

1. Для первичного ряда:

2. Для вариационного ряда:

Преобразование формулы среднего квадратичного отклонени приводит ее к виду, более удобному для практических расчетов:

Среднее квадратичное отклонение определяет на сколько в среднем отклоняются конкретные варианты от их среднего значения, и к тому же является абсолютной мерой колеблемости признака и выражается в тех же единицах, что и варианты, и поэтому хорошо интерпретируется.

Примеры нахождения cреднего квадратического отклонения: ,

Для альтернативных признаков формула среднего квадратичного отклонения выглядит так:

где р - доля единиц в совокупности, обладающих определенным признаком;

q - доля единиц, не обладающих этим признаком.

Понятие среднего линейного отклонения

Среднее линейное отклонение определяется как средняя арифметическая абсолютных значений отклонений отдельных вариантов от .

1. Для первичного ряда:

2. Для вариационного ряда:

где сумма n - сумма частот вариационного ряда .

Пример нахождения cреднего линейного отклонения:

Преимущество среднего абсолютного отклонения как меры рассеивания перед размахом вариации, очевидно, так как эта мера основана на учете всех возможных отклонений. Но этот показатель имеет существенные недостатки. Произвольные отбрасывания алгебраических знаков отклонений могут привести к тому, что математические свойства этого показателя являются далеко не элементарными. Это сильно затрудняет использование среднего абсолютного отклонения при решении задач, связанных с вероятностными расчетами.

Поэтому среднее линейное отклонение как мера вариации признака применяется в статистической практике редко, а именно тогда, когда суммирование показателей без учета знаков имеет экономический смысл. С его помощью, например, анализируется оборот внешней торговли, состав работающих, ритмичность производства и т. д.

Среднее квадратическое

Среднее квадратическое применяется , например, для вычисления средней величины сторон n квадратных участков, средних диаметров стволов, труб и т. д. Она подразделяется на два вида.

Средняя квадратичная простая. Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменной сумму квадратов исходных величин, то средняя будет являться квадратичной средней величиной.

Она является квадратным корнем из частного от деления суммы квадратов отдельных значений признака на их число:

Средняя квадратичная взвешенная вычисляется по формуле:

где f - признак веса.

Средняя кубическая

Средняя кубическая применяется , например, при определении средней длины стороны и кубов. Она подразделяется на два вида.
Средняя кубическая простая:

При расчете средних величин и дисперсии в интервальных рядах распределения истинные значения признака заменяются центральными значениями интервалов, которые отличны от средней арифметической значений, включенных в интервал. Это приводит к возникновению систематической погрешности при расчете дисперсии. В.Ф. Шеппард определил, что погрешность в расчете дисперсии , вызванная применением сгруппированных данных, составляет 1/12 квадрата величины интервала как в сторону повышения, так и в сторону понижения величины дисперсии.

Поправка Шеппарда должна применяться, если распределение близко к нормальному, относится к признаку с непрерывным характером вариации, построено по значительному количеству исходных данных (n > 500). Однако исходя из того, что в ряде случаев обе погрешности, действуя в разных направлениях компенсируют друг друга, можно иногда отказаться от введения поправок.

Чем меньше значение дисперсии и среднего квадратического отклонения, тем однороднее совокупность и тем более типичной будет средняя величина.
В практике статистики часто возникает необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. Для таких сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией заработной платы, выраженной в рублях.

Для осуществления таких сравнений, а также сравнений колеблемости одного и того же признака в нескольких совокупностях с разными средним арифметическим используется относительный показатель вариации - коэффициент вариации.

Структурные средние

Для характеристики центральной тенденции в статистических распределениях не редко рационально вместе со средней арифметической использовать некоторое значение признака X, которое в силу определенных особенностей расположения в ряду распределения может характеризовать его уровень.

Это особенно важно тогда, когда в ряду распределения крайние значения признака имеют нечеткие границы. В связи с этим точное определение средней арифметической, как правило, невозможно, либо очень сложно. В таких случаях средний уровень можно определить, взяв, например, значение признака, которое расположено в середине ряда частот или которое чаще всего встречается в текущем ряду.

Такие значения зависят только от характера частот т. е. от структуры распределения. Они типичны по месту расположения в ряду частот, поэтому такие значения рассматриваются в качестве характеристик центра распределения и поэтому получили определение структурных средних. Они применяются для изучения внутреннего строения и структуры рядов распределения значений признака. К таким показателям относятся .

При статистической проверке гипотез, при измерении линейной взаимосвязи между случайными величинами.

Среднеквадратическое отклонение:

Стандартное отклонение (оценка среднеквадратического отклонения случайной величины Пол, стены вокруг нас и потолок,x относительно её математического ожидания на основе несмещённой оценки её дисперсии):

где - дисперсия ; - Пол, стены вокруг нас и потолок,i -й элемент выборки; - объём выборки; - среднее арифметическое выборки:

Следует отметить, что обе оценки являются смещёнными. В общем случае несмещённую оценку построить невозможно. Однако оценка на основе оценки несмещённой дисперсии является состоятельной .

Правило трёх сигм

Правило трёх сигм () - практически все значения нормально распределённой случайной величины лежат в интервале . Более строго - не менее чем с 99,7 % достоверностью значение нормально распределенной случайной величины лежит в указанном интервале (при условии, что величина истинная, а не полученная в результате обработки выборки).

Если же истинная величина неизвестна, то следует пользоваться не , а Пол, стены вокруг нас и потолок,s . Таким образом, правило трёх сигм преобразуется в правило трёх Пол, стены вокруг нас и потолок,s .

Интерпретация величины среднеквадратического отклонения

Большое значение среднеквадратического отклонения показывает большой разброс значений в представленном множестве со средней величиной множества; маленькое значение, соответственно, показывает, что значения в множестве сгруппированы вокруг среднего значения.

Например, у нас есть три числовых множества: {0, 0, 14, 14}, {0, 6, 8, 14} и {6, 6, 8, 8}. У всех трёх множеств средние значения равны 7, а среднеквадратические отклонения, соответственно, равны 7, 5 и 1. У последнего множества среднеквадратическое отклонение маленькое, так как значения в множестве сгруппированы вокруг среднего значения; у первого множества самое большое значение среднеквадратического отклонения - значения внутри множества сильно расходятся со средним значением.

В общем смысле среднеквадратическое отклонение можно считать мерой неопределенности. К примеру, в физике среднеквадратическое отклонение используется для определения погрешности серии последовательных измерений какой-либо величины. Это значение очень важно для определения правдоподобности изучаемого явления в сравнении с предсказанным теорией значением: если среднее значение измерений сильно отличается от предсказанных теорией значений (большое значение среднеквадратического отклонения), то полученные значения или метод их получения следует перепроверить.

Практическое применение

На практике среднеквадратическое отклонение позволяет определить, насколько значения в множестве могут отличаться от среднего значения.

Климат

Предположим, существуют два города с одинаковой средней максимальной дневной температурой, но один расположен на побережье, а другой внутри континента. Известно, что в городах, расположенных на побережье, множество различных максимальных дневных температур меньше, чем у городов, расположенных внутри континента. Поэтому среднеквадратическое отклонение максимальных дневных температур у прибрежного города будет меньше, чем у второго города, несмотря на то, что среднее значение этой величины у них одинаковое, что на практике означает, что вероятность того, что максимальная температура воздуха каждого конкретного дня в году будет сильнее отличаться от среднего значения, выше у города, расположенного внутри континента.

Спорт

Предположим, что есть несколько футбольных команд, которые оцениваются по некоторому набору параметров, например, количеству забитых и пропущенных голов, голевых моментов и т. п. Наиболее вероятно, что лучшая в этой группе команда будет иметь лучшие значения по большему количеству параметров. Чем меньше у команды среднеквадратическое отклонение по каждому из представленных параметров, тем предсказуемее является результат команды, такие команды являются сбалансированными. С другой стороны, у команды с большим значением среднеквадратического отклонения сложно предсказать результат, что в свою очередь объясняется дисбалансом, например, сильной защитой, но слабым нападением.

Использование среднеквадратического отклонения параметров команды позволяет в той или иной мере предсказать результат матча двух команд, оценивая сильные и слабые стороны команд, а значит, и выбираемых способов борьбы.

Технический анализ

См. также

Литература

* Боровиков, В. STATISTICA. Искусство анализа данных на компьютере: Для профессионалов / В. Боровиков. - СПб. : Питер, 2003. - 688 с. - ISBN 5-272-00078-1 .

Для расчетов средней геометрической простой используется формула:

Геометрическая взвешенная

Для определения средней геометрической взвешенной применяется формула:

редние диаметры колес, труб, средние стороны квадратов определяются при помощи средней квадратической.

Среднеквадратические величины используются для расчета некоторых показателей, например коэффициент вариации, характеризующего ритмичность выпуска продукции. Здесь определяют среднеквадратическое отклонение от планового выпуска продукции за определенный период по следующей формуле:

Эти величины точно характеризуют изменение экономических показателей по сравнению с их базисной величиной, взятое в его усредненной величине.

Квадратическая простая

Средняя квадратическая простая вычисляется по формуле:

Квадратическая взвешенная

Средняя квадратическая взвешенная равна:

22. Абсолютные показатели вариации включают:

размах вариации

среднее линейное отклонение

дисперсию

среднее квадратическое отклонение

Размах вариации (r)

Размах вариации - это разность между максимальным и минимальным значениями признака

Он показывает пределы, в которых изменяется величина признака в изучаемой совокупности.

Опыт работы у пяти претендентов на предшествующей работе составляет: 2,3,4,7 и 9 лет. Решение: размах вариации = 9 - 2 = 7 лет.

Для обобщенной характеристики различий в значениях признака вычисляют средние показатели вариации, основанные на учете отклонений от средней арифметической. За отклонение от средней принимается разность .

При этом во избежании превращения в нуль суммы отклонений вариантов признака от средней (нулевое свойство средней) приходится либо не учитывать знаки отклонения, то есть брать эту сумму по модулю , либо возводить значения отклонений в квадрат

Среднее линейное и квадратическое отклонение

Среднее линейное отклонение - этосредняя арифметическая из абсолютных отклонений отдельных значений признака от средней.

Среднее линейное отклонение простое:

Опыт работы у пяти претендентов на предшествующей работе составляет: 2,3,4,7 и 9 лет.

В нашем примере: лет;

Ответ: 2,4 года.

Среднее линейное отклонение взвешенное применяется для сгруппированных данных:

Среднее линейное отклонение в силу его условности применяется на практике сравнительно редко (в частности, для характеристики выполнения договорных обязательств по равномерности поставки; в анализе качества продукции с учетом технологических особенностей производства).

Среднее квадратическое отклонение

Наиболее совершенной характеристикой вариации является среднее квадратическое откложение, которое называют стандартом (или стандартным отклонение). Среднее квадратическое отклонение () равно квадратному корню из среднего квадрата отклонений отдельных значений признака отсредней арифметической:

Среднее квадратическое отклонение простое:

Среднее квадратическое отклонение взвешенное применяется для сгруппированных данных:

Между средним квадратическим и средним линейным отклонениями в условиях нормального распределения имеет место следующее соотношение: ~ 1,25.

Среднее квадратическое отклонение, являясь основной абсолютной мерой вариации, используется при определении значений ординат кривой нормального распределения, в расчетах, связанных с организацией выборочного наблюдения и установлением точности выборочных характеристик, а также при оценке границ вариации признака в однородной совокупности.

Программа Excel высоко ценится как профессионалами, так и любителями, ведь работать с нею может пользователь любого уровня подготовки. Например, каждый желающий с минимальными навыками «общения» с Экселем может нарисовать простенький график, сделать приличную табличку и т.д.

Вместе с тем, эта программа даже позволяет выполнять различного рода расчеты, к примеру, расчет , но для этого уже необходим несколько иной уровень подготовки. Впрочем, если вы только начали тесное знакомство с данной прогой и интересуетесь всем, что поможет вам стать более продвинутым юзером, эта статья для вас. Сегодня я расскажу, что собой представляет среднеквадратичное отклонение формула в excel, зачем она вообще нужна и, собственно говоря, когда применяется. Поехали!

Что это такое

Начнем с теории. Средним квадратичным отклонением принято называть квадратный корень, полученный из среднего арифметического всех квадратов разностей между имеющимися величинами, а также их средним арифметическим. К слову, эту величину принято называть греческой буквой «сигма». Стандартное отклонение рассчитывается по формуле СТАНДОТКЛОН, соответственно, программа делает это за пользователя сама.

Суть же данного понятия заключается в том, чтобы выявить степень изменчивости инструмента, то есть, это, в своем роде, индикатор родом из описательной статистики. Он выявляет изменения волатильности инструмента в каком-либо временном промежутке. С помощью формул СТАНДОТКЛОН можно оценить стандартное отклонение при выборке, при этом логические и текстовые значения игнорируются.

Формула

Помогает рассчитать среднее квадратичное отклонение в excel формула, которая автоматически предусмотрена в программе Excel. Чтобы ее найти, необходимо найти в Экселе раздел формулы, а уже там выбрать ту, которая имеет название СТАНДОТКЛОН, так что очень просто.

После этого перед вами появится окошко, в котором нужно будет ввести данные для вычисления. В частности, в специальные поля следует вписать два числа, после чего программа сама высчитает стандартное отклонение по выборке.

Бесспорно, математические формулы и расчеты – вопрос достаточно сложный, и не все пользователи с ходу могут с ним справиться. Тем не менее, если копнуть немного глубже и чуть более детально разобраться в вопросе, оказывается, что не все так уж и печально. Надеюсь, на примере вычисления среднеквадратичного отклонения вы в этом убедились.

Видео в помощь



Понравилась статья? Поделитесь ей
Наверх