Среднее абсолютное отклонение позволяет решить проблему, заключающуюся в том, что сумма отклонений от среднего равна нулю. Для этого при расчете среднего используется абсолютное значение отклонений.
Второй подход к расчету отклонений состоит в их возведении в квадрат.
Дисперсия и стандартное отклонение, основанные на квадрате отклонений, являются двумя наиболее широко используемыми мерами дисперсии:
Далее обсуждается расчет и использования дисперсии и стандартного отклонения.
Дисперсия генеральной совокупности.
Если нам известен каждый элемент генеральной совокупности, мы можем вычислить дисперсию генеральной совокупности или просто дисперсию (англ. ‘population variance’).
Она обозначается символом σ 2 [сигма] и представляет собой среднее арифметическое квадратов отклонений от среднего значения.
Формула дисперсии генеральной совокупности.
Зная среднее значение μ, мы можем использовать Формулу 11 для вычисления суммы квадратов отклонений от среднего с учетом всех N элементов в генеральной совокупности, а затем для определения среднего квадратов отклонений путем деления этой суммы на N.
Независимо от того, является ли отклонение от среднего положительным или отрицательным, возведение в квадрат этой разности дает положительное число.
Таким образом, дисперсия решает проблему отрицательных отклонений от среднего значения, устраняя их посредством операции возведения в квадрат этих отклонений.
Рассмотрим пример.
Прибыль в процентах от выручки для оптовых клубов BJ’s Wholesale Club, Costco и Walmart за 2012 год составляла 0.9%, 1.6% и 3.5% соответственно. Мы рассчитали среднюю прибыль в процентах от выручки как 2.0%.
Следовательно, дисперсия прибыли в процентах от выручки составляет:
Стандартное отклонение генеральной совокупности.
Поскольку дисперсия измеряется в квадратах, нам нужен способ вернуться к исходным единицам. Мы можем решить эту проблему, используя стандартное отклонение, т.е. квадратный корень из дисперсии.
Стандартное отклонение легче интерпретировать, чем дисперсию, поскольку стандартное отклонение выражается в той же единице измерения, что и наблюдения.
Формула стандартного отклонения генеральной совокупности.
Стандартное отклонение генеральной совокупности (или просто стандартное отклонение, а также среднеквадратическое отклонение, от англ. ‘population standard deviation’), определяемое как положительный квадратный корень из дисперсии генеральной совокупности, составляет:
Используя пример прибыли в процентах от выручки для оптовых клубов BJ’s Wholesale Club, Costco и Walmart за 2012 год, в соответствии с Формулой 12, мы вычислим дисперсию 1.21, а затем возьмем квадратный корень: \( \sqrt <1.21>\) = 1.10.
Как дисперсия, так и стандартное отклонение являются примерами параметров распределения. В последующих чтениях мы введем понятие дисперсии и стандартного отклонения как меры риска.
Занимаясь инвестициями, мы часто не знаем среднего значения интересующей совокупности, обычно потому, что мы не можем практически идентифицировать или провести измерения для каждого элемента генеральной совокупности.
Поэтому мы рассчитываем среднее значение по генеральной совокупности и среднее выборки, взятой из совокупности, и вычисляем выборочную дисперсию или стандартное отклонение выборки, используя формулы, немного отличающиеся от Формул 11 и 12.
Мы обсудим эти вычисления далее.
Однако в инвестициях у нас иногда есть определенная группа, которую мы можем считать генеральной совокупностью. Для четко определенных групп наблюдений мы используем Формулы 11 и 12, как в следующем примере.
Пример расчета стандартного отклонения для генеральной совокупности.
В Таблице 20 представлен годовой оборот портфеля из 12 фондов акций США, которые вошли в список Forbes Magazine Honor Roll 2013 года.
Журнал Forbes ежегодно выбирает американские взаимные фонды, отвечающие определенным критериям для своего почетного списка Honor Roll.
Оборачиваемость или оборот портфеля, показатель торговой активности, является меньшим значением из стоимости продаж или покупок за год, деленным на среднюю чистую стоимость активов за год. Количество и состав списка Forbes Honor Roll меняются из года в год.
Таблица 20. Оборот портфеля: взаимные фонды Forbes Honor Roll за 2013 год.
Годовой оборот портфеля (%)
CGM Focus Fund (CGMFX)
Hotchkis And Wiley Small Cap Value A Fund (HWSAX)
Aegis Value Fund (AVALX)
Delafield Fund (DEFIX)
Homestead Small Company Stock Fund (HSCSX)
Robeco Boston Partners Small Cap Value II Fund (BPSCX)
Hotchkis And Wiley Mid Cap Value A Fund (HWMAX)
T Rowe Price Small Cap Value Fund (PRSVX)
Guggenheim Mid Cap Value Fund Class A (SEVAX)
Wells Fargo Advantage Small Cap Value Fund (SSMVX)
Stratton Small-Cap Value Fund (STSCX)
Основываясь на данных из таблицы 20, сделайте следующее:
Установив, что μ = 53%, мы можем вычислить дисперсию
Числитель (сумма квадратов отклонений от среднего) равен:
Таким образом, σ 2 = 107,190/12 = 8,932.50.
Для расчета стандартного отклонения находим квадратный корень:
Единицей измерения дисперсии является процент в квадрате, поэтому единицей измерения стандартного отклонения также является процент.
Решение для части 3:
Если генеральная совокупность четко определена как фонды Forbes Honor Roll за один конкретный год (2013 г.), и если под оборотом портфеля понимается конкретный одногодичный период, о котором отчитывается Forbes, то применение формул генеральной совокупности для дисперсии и стандартного отклонения уместно.
Результаты 8,932.50 и 94.51 представляют собой, соответственно, перекрестную дисперсию и стандартное отклонение годового оборота портфеля для фондов Forbes Honor Roll за 2013 год.
Фактически, мы не могли должным образом использовать фонды Honor Roll для оценки дисперсии оборота портфеля (например) любой другой по-разному определенной генеральной совокупности, потому что фонды Honor Roll не являются случайной выборкой из какой-либо большей генеральной совокупности взаимных фондов США.
Выборочная дисперсия.
Статистика, которая измеряет дисперсию по выборке, называется выборочной дисперсией или дисперсией выборки (англ. ‘sample variance’).
В приведенном ниже обсуждении обратите внимание на использование латинских букв вместо греческих для обозначения объема выборки.
Формула выборочной дисперсии.
Формула 13 предписывает нам предпринять следующие шаги для вычисления выборочной дисперсии:
Мы проиллюстрируем расчет выборочной дисперсии и выборочного стандартного отклонения на примере ниже.
Отличие выборочной дисперсии от дисперсии генеральной совокупности.
Формула для выборочной дисперсии почти такая же, как и для дисперсии генеральной совокупности, за исключением использования среднего значения выборки \( \overline X \) вместо среднего значения генеральной совокупности μ и другого делителя.
Мы обсудим эту концепцию далее в чтении о выборке.
Стандартное отклонение выборки.
Для стандартного отклонения генеральной совокупности мы аналогичным образом можем вычислить стандартное отклонение выборки, взяв квадратный корень из положительной дисперсии выборки.
Формула стандартного отклонения выборки.
Стандартное отклонение выборки (выборочное стандартное отклонение, выборочное среднеквадратическое отклонение, англ. ‘sample standard deviation’), обозначается символом s и рассчитывается следующим образом:
Чтобы рассчитать стандартное отклонение выборки, мы сначала вычисляем дисперсию выборки, используя приведенные выше шаги. Затем мы берем квадратный корень из выборочной дисперсии.
Пример, приведенный ниже, иллюстрирует расчет выборочной дисперсии и стандартного отклонения выборки для двух взаимных фондов, представленных ранее.
Пример расчета выборочной дисперсии и стандартного отклонения выборки.
После расчета геометрических и арифметических средних доходностей двух взаимных фондов в Примере (1) мы вычислили две меры дисперсии для этих фондов, размах и среднее абсолютное отклонение доходности (см. Пример расчета размаха и среднего абсолютного отклонения для оценки риска).
Теперь мы вычислим выборочную дисперсию и стандартное отклонение выборки для доходности тех же двух фондов.
Таблица 15. Совокупная доходность двух взаимных фондов, 2008-2012 гг. (повтор).
Общие положения, ряды допусков и основных отклонений
Basic norms of interchangeability. Unified system of tolerances and fits. General, series of tolerances and fundamental deviations
Дата введения 1990-01-01
1. РАЗРАБОТАН И ВНЕСЕН Министерством станкостроительной и инструментальной промышленности СССР
2. УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Постановлением Государственного комитета СССР по стандартам от 11.04.89 N 983
3. ВЗАМЕН ГОСТ 25346-82
4. Стандарт полностью соответствует СТ СЭВ 145-88
5. Стандарт соответствует международному стандарту ИСО 286-1-88*
7. ИЗДАНИЕ с Поправками (ИУС 1-91, 5-92)
Настоящий стандарт распространяется на гладкие элементы деталей, цилиндрические и ограниченные параллельными плоскостями, а также на образованные ими посадки и устанавливает термины, определения и условные обозначения, допуски и основные отклонения системы допусков и посадок для размеров до 3150 мм и любых линейных размеров, если они не установлены другими стандартами.
1. ОСНОВНЫЕ ПОЛОЖЕНИЯ
1.1.Термины и определения
Примечание. В дальнейшем в стандарте под термином «допуск» понимают «стандартный допуск».
Примечание. Применявшийся ранее термин «проходной предел» использовать не рекомендуется.
Примечание. Применявшийся ранее термин «непроходной предел» использовать не рекомендуется.
Примечание. Натяг можно определять как отрицательную разность между размерами отверстия и вала.
21. Основные понятия и определения по допускам и посадкам. Допуски, посадки и технические измерения.
21. Основные понятия и определения по допускам и посадкам. Допуски, посадки и технические измерения. 21. Основные понятия и определения по допускам и посадкам. Допуски, посадки и технические измерения.
Поверхности, размеры, отклонения и допуски. Поверхности деталей бывают сопрягаемыми и несопрягаемыми, или свободными. При этом они могут быть цилиндрическими, плоскими, коническими, эвольвентными, сложными (шлицевые, винтовые) и др. Со-прягаемыми называют поверхности, по которым детали соединяются в сборочные единицы, а сборочные единицы — в механизмы. Несопрягаемыми, или свободными, — конструктивно необходимые поверхности, не предназначенные для соединения с поверхностями других деталей.
Внутренние цилиндрические поверхности, а также внутренние поверхности с парал-лельными плоскостями (отверстия в ступицах, шпоночные пазы и пр.) являются охватывающими (их условно называют отверстиями; диаметры отверстий обозначают буквой D). Наружные отверстия (цилиндрическая поверхность вала, боковые грани шпонок) являются охватываемыми (их условно называют валами и обозначают буквой d).
Размеры — это числовое значение линейной величины (диаметра, длины и т.д.), они делятся на номинальные, действительные и предельные. В машино и приборостроении все размеры в технической документации задают и указывают в миллиметрах.
Номинальный размер (D) — размер, относительно которого определяют предельные размеры и отсчитывают отклонения. Номинальные размеры являются основными размерами деталей или их соединений. Сопрягаемые поверхности имеют общий номинальный размер.
Действительный размер (Dr, dr) — размер, установленный измерением с допустимой погрешностью. Погрешностью измерения называется отклонение результата измерения от истинного значения измеряемой величины. Погрешность измерения, а следовательно, и выбор измерительных средств необходимо согласовывать с точностью, которая требуется для данного размера.
Предельные размеры — два предельно допустимых размера, между которыми должен находиться или которым может быть равен действи¬тельный размер. Больший из двух предельных размеров называют наибольшим предельным размером (Dmax, dmax), а меньший — наименьшим предельным размером (Dmin, dmin) Предельные размеры позво¬ляют оценивать точность обработки деталей.
Отклонение — это алгебраическая разность между действительным и соответствующим номинальными размерами. Отклонения отверстий обозначают буквой E, валов — e.
Действительное отклонение (Er, er) равно алгебраической разности действительного и номинального размеров: Er = Dr — D; er = dr — d.
Предельное отклонение равно алгебраической разности предельного и номинального размеров. Различают верхнее, нижнее и среднее отклонения. Верхнее (ES, es) равно алгебраической разности наибольшего предельного и номинального размеров: ES = Dmax — D; es = dmax — D.
Нижнее отклонение (EI, ei) равно алгебраической разности наименьшего предельного и номинального размеров: EI = Dmin — D; ei = Dmin — D. Среднее отклонение (Em, em) равно полусумме верхнего и ниж¬него отклонений: Em = 0,5 (ES + EI), em = 0,5 (es + ei). Пример. Определить предельные и средние отклонения для штифтов, у которых D = 20 мм, dmax = 20,01 мм и dmin = 19,989 мм.
Для графического построения полей допусков и посадок проводят горизонтальную линию 00, называемую нулевой. Нулевая — это линия, положение которой соответствует номинальному размеру и от которой откладываются предельные отклонения размеров. По-ложительные отклонения — вверх от нулевой линии, отрицательные — вниз.
Поле допуска — поле, ограниченное верхним и нижним отклонения¬ми. Оно опре-деляется величиной допуска и его положением относитель¬но номинального размера. При графическом изображении поля допусков показывают зоны, которые ограничены двумя ли-ниями, проведенными на расстояниях, соответствующих верхнему и нижнему отклоне¬нию. На схемах указывают номинальный D и предельные (Dmax, Dmin, dmax, dmin) размеры, предельные отклонения (ES, EI, es, ei) поля допусков и другие параметры.
Понятия о посадках и допуске посадки. Если у соединяемых между собой деталей размер отверстия больше размера вала, то в соединении будет зазор (S). Если же размер ва-ла больше размера отверстия, то в соединении будет натяг (N). Зазором называется по-ложительная разность между размерами отверстия и вала S = D — d (рис. 42, а). а натягом — положительная разность между размером вала и отверстия N = d — D (рис. 42, б).
В машинах и приборах требуются посадки с различными зазорами и натягами. В тех случаях, когда одна деталь должна перемещаться относительно другой без качки, следует иметь очень малый зазор: для того чтобы одна деталь могла свободно вращаться в другой (например, вал в отверстии), зазор должен быть больше. Если соединенные вал и втулка представляют собой как бы одно целое, они соединены с натягом и не могут перемещаться относительно друг друга. Посадки подразделяют на три вида: подвижные, обеспечивающие зазор в соединении: неподвижные (прессовые), обеспечивающие натяг в соединении; переходные, ко-торые наз¬ваны так потому, что до сборки вала и втулки нельзя сказать, что будет в соединении — зазор или натяг, так как заданные отклонения на вал и отверстие перекрывают друг друга.
В зависимости от использованного допуска у той и другой детали при переходной посадке может оказаться, что размер вала больше размера отверстия или размер отверстия больше размера вала.
Для оценки точности соединений (посадок) пользуются понятием допуска посадки, под которым понимается разность между наибольшим и наименьшим зазорами (в посадках с зазором) или наибольшим и наименьшим натягами (в посадках с натягом). В переходных посадках допуск посадки равен разности между наибольшим и наименьшим натягами или сумме наибольшего натяга и наибольшего зазора. Допуск посадки равен также сумме допусков отверстия и вала.
Дисперсия, среднеквадратичное (стандартное) отклонение, коэффициент вариации в Excel
Из предыдущей статьи мы узнали о таких показателях, как размах вариации, межквартильный размах и среднее линейное отклонение. В этой статье изучим дисперсию, среднеквадратичное отклонение и коэффициент вариации.
Дисперсия
Дисперсия случайной величины – это один из основных показателей в статистике. Он отражает меру разброса данных вокруг средней арифметической.
Сейчас небольшой экскурс в теорию вероятностей, которая лежит в основе математической статистики. Как и матожидание, дисперсия является важной характеристикой случайной величины. Если матожидание отражает центр случайной величины, то дисперсия дает характеристику разброса данных вокруг центра.
Формула дисперсии в теории вероятностей имеет вид:
То есть дисперсия — это математическое ожидание отклонений от математического ожидания.
На практике при анализе выборок математическое ожидание, как правило, не известно. Поэтому вместо него используют оценку – среднее арифметическое. Расчет дисперсии производят по формуле:
s 2 – выборочная дисперсия, рассчитанная по данным наблюдений,
X – отдельные значения,
X̅– среднее арифметическое по выборке.
Стоит отметить, что у такого расчета дисперсии есть недостаток – она получается смещенной, т.е. ее математическое ожидание не равно истинному значению дисперсии. Подробней об этом здесь. Однако при увеличении объема выборки она все-таки приближается к своему теоретическому аналогу, т.е. является асимптотически не смещенной.
Простыми словами дисперсия – это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности. Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, просто рассчитываем среднюю арифметическую. Средний – квадрат – отклонений. Отклонения возводятся в квадрат, и считается средняя. Теперь вы знаете, как найти дисперсию.
Расчет дисперсии в Excel
Генеральную и выборочную дисперсии легко рассчитать в Excel. Есть специальные функции: ДИСП.Г и ДИСП.В соответственно.
В чистом виде дисперсия не используется. Это вспомогательный показатель, который нужен в других расчетах. Например, в проверке статистических гипотез или расчете коэффициентов корреляции. Отсюда неплохо бы знать математические свойства дисперсии.
Свойства дисперсии
Свойство 1. Дисперсия постоянной величины A равна 0 (нулю).
Свойство 2. Если случайную величину умножить на постоянную А, то дисперсия этой случайной величины увеличится в А 2 раз. Другими словами, постоянный множитель можно вынести за знак дисперсии, возведя его в квадрат.
Свойство 3. Если к случайной величине добавить (или отнять) постоянную А, то дисперсия останется неизменной.
Свойство 4. Если случайные величины X и Y независимы, то дисперсия их суммы равна сумме их дисперсий.
Свойство 5. Если случайные величины X и Y независимы, то дисперсия их разницы также равна сумме дисперсий.
Среднеквадратичное (стандартное) отклонение
Если из дисперсии извлечь квадратный корень, получится среднеквадратичное (стандартное) отклонение (сокращенно СКО). Встречается название среднее квадратичное отклонение и сигма (от названия греческой буквы). Общая формула стандартного отклонения в математике следующая:
На практике формула стандартного отклонения следующая:
Как и с дисперсией, есть и немного другой вариант расчета. Но с ростом выборки разница исчезает.
Расчет cреднеквадратичного (стандартного) отклонения в Excel
Для расчета стандартного отклонения достаточно из дисперсии извлечь квадратный корень. Но в Excel есть и готовые функции: СТАНДОТКЛОН.Г и СТАНДОТКЛОН.В (по генеральной и выборочной совокупности соответственно).
Среднеквадратичное отклонение имеет те же единицы измерения, что и анализируемый показатель, поэтому является сопоставимым с исходными данными.
Коэффициент вариации
Значение стандартного отклонения зависит от масштаба самих данных, что не позволяет сравнивать вариабельность разных выборках. Чтобы устранить влияние масштаба, необходимо рассчитать коэффициент вариации по формуле:
По нему можно сравнивать однородность явлений даже с разным масштабом данных. В статистике принято, что, если значение коэффициента вариации менее 33%, то совокупность считается однородной, если больше 33%, то – неоднородной. В реальности, если коэффициент вариации превышает 33%, то специально ничего делать по этому поводу не нужно. Это информация для общего представления. В общем коэффициент вариации используют для оценки относительного разброса данных в выборке.
Расчет коэффициента вариации в Excel
Расчет коэффициента вариации в Excel также производится делением стандартного отклонения на среднее арифметическое:
Коэффициент вариации обычно выражается в процентах, поэтому ячейке с формулой можно присвоить процентный формат:
Коэффициент осцилляции
Еще один показатель разброса данных на сегодня – коэффициент осцилляции. Это соотношение размаха вариации (разницы между максимальным и минимальным значением) к средней. Готовой формулы Excel нет, поэтому придется скомпоновать три функции: МАКС, МИН, СРЗНАЧ.
Коэффициент осцилляции показывает степень размаха вариации относительно средней, что также можно использовать для сравнения различных наборов данных.
Таким образом, в статистическом анализе существует система показателей, отражающих разброс или однородность данных.
Ниже видео о том, как посчитать коэффициент вариации, дисперсию, стандартное (среднеквадратичное) отклонение и другие показатели вариации в Excel.