Вариационный ряд основные элементы виды рядов. Дать определение вариационного ряда

Наименование параметра Значение
Тема статьи: Вариационный ряд
Рубрика (тематическая категория) Производство

Наблюдаемые значения случайной величины х 1 , х 2 , …, х k называются вариантами .

Частотой варианты х i принято называть число n i (i =1,…,k ), показывающее, сколько раз эта варианта встречается в выборке.

Частостью (относительной частотой, долей) варианты х i (i =1,…,k ) принято называть отношение ее частоты n i к объёму выборки n .

Частоты и частости называютвесами .

Накопленной частотой принято называть количество вариант, значения которых меньше данного х :

Накопленной частостью принято называть отношение накопленной частоты к объёму выборки:

Вариационным рядом (статистическим рядом) – принято называть последовательность вариант, записанных в порядке возрастания и соответствующих им весов.

Вариационный ряд должна быть дискретным (выборка значений дискретной случайной величины) и непрерывным (интервальным) (выборка значений непрерывной случайной величины).

Дискретный вариационный ряд имеет вид:

Когда число вариант велико или признак является непрерывным (случайная величина может принимать любые значения в некотором интервале), составляют интервальный вариационный ряд.

Для построения интервального вариационного ряда проводят группировку вариант – их разбивают на отдельные интервалы:

Число интервалов иногда определяют с помощью формулы Стерджеса :

Затем подсчитывается число вариант, попавших в каждый интервал – частоты n i (или частости n i /n ). В случае если варианта находится на границе интервала, то ее присоединяют к правому интервалу.

Интервальный вариационный ряд имеет вид :

Варианты
Частоты

Эмпирической (статистической) функцией распределœения принято называть функция, значение которой в точке х равно относительной частоте того, что варианта примет значение, меньшее х (накопительной частости для х ):

Полигоном частот называют ломанную, отрезки которой соединяют точки с координатами (х 1 ; n 1), (х 2 ; n 2), …, (х k ; n k ). Аналогично строится полигон частостей , который является статистическим аналогом многоугольника распределœений.

Стоит сказать, что для непрерывного вариационного ряда полигон можно построить, в случае если в качестве значений х 1 , х 2 , …, х k взять середины интервалов.

Интервальный вариационный ряд графически обычно изображают с помощью гистограммы .

Гистограмма – ступенчатая фигура, состоящая из прямоугольников, основаниями которых являются частичные интервалы длины h = x i +1 – x i , i = 0,…,k -1, а высоты равны частотам (или частостям) интервалов n i (w i ).

Кумулята (кумулятивная кривая) – кривая накопленных частот (частостей). Для дискретного ряда кумулята представляет ломанную, соединяющую точки или , . Для интервального ряда кумулята начинается с точки, абсцисса которой равна началу первого интервала, а ордината – накопленной частоте (частости), равной нулю. Другие точки этой ломанной соответствуют концам интервалов.

Вариационный ряд - понятие и виды. Классификация и особенности категории "Вариационный ряд" 2017, 2018.

  • - Вариационный ряд распределения

    Распределение розничного товарооборота Российской Федерации в 1995 году по формам собственности, млн. руб. Виды рядов распределения Лекция VIII. Ряды распределения В результате обработки и систематизации первичных статистических данных получают... .


  • - Вариационный ряд

    Простейшее преобразование статистических данных является их упорядочивание по величине. Выборка объёма из генеральной совокупности, упорядоченная в порядке неубывания элементов, т.е. , называется вариационным рядом: . В том случае, когда объем наблюдений... .


  • - Задание 2. Интервальный вариационный ряд

    1. По заданной выборке, соответствующей варианту задания построить интервальный вариационный ряд; построить гистограмму и кумуляту (используйте два способа: вставку диаграммы Excel и режим «Гистограмма» пакета «Анализ данных»). 2. Проанализировать полученную гистограмму. ... .


  • - Составить вариационный ряд изменчивости признака семян фасоли или листьев какого-либо растения одного возраста. Выявить закономерности изменчивости признака.

    Популяция - структурная единица вида. Численность популяций. Причины колебания численности популяций. Взаимоотношения особей в популяциях и между различными популяциями одного и разных видов. 1. Важный признак вида - расселение его группами, популяциями в...

  • Вариационный ряд - это статистический ряд, показывающий распределение изучаемого явления по величине какого-либо количественного признака. Например, больных по возрасту, по срокам лечения, новорожденных по весу и т.п.

    Варианта - отдельные значения признака, по которому проводится группировка (обозначается V ) .

    Частота- число, показывающее, как часто встречается та или иная варианта (обозначается P ) . Сумма всех частот показывает общее число наблюдений и обозначается n . Разность между наибольшей и наименьшей вариантой вариационного ряда называется размахом или амплитудой .

    Различают вариационные ряды:

    1. Прерывные (дискретные) и непрерывные.

    Ряд считается непрерывным, если группировочный признак может выражаться дробными величинами (вес, рост т.п.), прерывным, если группировочный признак выражается только целым числом (дни нетрудоспособности, число ударов пульса и т.п.).

    2.Простые и взвешенные.

    Простой вариационный ряд представляет собой ряд, в котором количественное значение варьирующего признака встречается один раз. Во взвешенном вариационном ряду количественные значения варьирующего признака повторяются с определённой частотой.

    3. Сгруппированные (интервальные) и несгруппированые.

    Сгруппированный ряд имеет варианты, объединённые в группы, объединяющие их по величине в пределах определённого интервала. В несгруппированном ряду каждой отдельной варианте соответствует определённая частота.

    4. Четные и нечетные.

    В чётных вариационных рядах сумма частот или общее число наблюдений выражено чётным числом, в нечётных ― нечётным.

    5. Симметричные и асимметричные.

    В симметричном вариационном ряду все виды средних величин совпадают или очень близки (мода, медиана, среднее арифметическое).

    В зависимости от характера изучаемых явлений, от конкретных задач и целей статистического исследования, а также от содержания исходного материала, в санитарной статистике применяются следующие виды средних величин:

    структурные средние (мода, медиана);

    средняя арифметическая;

    средняя гармоническая;

    средняя геометрическая;

    средняя прогрессивная.

    Мода (М о ) - величина варьирующего признака, которая более часто встречается в изучаемой совокупности т.е. варианта, соответствующая наибольшей частоте. Находят ее непосредственно по структуре вариационного ряда, не прибегая к каким-либо вычислениям. Она обычно является величиной очень близкой к средней арифметической и весьма удобна в практической деятельности.

    Медиана (М е ) - делящая вариационный ряд (ранжированный, т.е. значения вариант располагаются в порядке возрастания или убывания) на две равные половины. Медиана вычисляется при помощи так называемого нечетного ряда, который получают путем последовательного суммирования частот. Если сумма частот соответствует четному числу, тогда за медиану условно принимают среднюю арифметическую из двух средних значений.

    Мода и медиана применяются в случае незамкнутой совокупности, т.е. когда наибольшая или наименьшая варианты не имеют точной количественной характеристики (например, до 15 лет, 50 и старше и т.п.). В этом случае среднюю арифметическую (параметрические характеристики) рассчитать нельзя.

    Средня я арифметическая - самая распространенная величина. Средняя арифметическая обозначается чаще через М .

    Различают среднюю арифметическую простую и взвешенную.

    Средняя арифметическая простая вычисляется:

    ― в тех случаях, когда совокупность представлена простым перечнем знаний признака у каждой единицы;

    ― если число повторений каждой варианты нет возможности определить;

    ― если числа повторений каждой варианты близки между собой.

    Средняя арифметическая простая исчисляется по формуле:

    где V - индивидуальные значения признака; n - число индивидуальных значений;
    - знак суммирования.

    Таким образом, простая средняя представляет собой отношение суммы вариант к числу наблюдений.

    Пример: определить среднюю длительность пребывания на койке 10 больных пневмонией:

    16 дней - 1 больной; 17–1; 18–1; 19–1; 20–1; 21–1; 22–1; 23–1; 26–1; 31–1.

    койко-дня.

    Средняя арифметическая взвешенная исчисляется в тех случаях, когда индивидуальные значения признака повторяются. Ее можно вычислять двояким способом:

    1. Непосредственным (среднеарифметическим или прямым способом) по формуле:

    ,

    где P - частота (число случаев) наблюдений каждой варианты.

    Таким образом, средняя арифметическая взвешенная представляет собой отношение суммы произведений вариант на частоты к числу наблюдений.

    2. С помощью вычисления отклонений от условной средней (по способу моментов).

    Основой для вычисления взвешенной средней арифметической является:

    ― сгруппированный материал по вариантам количественного признака;

    ― все варианты должны располагаться в порядке возрастания или убывания величины признака (ранжированный ряд).

    Для вычисления по способу моментов обязательным условием является одинаковый размер всех интервалов.

    По способу моментов средняя арифметическая вычисляется по формуле:

    ,

    где М о - условная средняя, за которую чаще принимают величину признака, соответствующую наибольшей частоте, т.е. которая чаще повторяется (Мода).

    i - величина интервала.

    a - условное отклонение от условий средней, представляющее собой последовательный ряд чисел (1, 2 и т.д.) со знаком + для вариант больших условной средней и со знаком–(–1, –2 и т.д.) для вариант, которые ниже условной средней. Условное же отклонение от варианты, принятой за условную среднюю равно 0.

    P - частоты.

    - общее число наблюдений или n.

    Пример: определить средний рост мальчиков 8 лет непосредственным способом (таблица1).

    Т а б л и ц а 1

    Рост в см

    мальчиков P

    Центральная

    варианта V

    Центральная варианта ― середина интервала ― определяется как полу сумма начальных значений двух соседних групп:

    ;
    и т.д.

    Произведение VP получают путем умножения центральных вариант на частоты
    ;
    и т.д. Затем полученные произведения складывают и получают
    , которую делят на число наблюдений (100) и получают среднюю арифметическую взвешенную.

    см.

    Эту же задачу решим по способу моментов, для чего составляется следующая таблица 2:

    Т а б л и ц а 2

    Рост в см (V)

    мальчиков P

    n=100

    В качестве М о принимаем 122, т.к. из 100 наблюдений у 33 человек рост был 122см. Находим условные отклонения (a) от условной средней в соответствии с вышесказанным. Затем получаем произведение условных отклонений на частоты (aP) и суммируем полученные величины (
    ). В итоге получится 17. Наконец, данные подставляем в формулу:

    При изучении варьирующего признака нельзя ограничиваться только вычислением средних величин. Необходимо вычислять и показатели, характеризующие степень разнообразия изучаемых признаков. Величина того или иного количественного признака неодинакова у всех единиц статистической совокупности.

    Характеристикой вариационного ряда является среднее квадратичное отклонение (), которое показывает разброс (рассеивание) изучаемых признаков относительно средней арифметической, т.е. характеризует колеблемость вариационного ряда. Оно может определяться непосредственным способом по формуле:

    Среднее квадратичное отклонение равняется квадратному корню из суммы произведений квадратов отклонений каждой варианты от средней арифметической (V–M) 2 на свои частоты деленной на сумму частот (
    ).

    Пример вычисления: определить среднее число больничных листов, выдаваемых в поликлинике за день (таблица 3).

    Т а б л и ц а 3

    Число больничных

    листов, выданных

    врачом за день (V)

    Число врачей (Р)

    ;

    В знаменателе при числе наблюдений менее 30 необходимо от
    отнимать единицу.

    Если ряд сгруппирован с равными интервалами, тогда можно определить среднее квадратичное отклонение по способу моментов:

    ,

    где i - величина интервала;

    - условное отклонение от условной средней;

    P - частоты вариант соответствующих интервалов;

    - общее число наблюдений.

    Пример вычисления : Определить среднюю длительность пребывания больных на терапевтической койке (по способу моментов) (таблица 4):

    Т а б л и ц а 4

    Число дней

    пребывания на койке (V)

    больных (Р)

    ;

    Бельгийский статистик А. Кетле обнаружил, что вариации массовых явлений подчиняются закону распределения ошибок, открытому почти одновременно К. Гауссом и П. Лапласом. Кривая, отображающая это распределение, имеет вид колокола. По нормальному закону распределения колеблемость индивидуальных значений признака находится в пределах
    , что охватывает 99,73% всех единиц совокупности.

    Подсчитано, что если к средней арифметической прибавить и отнять 2, то в пределах полученных величин находится 95,45% всех членов вариационного ряда и, наконец, если к средней арифметической прибавить и отнять 1, то в пределах полученных величин будут находиться 68,27% всех членов данного вариационного ряда. В медицине с величиной
    1связано понятие нормы. Отклонение от средней арифметической больше, чем на 1, но меньше, чем на 2является субнормальным, а отклонение больше, чем на 2ненормальным (выше или ниже нормы).

    В санитарной статистике правило трех сигм применяется при изучении физического развития, оценке деятельности учреждений здравоохранения, оценке здоровья населения. Это же правило широко применяется в народном хозяйстве при определении стандартов.

    Таким образом, среднее квадратичное отклонение служит для:

    ― измерения дисперсии вариационного ряда;

    ― характеристики степени разнообразия признаков, которые определяются коэффициентом вариации:

    Если коэффициент вариации более 20% - сильное разнообразие, от 20 до 10% - среднее, менее 10% - слабое разнообразие признаков. Коэффициент вариации в известной мере является критерием надежности средней арифметической.

    Различные выборочные значения назовемвариантами ряда значений и обозначим: х 1 , х 2 , …. Прежде всего произведем ранжирование вариантов, т.е. расположение их в порядке возрастания или убывания. Для каждого варианта указывается свой вес, т.е. число, которое характеризует вклад данного варианта в общую совокупность. В качестве весов выступают частоты или частости.

    Частотой n i варианта х i называется число, показывающее сколько раз встречается данный вариант в рассматриваемой выборочной совокупности.

    Частостью или относительной частотой w i варианта х i называется число, равное отношению частоты варианта к сумме частот всех вариантов. Частость показывает, какая часть единиц выборочной совокупности имеет данный вариант.

    Последовательность вариантов с соответствующими им весами (частотами или частостями), записанная в порядке возрастания (или убывания), называется вариационным рядом .

    Вариационные ряды бывают дискретными и интервальными.

    Для дискретного вариационного ряда задаются точечные значения признака, для интервального – значения признака задаются в виде интервалов. Вариационные ряды могут показывать распределение частот или относительных частот (частостей), в зависимости от того, какая величина указывается для каждого варианта – частота или частость.

    Дискретный вариационный ряд распределения частот имеет вид:

    Частости находятся по формуле , i = 1, 2, …, m .

    w 1 + w 2 + … + w m = 1.

    Пример 4.1. Для данной совокупности чисел

    4, 6, 6, 3, 4, 9, 6, 4, 6, 6

    построить дискретные вариационные ряды распределения частот и частостей.

    Решение . Объем совокупности равен n = 10. Дискретный ряд распределения частот имеет вид

    Аналогичную форму записи имеют интервальные ряды.

    Интервальный вариационный ряд распределения частот записывается в виде:

    Сумма всех частот равна общему числу наблюдений, т.е. объему совокупности: n = n 1 + n 2 + … + n m .

    Интервальный вариационный ряд распределения относительных частот (частостей) имеет вид:

    Частость находится по формуле , i = 1, 2, …, m .

    Сумма всех частостей равна единице: w 1 + w 2 + … + w m = 1.

    Наиболее часто на практике применяются интервальные ряды. Если статистических выборочных данных очень много и их значения отличаются друг от друга на сколь угодно малую величину, то дискретный ряд для этих данных будет достаточно громоздким и неудобным для дальнейшего исследования. В этом случае применяют группировку данных, т.е. промежуток, содержащий все значения признака, разбивают на несколько частичных интервалов и, подсчитав частоту для каждого интервала, получают интервальный ряд. Запишем более подробно схему построения интервального ряда, предположив, что длины частичных интервалов будут одинаковыми.

    2.2 Построение интервального ряда

    Для построения интервального ряда нужно:

    Определить число интервалов;

    Определить длину интервалов;

    Определить расположение интервалов на оси.

    Для определения числа интервалов k существует формула Стерджеса, по которой

    ,

    где n - объем всей совокупности.

    Например, если имеется 100 значений признака (вариант), то рекомендуется для построения интервального ряда взять число интервалов равным интервалам.

    Однако очень часто на практике число интервалов выбирает сам исследователь, учитывая, что это число не должно быть очень большим, чтобы ряд не был громоздким, но и не очень маленьким, чтобы не потерять некоторых свойств распределения.

    Длина интервала h определяется по следующей формуле:

    ,

    где x max и x min - это соответственно самое большое и самое маленькое значения вариантов.

    Величину называют размахом ряда.

    Для построения самих интервалов поступают по-разному. Один из самых простых способов заключается в следующем. За начало первого интервала принимают величину
    . Тогда остальные границы интервалов находятся по формуле . Очевидно, что конец последнего интервала a m+1 должен удовлетворять условию

    После того как найдены все границы интервалов, определяют частоты (или частости) этих интервалов. Для решения этой задачи просматривают все варианты и определяют число вариант, попавших в тот или иной интервал. Полное построение интервального ряда рассмотрим на примере.

    Пример 4.2. Для следующих статистических данных, записанных в порядке возрастания, построить интервальный ряд с числом интервалов, равным 5:

    11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

    Решение. Всего n =50 значений вариантов.

    Число интервалов задано в условии задачи, т.е. k =5.

    Длина интервалов равна
    .

    Определим границы интервалов:

    a 1 = 11 − 8,5 = 2,5; a 2 = 2,5 + 17 = 19,5; a 3 = 19,5 + 17 = 36,5;

    a 4 = 36,5 + 17 = 53,5; a 5 = 53,5 + 17 = 70,5; a 6 = 70,5 + 17 = 87,5;

    a 7 = 87,5 +17 = 104,5.

    Для определения частоты интервалов посчитываем число вариантов, попавших в данный интервал. Например, в первый интервал от 2,5 до 19,5 попадают варианты 11, 12, 12, 14, 14, 15. Их число равно 6, следовательно, частота первого интервала равна n 1 =6. Частость первого интервала равна . Во второй интервал от 19,5 до 36,5 попадают варианты 21, 21, 22, 23, 25, число которых равно 5. Следовательно, частота второго интервала равна n 2 =5, а частость . Найдя аналогичным образом частоты и частости для всех интервалов, получим следующие интервальные ряды.

    Интервальный ряд распределения частот имеет вид:

    Сумма частот равна 6+5+9+11+8+11=50.

    Интервальный ряд распределения частостей имеет вид:

    Сумма частостей равна 0,12+0,1+0,18+0,22+0,16+0,22=1. ■

    При построении интервальных рядов, в зависимости от конкретных условий рассматриваемой задачи, могут применяться и другие правила, а именно

    1. Интервальные вариационные ряды могут состоять из частичных интервалов разной длины. Неравные длины интервалов позволяют выделить свойства статистической совокупности с неравномерным распределением признака. Например, если границы интервалов определяют численность жителей в городах, то целесообразно в данной задаче использовать неравные по длине интервалы. Очевидно, что для небольших городов имеет значение и небольшая разница в числе жителей, а для больших городов разница в десятки и сотни жителей не имеет существенного значения. Интервальные ряды с неравными длинами частичных интервалов исследуются, в основном, в общей теории статистики и их рассмотрение выходит за рамки данного пособия.

    2. В математической статистике иногда рассматривают интервальные ряды, для которых левую границу первого интервала полагают равной –∞, а правую границу последнего интервала +∞. Это делается для того, чтобы приблизить статистическое распределение к теоретическому.

    3. При построении интервальных рядов может оказаться, что значение какого-то варианта совпадает в точности с границей интервала. Лучше всего в этом случае поступить следующим образом. Если такое совпадение только одно, то считать, что рассматриваемый вариант со своей частотой попал в интервал, находящийся ближе к середине интервального ряда, если таких вариантов несколько, то либо все их отнести к правым от этих вариант интервалам, либо все – к левым.

    4. После определения числа интервалов и их длины, расположение интервалов можно производить и по другому способу. Находят среднее арифметическое всех рассматриваемых значений вариантов х ср. и строят первый интервал таким образом, чтобы это среднее выборочное находилось бы внутри какого-то интервала. Таким образом, получаем интервал от х ср. – 0,5h до х ср.. + 0,5h . Затем влево и вправо, прибавляя длину интервала, строим остальные интервалы до тех пор, пока x min и x max не попадут соответственно в первый и последний интервалы.

    5. Интервальные ряды при большом числе интервалов удобно записывать вертикально, т.е. интервалы записывать не в первой строке, а в первом столбце, а частоты (или частости) во втором столбце.

    Выборочные данные могут рассматриваться как значения некоторой случайной величины Х . Случайная величина имеет свой закон распределения. Из теории вероятностей известно, что закон распределения дискретной случайной величины можно задать в виде ряда распределения, а непрерывной – с помощью функции плотности распределения. Однако существует универсальный закон распределения, который имеет место и для дискретной и для непрерывной случайных величин. Этот закон распределения задается в виде функции распределения F (x ) = P (X <x ). Для выборочных данных можно указать аналог функции распределения – эмпирическую функцию распределения.


    Похожая информация.


    Вариационные ряды: определение, виды, основные характеристики. Методика расчета
    моды, медианы, средней арифметической в медико-статистических исследованиях
    (показать на условном примере).

    Вариационный ряд – это ряд числовых значений изучаемого признака, отличающихся друг от друга по своей величине и расположенных в определенной последовательности(в восходящем или убывающем порядке). Каждое числовое значение ряда называют вариантой (V), а числа, показывающие, как часто встречается та или иная варианта в составе данного ряда, называется частотой (р).

    Общее число случаев наблюдений, из которых вариационный ряд состоит, обозначают буквой n. Различие в значении изучаемых признаков называется вариацией. В случае если варьирующий признак не имеет количественной меры, вариацию называют качественной, а ряд распределения – атрибутивным (например, распределение по исходу заболевания, по состоянию здоровья и т.д.).

    Если варьирующий признак имеет количественное выражение, такую вариацию называют количественной, а ряд распределения – вариационным.

    Вариационные ряды делятся на прерывные и непрерывные – по характеру количественного признака, простые и взвешенные – по частоте встречаемости вариант.

    В простом вариационном ряду каждая варианта встречается только один раз (р=1), во взвешенном – одна и та же варианта встречается несколько раз (р>1). Примеры таких рядов будут рассмотрены далее по тексту. Если количественный признак носит непрерывный характер, т.е. между целыми величинами имеются промежуточные дробные величины, вариационный ряд называется непрерывным.

    Например: 10,0 – 11,9

    14,0 – 15,9 и т.д.

    Если количественный признак носит прерывный характер, т.е. отдельные его значения (варианты) отличаются друг от друга на целое число и не имеют промежуточных дробных значений, вариационный ряд называют прерывным или дискретным.

    Используя данные предыдущего примера о частоте пульса

    у 21 студентов, построим вариационный ряд (табл. 1).

    Таблица 1

    Распределение студентов-медиков по частоте пульса (уд/мин)

    Таким образом, построить вариационный ряд – означает имеющиеся числовые значения (варианты) систематизировать, упорядочить, т.е. расположить в определенной последовательности (в восходящем или убывающем порядке) с соответствующими им частотами. В рассматриваемом примере варианты расположены в восходящем порядке и выражены в виде целых прерывных (дискретных) чисел, каждая варианта встречается несколько раз, т.е. мы имеем дело со взвешенным, прерывным или дискретным вариационным рядом.

    Как правило, если число наблюдений в изучаемой нами статистической совокупности не превышает 30, то достаточно все значения изучаемого признака расположить в вариационном ряду в нарастающем, как в табл. 1, или убывающем порядке.

    При большом количестве наблюдений (n>30) число встречающихся вариант может быть очень большим, в этом случае составляется интервальный или сгруппированный вариационный ряд, в котором для упрощения последующей обработки и выяснения характера распределения варианты объединены в группы.

    Обычно число групповых вариант колеблется от 8 до 15.

    Их должно быть не меньше 5, т.к. иначе это будет слишком грубое, чрезмерное укрупнение, что искажает общую картину варьирования и сильно сказывается на точности средних величин. При числе групповых вариант более 20-25 увеличивается точность вычисления средних величин, но существенно искажаются особенности варьирования признака и усложняется математическая обработка.

    При составлении сгруппированного ряда необходимо учесть,

    − группы вариант должны располагаться в определенном порядке (в восходящем или нисходящем);

    − интервалы в группах вариант должны быть одинаковыми;

    − значения границ интервалов не должны совпадать, т.к. неясно будет, в какие группы относить отдельные варианты;

    − необходимо учитывать качественные особенности собираемого материала при установлении пределов интервалов (например, при изучении веса взрослых людей интервал 3-4 кг допустим, а для детей первых месяцев жизни он не должен превышать 100 г.)

    Построим сгруппированный (интервальный) ряд, характеризующий данные о частоте пульса (число ударов в минуту) у 55 студентов-медиков перед экзаменом: 64, 66, 60, 62,

    64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

    64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

    79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

    Для построения сгруппированного ряда необходимо:

    1. Определить величину интервала;

    2. Определить середину, начало и конец групп вариант вариационного ряда.

    ● Величина интервала (i) определяется по числу предполагаемых групп (r), количество которых устанавливается в зависимости от числа наблюдений (n) по специальной таблице

    Число групп в зависимости от числа наблюдений:

    В нашем случае, для 55 студентов, можно составить от 8 до 10 групп.

    Величина интервала (i) определяется по следующей формуле –

    i = V max-V min/r

    В нашем примере величина интервала равна 82- 58/8= 3.

    Если величина интервала представляет собой дробное число, полученный результат следует округлить до целого числа.

    Различают несколько видов средних величин:

    ● средняя арифметическая,

    средняя геометрическая,

    ● средняя гармоническая,

    ● средняя квадратическая,

    ● средняя прогрессивная,

    ● медиана

    В медицинской статистике наиболее часто пользуются средними арифметическими величинами.

    Средняя арифметическая величина (М) является обобщающей величиной, которая определяет то типичное, что характерно для всей совокупности. Основными способами расчета М являются: среднеарифметический способ и способ моментов (условных отклонений).

    Среднеарифметический способ применяется для вычисления средней арифметической простой и средней арифметической взвешенной. Выбор способа расчета средней арифметической величины зависит от вида вариационного ряда. В случае простого вариационного ряда, в котором каждая варианта встречается только один раз, определяется средняя арифметическая простая по формуле:

    где: М – средняя арифметическая величина;

    V – значение варьирующего признака (варианты);

    Σ – указывает действие – суммирование;

    n – общее число наблюдений.

    Пример расчета средней арифметической простой. Частота дыхания (число дыхательных движений в минуту) у 9 мужчин в возрасте 35 лет: 20, 22, 19, 15, 16, 21, 17, 23, 18.

    Для определения среднего уровня частоты дыхания у мужчин в возрасте 35 лет необходимо:

    1. Построить вариационный ряд, расположив все варианты в возрастающем или убывающем порядке Мы получили простой вариационный ряд, т.к. значения вариант встречаются только один раз.

    M = ∑V/n = 171/9 = 19 дыхательных движений в минуту

    Вывод. Частота дыхания у мужчин в возрасте 35 лет в среднем равна 19 дыхательным движениям в минуту.

    Если отдельные значения вариант повторяются, незачем выписывать в линию каждую варианту, достаточно перечислить встречающиеся размеры вариант (V) и рядом указать число их повторений (р). такой вариационный ряд, в котором варианты как бы взвешиваются по числу соответствующих им частот, носит название – взвешенный вариационный ряд, а рассчитываемая средняя величина – средней арифметической взвешенной.

    Средняя арифметическая взвешенная определяется по формуле: M= ∑Vp/n

    где n – число наблюдений, равное сумме частот – Σр.

    Пример расчета средней арифметической взвешенной.

    Длительность нетрудоспособности (в днях) у 35 больных острыми респираторными заболеваниями (ОРЗ), лечившихся у участкового врача на протяжении I-го квартала текущего года составила: 6, 7, 5, 3, 9, 8, 7, 5, 6, 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6, 7 дней.

    Методика определения средней длительности нетрудоспособности у больных с ОРЗ следующая:

    1. Построим взвешенный вариационный ряд, т.к. отдельные значения вариант повторяются несколько раз. Для этого можно расположить все варианты в возрастающем или убывающем порядке с соответствующими им частотами.

    В нашем случае варианты расположены в возрастающем порядке

    2. Рассчитаем среднюю арифметическую взвешенную по формуле: M = ∑Vp/n = 233/35 = 6,7 дней

    Распределение больных с ОРЗ по длительности нетрудоспособности:

    Длительность нетрудоспособности (V) Число больных (p) Vp
    ∑p = n = 35 ∑Vp = 233

    Вывод. Длительность нетрудоспособности у больных с острыми респираторными заболеваниями составила в среднем 6,7 дней.

    Мода (Мо) – наиболее часто встречающаяся варианта в вариационном ряду. Для распределения, представленного в таблице, моде соответствует варианта, равная 10, она встречается чаще других – 6 раз.

    Распределение больных по длительности пребывания на больничной койке (в днях)

    V
    p

    Иногда точную величину моды установить трудно, поскольку в изучаемых данных может существовать несколько наблюдений, встречающихся «наиболее часто».

    Медиана (Ме) – непараметрический показатель, делящий вариационный ряд на две равные половины: в обе стороны от медианы располагается одинаковое число вариант.

    Например, для распределения, указанного в таблице, медиана равна 10, т.к. по обе стороны от этой величины располагается по 14 вариант, т.е. число 10 занимает центральное положение в этом ряду и является его медианой.

    Учитывая, что число наблюдений в этом примере четное (n=34), медиану можно определить таким образом:

    Me = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

    Это означает, что середина ряда приходится на семнадцатую по счету варианту, которой соответствует медиана, равная 10. Для распределения, представленного в таблице, средняя арифметическая равна:

    M = ∑Vp/n = 334/34 = 10,1

    Итак, для 34 наблюдений из табл. 8, мы получили: Мо=10, Ме=10, средняя арифметическая (М) равна 10,1. В нашем примере все три показателя оказались равными или близкими друг к другу, хотя они совершенно различны.

    Средняя арифметическая является результативной суммой всех влияний, в формировании ее принимают участие все без исключения варианты, в том числе и крайние, часто нетипичные для данного явления или совокупности.

    Мода и медиана, в отличие от средней арифметической, не зависят от величины всех индивидуальных значений варьирующего признака (значений крайних вариант и степени рассеяния ряда). Средняя арифметическая характеризует всю массу наблюдений, мода и медиана – основную массу

    ​ Вариационный ряд – ряд, в котором сопоставлены (по степени возрастания или убывания) варианты и соответствующие им частоты

    ​Варианты – отдельные количественные выражения признака. Обозначаются латинской буквой V . Классическое понимание термина "варианта" предполагает, что вариантой называется каждое уникальное значение признака, без учета количества повторов.

    Например, в вариационном ряду показателей систолического артериального давления, измеренного у десяти пациентов:

    110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

    вариантами являются только 6 значений:

    110, 120, 130, 140, 160, 170.

    ​Частота – число, показывающее, сколько раз повторяется варианта. Обозначается латинской буквой P . Сумма всех частот (которая, разумеется, равна числу всех исследуемых) обозначается как n .

      В нашем примере частоты будут принимать следующие значения:
    • для варианты 110 частота Р = 1 (значение 110 встречается у одного пациента),
    • для варианты 120 частота Р = 2 (значение 120 встречается у двух пациентов),
    • для варианты 130 частота Р = 3 (значение 130 встречается у трех пациентов),
    • для варианты 140 частота Р = 2 (значение 140 встречается у двух пациентов),
    • для варианты 160 частота Р = 1 (значение 160 встречается у одного пациента),
    • для варианты 170 частота Р = 1 (значение 170 встречается у одного пациента),

    Виды вариационных рядов:

    1. простой - это ряд, в котором каждая варианта встречается только по одному разу (все частоты при этом равны 1);
    2. взвешенный - ряд, в котором одна или несколько вариант встречаются неоднократно.

    Вариационный ряд служит для описания больших массивов чисел, именно в этой форме изначально представляются собранные данные большинства медицинских исследований. Для того, чтобы охарактеризовать вариационный ряд, рассчитываются специальные показатели, в том числе средние величины, показатели вариабельности (так называемой, дисперсии), показатели репрезентативности выборочных данных.

    Показатели вариационного ряда

    1) Средняя арифметическая - это обобщающий показатель, характеризующий размер изучаемого признака. Средняя арифметическая обозначается как M , представляет собой самый распространенный вид средней. Средняя арифметическая рассчитывается как отношение суммы значений показателей всех единиц наблюдения к числу всех исследуемых. Методика расчета средней арифметической различается для простого и взвешенного вариационного ряда.

    Формула для расчета простой средней арифметической:

    Формула для расчета взвешенной средней арифметической:

    M = Σ(V * P)/ n

    ​ 2) Мода – еще одна средняя величина вариационного ряда, соответствующая наиболее часто повторяющейся варианте. Или, если выразиться по другому, это варианта, которой соответствует наибольшая частота. Обозначается как Мо . Мода рассчитывается только для взвешенных рядов, так как в простых рядах ни одна из вариант не повторяется и все частоты равны единице.

    Например, в вариационном ряду значений частоты сердечных сокращений:

    80, 84, 84, 86, 86, 86, 90, 94;

    значение моды составляет 86, так как данная варианта встречается 3 раза, следовательно ее частота - наибольшая.

    3) Медиана – значение варианты, делящей вариационный ряд пополам: по обе стороны от нее находится равное число вариант. Медиана также, как и средняя арифметическая и мода, относится к средним величинам. Обозначается как Me

    4) Среднее квадратическое отклонение (синонимы: стандартное отклонение, сигмальное отклонение, сигма) - мера вариабельности вариационного ряда. Является интегральным показателем, объединяющим все случаи отклонения вариант от средней. Фактически, отвечает на вопрос: насколько далеко и как часто варианты распространяются от средней арифметической. Обозначается греческой буквой σ ("сигма") .

    При численности совокупности более 30 единиц, стандартное отклонение рассчитывается по следующей формуле:

    Для малых совокупностей - 30 единиц наблюдения и менее - стандартное отклонение рассчитывается по другой формуле: