понедельник, 30 марта 2020 г.

Інформатика, для групи 2-3, 2-2. Урок 13. Тема: Обчислення основних статистичних характеристик вибірки



Урок 13

Тема: Обчислення основних статистичних характеристик вибірки

Ви дізнаєтеся:
v що є основними статистичними характеристиками вибірки;
v які функції можна використовувати для знаходження центральної тенденції в середовищі табличного процесора

Що є основними статистичними характеристиками вибірки?
Основними статистичними характеристиками вибірки є середнє, мода та медіана, які ще називають мірами центральної тенденції. Вони показують загальні або типові характеристики розподілу даних за певною змінною. Середнє, мода та медіана - це окремі значення, що представляють весь набір даних, типові для всіх значень у групі.
Розглянемо кожну з них.
Для обчислення середнього значення досить додати всі значення в розподілі
й поділити на кількість спостережень.
Медіану можна визначити як точку на ряді розподілу (впорядкований набір значень змінної для різних спостережень - наприклад, від найменшого до найбільшого значення) - до цієї точки розташована половина всіх значень, і після цієї точки - теж половина значень. Тобто медіана - це значення, що ділить упорядкований ряд навпіл. Якщо кількість значень непарна, то береться одне зі значень - те, що стоїть у розподілі рівно по центру. Коли значень парна кількість, то беруть два центральні значення і знаходять їхнє середнє.
Мода - це значення, яке найчастіше трапляється. Як правило, вона представляє найбільш типове значення. Наприклад, за інформацією міністерства юстиції України, найпопулярнішими іменами, якими українські батьки називали своїх новонароджених дітей у 2017 р., стали Анастасія, Софія, Анна, Артем, Максим та Олександр (https://24tv.ua/ukrayinatag1119 ).  Ці імена є модою серед усіх імен. На моду ніколи не впливають екстремальні значення в розподілі, а впливають екстремальні частоти значень, наскільки часто те чи інше значення змінної трапляється в розподілі.
Кожне з мір центральної тенденції має загальні правила для використання, переваги та обмеження (табл. 10.1).

Які функції можна використовувати для знаходження центральної тенденції в середовищі табличного процесора?

У табличному процесорі центральна тенденція представлена функціями з категорії Статистичні, та майже всі вони призначені для обчислення узагальнювальних статистичних характеристик вибірки.
Статистичні функції, що розглядаються нижче (крім функції RANK), можуть мати декілька аргументів, які мають бути числами, масивами або посиланнями на діапазони клітинок, що містять числа. Якщо до діапазону-аргументу функції входять клітинки, які містять текст чи логічні значення або є порожніми, то вони ігноруються; але клітинки, що містять нульові значення, враховуються. Коли потрібно обчислити певну статистичну характеристику вибірки, діапазон, що містить елементи вибірки, слід зробити аргументом функції.
Ознайомимось із кількома найважливішими функціями категорії Статистичні:
- AVERAGE (число1; число2;…) (рос. СРЗНАЧ) - обчислює середнє значення;
- МАХ (число1; число2;…) (рос. МАКС) - обчислює максимальне значення;
- МІN (число1; число2;…) (рос. МИН) - обчислює мінімальне значення;
- МЕDІАN (число1; число2;…) (рос. МЕДИАНА) - повертає медіану;
- МОDЕ (число1; число2;…) (рос. МОДА) - повертає моду;
- RANK (число; посилання; порядок) (рос. РАНГ) - повертає ранг числа у списку чисел, тобто його номер у впорядкованій послідовності чисел із вказаного діапазону. Функція має такі аргументи: число – це число, для якого визначається ранг; посилання - це масив або посилання на список чисел; порядок - аргумент, який визначає спосіб упорядкування. Якщо цей аргумент відсутній або дорівнює нулю, то найбільше число має ранг 1. Якщо цей аргумент дорівнює будь-якому ненульовому числу, то ранг 1 має найменше число.
Примітка. Функція RANK призначає повторюваним числам однаковий ранг. Проте наявність повторюваних чисел впливає на ранги наступних чисел. Наприклад, якщо у списку цілих чисел, відсортованих за зростанням, двічі трапляється число 10 з рангом 5, число 11 матиме ранг 7 і жодне із чисел не матиме рангу 6.

Самостійне завдання.

Вправа 4. Витрати сімейного бюджету.
Завдання. Протягом деякого року сім’я витрачала на опалення будинку та
користування електроенергією кошти, які подано у статистичному ряді таблицею 10.2. Знайдіть основні статистичні характеристики ряду даних.
 (таб. 10.2)
1. Обчислимо середнє арифметичне.
2. Для знаходження медіани виконаємо упорядкування даних за зростанням. Для цього виділіть діапазон В1:М2, на вкладці Основне у списку оберіть Налаштовуване сортування. У вікні Сортування оберіть Параметри й у вікні Параметри сортування вкажіть стовпці діапазону. Натисніть OK.
3. Зазначте 2 рядок для сортування.
4. Центральними значеннями вибірки (n = 12) є значення у стовпцях G та H. . Знайдіть медіану засобами табличного процесора (=MEDIAN(B2:M2) (МЕДІАНА(B2:M2)). Перевірте, чи отримали таке само значення. Маємо, що середнє значення витрат більше тяжіє до половини значень у правій частині відсортованого діапазону.
5. За даними витрат найчастіше для оплати послуг витратили 200 грн (6, 9, 10 місяці). Це ж значення можна отримати в табличному процесорі за формулою=MODE(B2:M2)(=МОДА(B2:M2)).

Зразок виконання вправи 4. Витрати сімейного бюджету.
(Перегляньте уважно відео за посиланням https://www.youtube.com/watch?v=NCo3sBj4JsM

або QR кодом 



Комментариев нет:

Отправить комментарий