понедельник, 30 марта 2020 г.

Інформатика, для групи 2-3. Урок 12. Тема: Основи статистичного аналізу даних. Ряди даних.


Урок 12
Тема: Основи статистичного аналізу даних. Ряди даних.
Ви дізнаєтеся:
v що таке аналіз даних та які виділяють етапи аналізу даних;
v у чому суть статистичного підходу до опрацювання даних;
v як будують ряди даних;

Що таке аналіз даних та які виділяють етапи аналізу даних?
Аналіз даних — розділ математики та інформатики, що займається розробкою методів опрацювання даних незалежно від їх природи.
Для аналізу даних потрібні знання предметної області та знання математики й статистики. Розуміння предметної області дає змогу визначити, які проблеми потребують першочергового вирішення. Знання математики й статистики дають змогу формалізувати рішення, перевести його в алгоритм та оцінити, яка ймовірність отримати результат; для цього використовують засоби комп’ютерної техніки.
Розрізняють чотири етапи аналізу даних (мал. 10.1).

 (мал.10.1)

Спочатку дані необхідно підготувати, тобто зібрати та відібрати ті, які потрібні для моделі опрацювання. Далі будується модель опрацювання й аналізуються її результати. Останній етап — це інтерпретація та презентація результатів. Тут потрібно продемонструвати питання, на яке шукали відповідь, які дані використовували та що отримали в результаті.

При збиранні даних використовують різні рівні їх виміру. Наприклад,
розрізняють значення в певній точці (8; 3,6); можна розглядати різні
інтервали ([1,6] [0,15]) та різні відношення (86 %, 14 %).
У чому суть статистичного підходу до опрацювання даних?
Коли ми робимо виміри, то завжди існує ймовірність похибки. Багаторазове вимірювання та збереження при цьому відповідних результатів приводить до накопичення даних, які опрацьовують спеціальними методами, які вивчаються у статистиці. Такі дані називаються статистичними даними.
Статистичні дані — сукупність упорядкованих, класифікованих даних про деяке масове явище або процес.
Статистичні дані дають змогу не тільки охопити картину певного питання на даний час, а й планувати необхідні дії на майбутнє. Так, статистичні дані про зайнятість населення дають можливість визначити, яку кількість спеціалістів і якої кваліфікації слід готувати, у якому регіоні варто споруджувати те чи інше підприємство.
Велику множину об’єктів, що є предметом статистичного дослідження, називають генеральною сукупністю. Наприклад, якщо досліджуються передвиборчі вподобання, генеральною сукупністю може бути населення країни. Проте дослідник, як правило, не має змоги оперувати всією генеральною сукупністю. Наприклад, опитати кожного громадянина країни нереально. Натомість досліджують вибірку — деяку множину об’єктів, вибраних з генеральної сукупності, і, проаналізувавши її, роблять висновки щодо властивостей генеральної сукупності загалом. Так,
дослідивши вподобання 10 000 виборців, можна зробити достатньо точні висновки щодо вподобань виборців усієї країни. У заміні дослідження великої множини об’єктів дослідженням значно меншою її частиною та подальшому «поширенні» результатів дослідження на всю множину полягає сутність статистичного підходу до опрацювання даних.

Самостійне завдання.
Вправа 1. Статистичні довідники.
Завдання. На сайті Державної служби статистики (http://www.ukrstat.gov.ua)
у вкладці Статистична інформація встановіть, які статистичні дані наведено на сайті, яким чином їх можна переглянути та які умови доступу до даних. Зробіть висновки.
Зразок виконання вправи1. Статистичні довідники. (Перегляньте уважно відео за посиланням https://www.youtube.com/watch?v=-QcDJMf8844 ))

або QR кодом 








Тема: Як будують ряди даних?
Статистичний ряд розподілу - це впорядковані статистичні дані.
Найпростішим видом статистичного ряду розподілу є ранжований ряд, тобто ряд чисел, що розташовані в порядку зростання чи спадання ознаки, яка змінюється. Такий ряд не дає змоги судити про закономірності, закладені в розподілених даних: біля якої величини групується більшість показників; які є відхилення від цієї величини; яка загальна картина розподілу. Із цією метою дані групують, показуючи, як часто трапляються окремі спостереження в загальній їх кількості.
Ряди розподілу одиниць сукупності за ознаками, що мають кількісний вираз, називаються варіаційними рядами. У таких рядах значення ознаки (варіанти) розташовані в порядку зростання або спадання.
У варіаційному ряді розподілу розрізняють два елементи: варіанта й частота. Варіанта - це окреме значення групувальної ознаки; частота - число, яке показує, скільки разів трапляється кожна варіанта (мал. 10.2). 
Таким чином, варіаційний ряд розподілу - це такий ряд, у якому варіанти розташовані в порядку зростання або спадання, вказані їх частоти або частки. Варіаційні ряди бувають дискретні й інтервальні.
Дискретні варіаційні ряди — це такі ряди розподілу, в яких варіанта як величина кількісної ознаки може набувати тільки певного значення. Варіанти різняться між собою на одну чи кілька одиниць.
Інтервальні варіаційні ряди — такі ряди розподілу, в яких значення варіанти дано у вигляді інтервалів, тобто значення ознак можуть відрізнятися одне від одного на як завгодно малу величину. При побудові варіаційного ряду неперервної ознаки неможливо вказати кожне значення варіанти, тому сукупність розподіляється за інтервалами. Останні можуть бути рівні й нерівні.
Для побудови дискретного ряду розподілу слід виписати всі можливі значення ознаки, а потім підрахувати, скільки разів кожне з них трапляється у вибірці - це будуть частоти. У Microsoft Excel для підрахунку частот можна застосувати функцію COUNTIF (рос. СЧЕТЕСЛИ) з категорії Статистичні.

Самостійне завдання.
Вправа 2. Побудова дискретного розподілу.
Завдання. Учні проводили експеримент із гральним кубиком: кожен записував число, яке випало на верхній грані. Побудуйте дискретний ряд розподілу експерименту.
1   1. Відкрийте файл Кубик_Експеримент, що міститься в папці Статистика на спільному ресурсі.  
     2. Проаналізуйте результати експерименту, складіть таблицю для обчислення частоти випадання грані кубика за зразком (мал. 10.4).
     
3. Для обчислення частоти скористайтесь формулою. Наприклад, у клітинці

С3: =СЧЁТЕСЛИ($A2:$A21;C2) (С3:=COUNTIF(($A2:$A21;C2)
4. Перевірте, чи можна застосувати автозаповнення для діапазону D2:H2.
Відповідь поясніть.
5. Збережіть файл у папці власного сховища з тим самим іменем.

Зразок виконання вправи 2. Побудова дискретного розподілу.
(Перегляньте уважно відео за посиланням https://www.youtube.com/watch?v=Xi8D53vm6s8

або QR кодом 
Самостійне завдання.

Вправа 3. Побудова інтервального ряду розподілу.
Завдання. Побудуйте інтервальний ряд розподілу з п’яти інтервалів за даними опитування учнів про кількість сторінок художньої літератури, які вони прочитали протягом останніх вихідних.
1. Відкрийте файл Сторінки_Експеримент, що міститься в папці Статистика
на спільному ресурсі.
2. Визначте найбільше, найменше значення вибірки та крок побудови інтервалу, якщо кількість інтервалів становить 5.
3. Складіть таблицю Межі Інтервалів (діапазон D1:D5).
4. Задайте функцію FREQUENCY (Частота ) в діапазон G2:G6, де ми бачимо результати її обчислення, тобто частоти.
5. Збережіть файл у папці власного сховища з тим самим іменем.

Зразок виконання вправи 3. Побудова інтервального ряду розподілу.
(Перегляньте уважно відео за посиланням https://www.youtube.com/watch?v=49Djr1z5mJo

або QR кодом 









Комментариев нет:

Отправить комментарий