Статистика
Перевірка гіпотез, PCA, бутстреп, нормальний розподіл та інші фундаментальні інструменти статистичного висновку — інтерактивно.
🧪 Симуляції (14)
❓ Часті запитання
Що таке p-значення?
P-значення — це ймовірність отримати дані не менш екстремальні, ніж виміряні, за умови, що нульова гіпотеза правдива. P-значення нижче 0.05 традиційно означає відкидання нульової гіпотези. Але це НЕ ймовірність того, що нульова гіпотеза правильна — поширена помилка трактування.
Що таке PCA?
Метод головних компонент знаходить лінійні комбінації змінних (компоненти), що захоплюють найбільшу дисперсію. Перша компонента вказує напрям найбільшого розкиду; наступні — ортогональні. Використовується для зменшення розмірності, візуалізації та інженерії ознак.
Що таке центральна гранична теорема?
Центральна гранична теорема стверджує: сума (або середнє) багатьох незалежних випадкових величин прямує до нормального розподілу незалежно від їхніх власних розподілів. Тому дзвоноподібна крива з'являється всюди: ріст людей, помилки вимірювань, лабораторні аналізи.
Що таке бутстреп?
Бутстреп — це випадкова вибірка (з поверненням) з ваших даних для оцінки розподілу вибірки статистики. Корисно, коли аналітичні довірчі інтервали важко обчислити — працює для медіан, відношень, кореляцій. Процедура: ресамплінг → обчислення → 10 000 повторів.
Коли використовувати t-тест, а коли непараметричний тест?
T-тест — коли дані приблизно нормальні або n великий (працює ЦГТ). Тест Вілкоксона / Манна-Уітні — коли дані ненормальні, порядкові або з важкими викидами. Інтерактивні симуляції дозволяють порівняти обидва на синтетичних даних.