У вас нет прав на выполнение действия «редактирование этой страницы» по следующей причине:
Текст:
Выборка — часть генеральной совокупности, выбранная для исследования. Это подмножество единиц генеральной совокупности, отобранное специальным методом и предназначенное для характеристики всей генеральной совокупности. ; Объем выборки : Объем выборки (<math>n</math>) — количество результатов измерений, взятых для исследования. === Основные параметры выборки === # Среднее арифметическое: <math>M</math> или <math>\bar{x}</math> # [[Дисперсия]]: <math>S^2</math> # [[Стандартное отклонение]]: <math>S</math> # [[Математическое ожидание]] <math>M(X) = \sum_{i=1}^{n} x_i \cdot p_i</math> {{#ask: [[Дисперсия]] OR [[Стандартное отклонение]] OR [[Математическое ожидание]] | ?Description }} ; Простая случайная выборка (Simple Random Sampling) Простая случайная выборка — это статистический метод, при котором каждый элемент генеральной совокупности имеет известную и равную вероятность отбора. При простой случайной выборке каждый элемент отбирается независимо от других элементов. ; Ключевые характеристики простой случайной выборки #Равная вероятность отбора: каждая единица генеральной совокупности имеет одинаковую вероятность быть выбранной #Независимость отбора: выбор одного элемента не влияет на вероятность выбора других элементов # Случайность процесса: отбор осуществляется с помощью таблиц случайных чисел или генераторов случайных чисел ; Формула вероятности отбора Для простой случайной выборки без возвращения вероятность отбора каждого элемента равна: <math>P = \frac{n}{N}</math> где <math>n</math> — размер выборки, <math>N</math> — размер генеральной совокупности. ; Формула размера выборки Для определения минимального размера простой случайной выборки используется формула: <math>n = \frac{z^2 \cdot p \cdot (1-p)}{e^2}</math> где: * <math>z</math> — значение стандартного нормального распределения для заданного уровня доверия (например, 1.96 для 95%) * <math>p</math> — ожидаемая доля признака в генеральной совокупности * <math>e</math> — допустимая ошибка == Sample Size (Размер выборки, n) == ; Определение :Количество наблюдений в [[датасет]]е. ; Интерпретация: * Большой n → более надежные результаты, узкие доверительные интервалы * Маленький n → менее надежные результаты, широкие доверительные интервалы '''Математическая зависимость''': <math>\text{Стандартная ошибка} = \frac{\text{stdev}}{\sqrt{n}}</math> Если увеличить n в 4 раза → стандартная ошибка уменьшится в 2 раза ; Минимальный размер выборки: * Для [[бутстрэп]]а: n ≥ 30 * Для хороших результатов: n ≥ 100 * Для очень надежных результатов: n ≥ 1000
Записать страницу Отменить