Оглавление:

Что такое выбросы при анализе данных?
Что такое выбросы при анализе данных?

Видео: Что такое выбросы при анализе данных?

Видео: Что такое выбросы при анализе данных?
Видео: Методы обнаружения выбросов | Вебинар Яна Пиле | karpov.courses 2024, Май
Anonim

В статистике выброс это данные точка, которая существенно отличается от других наблюдений. An выброс может быть связано с изменчивостью в измерениях или может указывать на ошибку эксперимента; последние иногда исключаются из данные установленный. An выброс может вызвать серьезные проблемы в Статистический анализ.

Учитывая это, как вы обнаружите выбросы в данных?

Точка, выходящая за пределы данные внутренние ограждения комплекта классифицируются как второстепенные выброс , а тот, что выпадает за пределы ограды, классифицируется как крупный выброс . Чтобы найти внутренние ограждения для вашего данные установите, во-первых, умножьте межквартильный размах на 1,5. Затем прибавьте результат к Q3 и вычтите его из Q1.

Кроме того, следует ли мне удалять выбросы из моих данных? Для в большая часть, если ваши данные затронуты этими крайними случаями, вы жестяная банка граница в вклад исторического представителя ваши данные это исключает выбросы . В каждом конкретном случае определяйте, что в эффект выбросы было. И оттуда решите, хотите ли вы Удалить , изменить или оставить необычный ценности.

В связи с этим, как анализ данных имеет дело с выбросами?

Вот четыре подхода:

  1. Отбросьте записи о выбросах. В случае с Биллом Гейтсом или другим истинным выбросом, иногда лучше полностью удалить эту запись из набора данных, чтобы этот человек или событие не исказили ваш анализ.
  2. Ограничьте данные о выбросах.
  3. Присвойте новое значение.
  4. Попробуйте трансформацию.

Какой пример выброса?

Выброс . more Значение, которое «лежит вне» (намного меньше или больше) большинства других значений в наборе данных. Для пример в очках 25, 29, 3, 32, 85, 33, 27, 28 и 3 и 85 баллов " выбросы ".

Рекомендуемые: