Что такое Spark Broadcast?
Что такое Spark Broadcast?

Видео: Что такое Spark Broadcast?

Видео: Что такое Spark Broadcast?
Видео: Spark Broadcast variable 2024, Май
Anonim

Транслировать переменные в Apache Искра - это механизм для обмена переменными между исполнителями, которые предназначены только для чтения. Без транслировать переменные эти переменные будут отправлены каждому исполнителю для каждого преобразования и действия, и это может вызвать накладные расходы сети.

Точно так же люди спрашивают, когда я должен транслировать Spark?

Транслировать переменные в основном используются, когда для выполнения задач на нескольких этапах требуются одни и те же данные или когда требуется кэширование данных в десериализованной форме. Транслировать переменные создаются с использованием переменной v путем вызова SparkContext.

Кроме того, что такое аккумуляторы и широковещательные переменные в искре? Искра поддерживает два типа общих переменные : широковещательные переменные , который можно использовать для кэширования значения в памяти на всех узлах, и аккумуляторы , которые переменные которые только «добавляются», например, счетчики и суммы.

Учитывая это, что такое искровой аккумулятор?

Аккумуляторы - это переменные, которые «добавляются» только через ассоциативную операцию и поэтому могут эффективно поддерживаться параллельно. Их можно использовать для реализации счетчиков (как в MapReduce) или сумм. Искра изначально поддерживает аккумуляторы числовых типов, и программисты могут добавить поддержку новых типов.

Как мне обновить свою широковещательную переменную в Spark?

  1. Переместите поиск справочных данных в forEachPartition или forEachRdd, чтобы он полностью принадлежал рабочим.
  2. Перезапускайте контекст Spark каждый раз при изменении refdata с новой широковещательной переменной.

Рекомендуемые: