Видео: Что такое сокращение по ключу?
2024 Автор: Lynn Donovan | [email protected]. Последнее изменение: 2023-12-15 23:52
Функция Spark RDD reduceByKey объединяет значения для каждого ключ используя ассоциативный уменьшать функция. Это интуитивно означает, что эта функция дает тот же результат при повторном применении к одному и тому же набору данных RDD с несколькими разделами независимо от порядка элементов.
Тогда в чем разница между groupByKey и reduceByKey?
groupByKey () - это просто группировка набора данных на основе ключа. reduceByKey () - это что-то вроде группировки + агрегации. reduceByKey может использоваться, когда мы работаем с большим набором данных. aggregateByKey () логически совпадает с reduceByKey (), но он позволяет вернуть результат в другой тип.
Также знайте, почему уменьшить действие в искре? Снижение искры операция действие тип операции, и он запускает полное выполнение DAG для всех выстроенных ленивых инструкций. Искра RDD уменьшать функция уменьшает элементы этого СДР с помощью указанного коммутативного и ассоциативного бинарного оператора. Снижение искры операция почти аналогична уменьшать метод в Scala.
Кроме того, что такое Pairrdd?
Spark предоставляет специальные операции с RDD, содержащими пары ключ / значение. Эти RDD называются парными RDD. Парные RDD - полезный строительный блок во многих программах, поскольку они предоставляют операции, которые позволяют вам воздействовать на каждый ключ параллельно или перегруппировать данные по сети. PairRDD являются парами КЛЮЧ / ЗНАЧЕНИЕ.
ReduceByKey - это действие?
reduce () выводит коллекцию, которая не добавляет к ориентированному ациклическому графу (DAG), поэтому реализована как действие . Тем не мение, reduceByKey () возвращает RDD, который является просто еще одним уровнем / состоянием в DAG, следовательно, является преобразованием.
Рекомендуемые:
Что эквивалентно гаечному ключу на 7 мм?
Размер ключа и таблица преобразования Дюймы Миллиметры Гаечный ключ 0,276 7 мм 7 мм 0,313 5/16 AF 0,315 8 мм 8 мм 0,344 11/32 AF; 1/8 Вворта
Что такое сокращение в глубоком обучении?
Сокращение - это метод глубокого обучения, который помогает в разработке меньших и более эффективных нейронных сетей. Это метод оптимизации модели, который включает в себя удаление ненужных значений в тензоре весов
Что такое сокращение от Colo?
Colo Acronym Определение Colo Colorado (сокращенное название штата в старом стиле) Colo Co-Location Colo Columbus, Ohio Colo Colonial National Historic Park (Служба национальных парков США)
Требуется ли индекс по внешнему ключу?
Обычно рекомендуется создать индекс, ведущий к столбцу (столбцам) внешнего ключа, чтобы поддерживать не только соединения между первичным и внешним ключами, но также обновлять и удалять
Что такое сокращение функций в машинном обучении?
Цель использования сокращения функций - уменьшить количество функций (или переменных), которые компьютер должен обрабатывать для выполнения своей функции. Сокращение функций используется для уменьшения количества измерений, делая данные менее разреженными и более статистически значимыми для приложений машинного обучения