Видео: Что такое DistCp в Hadoop?
2024 Автор: Lynn Donovan | [email protected]. Последнее изменение: 2023-12-15 23:52
DistCp (распределенное копирование) - это инструмент, используемый для большого межкластерного / внутрикластерного копирования. Оно использует Уменьшение карты для его распространения, обработки ошибок и восстановления, а также создания отчетов. Он расширяет список файлов и каталогов во входные данные для сопоставления задач, каждая из которых копирует раздел файлов, указанных в исходном списке.
Точно так же можно спросить, перезаписывает ли Distcp?
Я также должен уточнить некоторые и объяснить, что distcp - перезаписывать буду перезаписывать файл независимо от того, совпадает ли его размер или нет. Это обновит все файлы в hdfs-nn2, которые не совпадают по размеру с hdfs-nn1, а также удалит все посторонние файлы.
Аналогично, что такое команда Hadoop FS? Файловая система ( FS ) оболочка включает в себя различные оболочки, похожие на команды которые напрямую взаимодействуют с Hadoop Распределенная файловая система ( HDFS ), а также другие файловые системы, Hadoop поддерживает, например Local FS , HFTP FS , S3 FS , и другие.
Таким образом, как мне перенести данные из одного диска Hdf в другой?
Hadoop fs cp - Самый простой способ скопировать данные из одного исходный каталог для Другая . Использовать хадуп fs -cp [источник] [назначение]. Hadoop fs copyFromLocal - необходимо копировать данные из локальной файловой системы в HDFS ? Использовать хадуп fs -copyFromLocal [источник] [назначение].
Как скопировать кластер из одного кластера в другой?
Копирование файлов между кластеры . Вы можете копировать файлы или каталоги между разными кластеры с помощью команды hadoop distcp. Вы должны указать учетные данные файл в вашей копировать запрос так, чтобы источник кластер может подтвердить, что вы аутентифицированы для источника кластер и цель кластер.
Рекомендуемые:
Что такое w3c, что такое Whatwg?
Рабочая группа по технологиям веб-гипертекстовых приложений (WHATWG) - это сообщество людей, заинтересованных в развитии HTML и связанных с ним технологий. WHATWG была основана в 2004 году представителями Apple Inc., Mozilla Foundation и Opera Software, ведущих поставщиков веб-браузеров
Что такое процесс в операционной системе, что такое поток в операционной системе?
Проще говоря, процесс - это исполняемая программа. Один или несколько потоков выполняются в контексте процесса. Поток - это основная единица, которой операционная система выделяет время процессора. Пул потоков в основном используется для уменьшения количества потоков приложений и обеспечения управления рабочими потоками
Что такое персональный компьютер Что такое аббревиатура?
ПК - это аббревиатура персонального компьютера
Что такое эвристика репрезентативности Что такое эвристика доступности?
Эвристика доступности - это мысленный ярлык, который помогает нам принять решение на основе того, насколько легко что-то вспомнить. Эвристика репрезентативности - это мысленный ярлык, который помогает нам принять решение, сравнивая информацию с нашими мысленными прототипами
Что такое Function Point, объясните ее важность Что такое функционально-ориентированные показатели?
Функциональная точка (FP) - это единица измерения, выражающая объем бизнес-функций, которые информационная система (как продукт) предоставляет пользователю. FP измеряют размер программного обеспечения. Они широко используются в качестве отраслевого стандарта для определения функциональных размеров