Что такое AWS MapReduce?
Что такое AWS MapReduce?

Видео: Что такое AWS MapReduce?

Видео: Что такое AWS MapReduce?
Видео: Introduction to Amazon Elastic MapReduce | Big Data Application on AWS | Intellipaat 2024, Декабрь
Anonim

Amazon Elastic Уменьшение карты (EMR) - это Amazon Web Services ( AWS ) инструмент для обработки и анализа больших данных. Amazon EMR обрабатывает большие данные в кластере виртуальных серверов Hadoop в Amazon Elastic Compute Cloud (EC2) и Amazon Simple Storage Service (S3).

Таким образом, как работает AWS EMR?

Служба запускает указанное клиентом количество инстансов Amazon EC2, состоящее из одного главного и нескольких других узлов. Амазонка EMR запускает программное обеспечение Hadoop на этих экземплярах. Главный узел делит входные данные на блоки и распределяет обработку блоков по другим узлам.

Кроме того, в чем разница между ec2 и EMR? В отличие от EMR , EC2 не разделяет подчиненные узлы на основные и рабочие узлы. Это увеличивает риск потери данных HDFS в случае удаления / потери узла. EC2 использует библиотеки Apache (s3a) для доступа к данным на s3. С другой стороны, EMR использует собственный код AWS для более быстрого доступа к s3.

Кроме того, полностью ли управляем AWS EMR?

Амазонка Эластичный MapReduce ( EMR ) это полностью управляемый Платформа Hadoop и Spark от Амазонка Веб-сервис ( AWS ). С участием EMR , AWS заказчики могут быстро развернуть многоузловые кластеры Hadoop для обработки рабочих нагрузок с большими данными.

Использует ли AWS Hadoop?

Амазонка Веб-сервисы использует Apache с открытым исходным кодом Hadoop технология распределенных вычислений, упрощающая доступ к большим объемам вычислительной мощности для выполнения задач с большим объемом данных. Hadoop версия Google MapReduce с открытым исходным кодом уже используется такими компаниями, как Yahoo и Facebook.

Рекомендуемые: