Mi az AWS MapReduce?
Mi az AWS MapReduce?

Videó: Mi az AWS MapReduce?

Videó: Mi az AWS MapReduce?
Videó: AWS EMR Tutorial [FULL COURSE in 60mins] 2024, November
Anonim

Amazon Elasztikus MapReduce (EMR) egy Amazon Web Services ( AWS ) eszköz nagy adatfeldolgozáshoz és elemzéshez. Az Amazon EMR nagy adatokat dolgoz fel az Amazon Elastic Compute Cloud (EC2) és az Amazon Simple Storage Service (S3) virtuális szerverek Hadoop-fürtjén keresztül.

Ilyen módon hogyan működik az AWS EMR?

A szolgáltatás elindítja az ügyfél által megadott számú Amazon EC2-példányt, amely egy mesterből és több másik csomópontból áll. amazon EMR Hadoop szoftvert futtat ezeken a példányokon. A mester csomópont blokkokra osztja a bemeneti adatokat, és elosztja a blokkok feldolgozását a többi csomópontnak.

A fentieken kívül mi a különbség az ec2 és az EMR között? nem úgy mint EMR , EC2 nem kategorizálja a szolga csomópontokat mag- és feladatcsomópontokba. Ez növeli a HDFS-adatok elvesztésének kockázatát, ha egy csomópontot eltávolítanak/elvesznek. EC2 Apache könyvtárakat (s3a) használ az s3-on lévő adatok eléréséhez. Másrészről, EMR AWS saját kódot használ az s3 gyorsabb eléréséhez.

Ezenkívül az AWS EMR teljes mértékben felügyelt?

amazon Elastic MapReduce ( EMR ) egy teljes mértékben kezelt Hadoop és Spark platform innen amazon Webszolgáltatás ( AWS ). Val vel EMR , AWS Az ügyfelek gyorsan felállíthatnak több csomópontból álló Hadoop-fürtöket a nagy adatforgalmi terhelések feldolgozásához.

Használja az AWS a Hadoopot?

amazon Webszolgáltatások használ a nyílt forráskódú Apache Hadoop elosztott számítási technológia, amely megkönnyíti a nagy mennyiségű számítási teljesítmény elérését az adatigényes feladatok futtatásához. Hadoop , a Google MapReduce nyílt forráskódú változatát már olyan cégek is használják, mint a Yahoo és a Facebook.

Ajánlott: