Tartalomjegyzék:

Futtathatom a Python-t Hadoopon?
Futtathatom a Python-t Hadoopon?

Videó: Futtathatom a Python-t Hadoopon?

Videó: Futtathatom a Python-t Hadoopon?
Videó: Installing Python for the Python Transformation on Hadoop 2024, Lehet
Anonim

Olyan programozási nyelvek közül választhat, mint a Java, Scala és Piton számára Hadoop ökoszisztéma, a legtöbb fejlesztő használja Piton az adatelemzési feladatokat támogató könyvtárai miatt. Hadoop A streaming lehetővé teszi a felhasználó számára, hogy létrehozza és végrehajtani Feladatok leképezése/kicsinyítése bármilyen szkripttel vagy végrehajtható fájllal leképezőként és/vagy szűkítőként.

Hasonlóképpen felteszik a kérdést, hogyan kapcsolódik a Python a Hadoophoz?

A Hadoop HDFS csatlakoztatása a Pythonhoz

  1. 1. lépés: Győződjön meg arról, hogy a Hadoop HDFS megfelelően működik. Nyissa meg a terminált/parancssort, és ellenőrizze, hogy a HDFS működik-e a következő parancsokkal: start-dfs.sh.
  2. 2. lépés: Telepítse a libhdfs3 könyvtárat.
  3. 3. lépés: Telepítse a hdfs3 könyvtárat.
  4. 4. lépés: Ellenőrizze, hogy a HDFS-hez való csatlakozás sikeres-e.

Hasonlóképpen, mi a Hadoop a Pythonban? Piton egy általános célú, teljes programozási nyelv, amely szinte mindenre használható a programozási világban. Hadoop egy Java nyelven írt big data keretrendszer hatalmas adatmennyiség kezelésére. Számos online intézet létezik, amelyek Hadoop val vel Piton tanfolyamok, mint például: Analytixlabs. Edureka.

Ezt követően a kérdés az, hogyan futtathatok Python MapReduce programot a Hadoopban?

Hadoop MapReduce program írása Pythonban

  1. Motiváció.
  2. Mit akarunk csinálni.
  3. Előfeltételek.
  4. Python MapReduce kód. Térképlépés: mapper.py. Lépéscsökkentés: reduktor.py.
  5. A Python kód futtatása a Hadoopon. Példa bemeneti adatok letöltése. Másolja a helyi példaadatokat HDFS-be.
  6. Továbbfejlesztett Mapper és Reducer kód: Python iterátorok és generátorok használata. mapper.py. reduktor.py.

Mi az a Hadoop Streaming jar?

Hadoop nevű Java segédprogramot biztosít Hadoop Streaming . Be van csomagolva a befőttes üveg fájlt. Val vel Hadoop Streaming , Map Reduce feladatokat készíthetünk és futtathatunk futtatható szkripttel. Hadoop Streaming egy segédprogram, amely a Hadoop terjesztés. Használható nagy adatok elemzésére szolgáló programok végrehajtására.

Ajánlott: