Hogyan érhető el az adatok lokalizálása a Hadoopban?
Hogyan érhető el az adatok lokalizálása a Hadoopban?

Videó: Hogyan érhető el az adatok lokalizálása a Hadoopban?

Videó: Hogyan érhető el az adatok lokalizálása a Hadoopban?
Videó: hadoop yarn architecture 2024, Lehet
Anonim

Adatok lokalizálása ban ben Hadoop . Vegyük a Wordcount minta példát, ahol a legtöbb szó 5 Lacs vagy több alkalommal ismétlődött. Ebben az esetben a Mapper fázis után minden egyes leképező kimenetben 5 Lacs tartományban lesznek szavak. Ezt a teljes folyamatot, amely a Mapper kimenetének az LFS-ben tárolja, úgy hívják Adatok lokalizálása.

Ezt szem előtt tartva, mi az adathonosítás a Hadoopban?

A koncepció Adat helységben Hadoop adatok helységben MapReduce arra a képességre utal, hogy a számítást a ténylegeshez közel lehet mozgatni adat a csomóponton található, ahelyett, hogy nagyot mozogna adat a számításhoz. Ez minimálisra csökkenti a hálózati torlódást és növeli a rendszer teljes átviteli sebességét.

Illetve hogyan tárolódnak a big data? A legtöbb ember automatikusan társítja a HDFS-t vagy a Hadoop elosztott fájlrendszert a Hadoop-pal adat raktárak. A HDFS kisebb blokkokból álló fürtökben tárolja az információkat. Ezek a blokkok tárolva helyszíni fizikai tárolás egységek, például belső lemezmeghajtók.

Csak hát, hogyan tárolódnak az adatok a Hadoopban?

Rajta Hadoop klaszter, a adat A HDFS és a MapReduce rendszer a fürt minden gépén megtalálható. Adat van tárolva ban ben adat blokkok a DataNodes-on. A HDFS ezeket reprodukálja adat blokkok, általában 128 MB méretű, és elosztja őket, így replikálódnak több csomóponton belül a fürtben.

Hogyan tárolódnak a fájlok a HDFS-ben?

HDFS kiteszi a fájlt rendszer névterét, és lehetővé teszi a felhasználói adatok használatát tárolva ban ben fájlokat . Belsőleg a fájlt fel van osztva egy vagy több blokkra, és ezek a blokkok tárolva egy DataNodes halmazban. A NameNode végrehajtódik fájlt rendszernévtér-műveletek, például nyitás, bezárás és átnevezés fájlokat és könyvtárakat.

Ajánlott: