Mi az a Data Lake a Hadoopban?
Mi az a Data Lake a Hadoopban?

Videó: Mi az a Data Lake a Hadoopban?

Videó: Mi az a Data Lake a Hadoopban?
Videó: Apache Phoenix: a SQL Skin for HBase | Big Data Hadoop Tutorial 2024, Lehet
Anonim

A Hadoop Data Lake egy adat egy vagy több felügyeleti platform Hadoop klaszterek. Elsősorban a nem relációs adatok feldolgozására és tárolására szolgál adat , mint például a naplófájlok, internetes kattintásfolyam rekordok, érzékelő adat , JSON-objektumok, képek és közösségimédia-bejegyzések.

Ebben a tekintetben mi a különbség az adattárház és az adattó között?

Adattavak és adat a raktárakat egyaránt széles körben használják nagyok tárolására adat , de ezek nem felcserélhető kifejezések. A adattó hatalmas mennyiségű nyersanyag adat , amelynek célja még nincs meghatározva. A adattárház a strukturált, szűrt adattár adat amelyet már meghatározott célból feldolgoztak.

Ezenkívül mi az a Data Lake architektúra? A Data Lake egy olyan tárolási adattár, amely nagy mennyiségű strukturált, félig strukturált és strukturálatlan tárolására képes adat . Ellentétben egy hierarchikus Dataware házzal, ahol adat a Fájlokban és mappákban van tárolva, Data tó lakása van építészet.

Ezzel kapcsolatban mit kell érteni Data Lake alatt?

A adattó egy tárhely, amely hatalmas mennyiségű nyersanyagot tárol adat natív formátumában, amíg nincs rá szükség. Miközben egy hierarchikus adat raktári üzletek adat fájlokban vagy mappákban, a adattó lapos architektúrát használ a tároláshoz adat . A kifejezés adattó gyakran társítják a Hadoop-orientált objektumtárolást.

Az Elasticsearch egy adattó?

A adattó egyszerűen csak egy hely, ahol le lehet parkolni adat amíg szüksége van rá, és magában foglalhatja a HDFS-t (leggyakoribb), az objektumtárolókat, a NAS-dobozokat vagy bármi mást. Alapvetően, Elaszticsearch az indexelés eszköze adat , nem tárolására szolgál adat maga.

Ajánlott: