Mi az a parketta adatformátum?
Mi az a parketta adatformátum?

Videó: Mi az a parketta adatformátum?

Videó: Mi az a parketta adatformátum?
Videó: Mi az a REST API? 2024, Lehet
Anonim

Apache Parkett egy ingyenes és nyílt forráskódú oszlop-orientált adat tárolás formátum az Apache Hadoop ökoszisztéma. A legtöbbvel kompatibilis adat feldolgozási keretrendszerek a Hadoop környezetben. Hatékonyságot biztosít adat tömörítési és kódolási sémák fokozott teljesítménnyel az összetett kezeléséhez adat ömlesztve.

Egyszerűen, mi az a parketta fájlformátum?

Parkett , nyílt forráskódú fájlformátum a Hadoop számára. Parkett a beágyazott adatstruktúrákat lapos oszlopban tárolja formátum . A hagyományos megközelítéshez képest, ahol az adatokat sororientált megközelítésben tárolják, parkett tárolás és teljesítmény szempontjából hatékonyabb.

Továbbá, mire használják a parkettát? Parkett egy nyílt forráskódú fájlformátum, amely a Hadoop-ökoszisztéma bármely projektje számára elérhető. Apache Parkett Az adatok hatékony és eredményes lapos oszlopos tárolási formátumára tervezték, összehasonlítva a soralapú fájlokkal, például CSV- vagy TSV-fájlokkal.

Továbbá hogyan tárolja a parketta formátum az adatokat?

ADAT BLOKK Minden blokk a parkett fájl van tárolva sorcsoportok formájában. Így, adat a parkett fájl több sorcsoportra van felosztva. Ezek a sorcsoportok egy vagy több oszlopdarabból állnak, amelyek megfelelnek a adat készlet. Az adat oldalak formájában írt minden oszlopdarabhoz.

Olvasható a parketta?

ORC, Parkett , és az Avro is gép- olvasható bináris formátumok, ami azt jelenti, hogy a fájlok halandzsának tűnnek emberek . Ha szükséged van egy ember - olvasható formátumban, például JSON vagy XML, akkor valószínűleg újra kell gondolnia, hogy miért használja a Hadoopot.