Videó: Mi az a parketta adatformátum?
2024 Szerző: Lynn Donovan | [email protected]. Utoljára módosítva: 2023-12-15 23:48
Apache Parkett egy ingyenes és nyílt forráskódú oszlop-orientált adat tárolás formátum az Apache Hadoop ökoszisztéma. A legtöbbvel kompatibilis adat feldolgozási keretrendszerek a Hadoop környezetben. Hatékonyságot biztosít adat tömörítési és kódolási sémák fokozott teljesítménnyel az összetett kezeléséhez adat ömlesztve.
Egyszerűen, mi az a parketta fájlformátum?
Parkett , nyílt forráskódú fájlformátum a Hadoop számára. Parkett a beágyazott adatstruktúrákat lapos oszlopban tárolja formátum . A hagyományos megközelítéshez képest, ahol az adatokat sororientált megközelítésben tárolják, parkett tárolás és teljesítmény szempontjából hatékonyabb.
Továbbá, mire használják a parkettát? Parkett egy nyílt forráskódú fájlformátum, amely a Hadoop-ökoszisztéma bármely projektje számára elérhető. Apache Parkett Az adatok hatékony és eredményes lapos oszlopos tárolási formátumára tervezték, összehasonlítva a soralapú fájlokkal, például CSV- vagy TSV-fájlokkal.
Továbbá hogyan tárolja a parketta formátum az adatokat?
ADAT BLOKK Minden blokk a parkett fájl van tárolva sorcsoportok formájában. Így, adat a parkett fájl több sorcsoportra van felosztva. Ezek a sorcsoportok egy vagy több oszlopdarabból állnak, amelyek megfelelnek a adat készlet. Az adat oldalak formájában írt minden oszlopdarabhoz.
Olvasható a parketta?
ORC, Parkett , és az Avro is gép- olvasható bináris formátumok, ami azt jelenti, hogy a fájlok halandzsának tűnnek emberek . Ha szükséged van egy ember - olvasható formátumban, például JSON vagy XML, akkor valószínűleg újra kell gondolnia, hogy miért használja a Hadoopot.