- Szerző Lynn Donovan [email protected].
- Public 2023-12-15 23:48.
- Utoljára módosítva 2025-01-22 17:27.
Apache Parkett egy ingyenes és nyílt forráskódú oszlop-orientált adat tárolás formátum az Apache Hadoop ökoszisztéma. A legtöbbvel kompatibilis adat feldolgozási keretrendszerek a Hadoop környezetben. Hatékonyságot biztosít adat tömörítési és kódolási sémák fokozott teljesítménnyel az összetett kezeléséhez adat ömlesztve.
Egyszerűen, mi az a parketta fájlformátum?
Parkett , nyílt forráskódú fájlformátum a Hadoop számára. Parkett a beágyazott adatstruktúrákat lapos oszlopban tárolja formátum . A hagyományos megközelítéshez képest, ahol az adatokat sororientált megközelítésben tárolják, parkett tárolás és teljesítmény szempontjából hatékonyabb.
Továbbá, mire használják a parkettát? Parkett egy nyílt forráskódú fájlformátum, amely a Hadoop-ökoszisztéma bármely projektje számára elérhető. Apache Parkett Az adatok hatékony és eredményes lapos oszlopos tárolási formátumára tervezték, összehasonlítva a soralapú fájlokkal, például CSV- vagy TSV-fájlokkal.
Továbbá hogyan tárolja a parketta formátum az adatokat?
ADAT BLOKK Minden blokk a parkett fájl van tárolva sorcsoportok formájában. Így, adat a parkett fájl több sorcsoportra van felosztva. Ezek a sorcsoportok egy vagy több oszlopdarabból állnak, amelyek megfelelnek a adat készlet. Az adat oldalak formájában írt minden oszlopdarabhoz.
Olvasható a parketta?
ORC, Parkett , és az Avro is gép- olvasható bináris formátumok, ami azt jelenti, hogy a fájlok halandzsának tűnnek emberek . Ha szükséged van egy ember - olvasható formátumban, például JSON vagy XML, akkor valószínűleg újra kell gondolnia, hogy miért használja a Hadoopot.
