Mi az a kulcsszó csökkentése?
Mi az a kulcsszó csökkentése?

Videó: Mi az a kulcsszó csökkentése?

Videó: Mi az a kulcsszó csökkentése?
Videó: HALSZAG CSÖKKENTÉSE SÜTÉS SORÁN 2024, Lehet
Anonim

A Spark RDD reductionByKey funkció egyesíti az egyes értékeket kulcs asszociatív elem segítségével csökkenteni funkció. Ez intuitív módon azt jelenti, hogy ez a funkció ugyanazt az eredményt adja, ha ismételten alkalmazzák ugyanazon RDD-adatkészleten, több partícióval, függetlenül az elemek sorrendjétől.

Akkor mi a különbség a groupByKey és a ReductionByKey között?

groupByKey () csak az adatkészlet egy kulcs alapján történő csoportosítására szolgál. ReductionByKey () valami olyasmi, mint a csoportosítás + összesítés. ReductionByKey akkor használható, ha nagy adatkészleten futunk. az aggregateByKey() logikailag ugyanaz, mint ReductionByKey () de lehetővé teszi az eredmény visszaadását különböző típus.

Tudja azt is, hogy miért csökkenti a szikrák cselekvését? Szikracsökkentés művelet egy akció típusú művelet, és teljes DAG-végrehajtást indít el az összes sorba rendezett lusta utasításra. Szikra RDD csökkenteni függvény csökkenti ennek az RDD-nek az elemeit a megadott kommutatív és asszociatív bináris operátor használatával. Szikracsökkentés működése szinte hasonló, mint csökkenteni módszer a Scalában.

A fentieken kívül mi az a Pairrdd?

A Spark speciális műveleteket biztosít a kulcs/érték párokat tartalmazó RDD-ken. Ezeket az RDD-ket páros RDD-knek nevezzük. Az RDD-párosítás sok program hasznos építőeleme, mivel olyan műveleteket tesz lehetővé, amelyek lehetővé teszik az egyes kulcsok párhuzamos kezelését vagy az adatok átcsoportosítását a hálózaton keresztül. Pár RDD KULCS/ÉRTÉK párok.

A ReductionByKey egy művelet?

A redukció() olyan gyűjteményt ad ki, amely nem ad hozzá az irányított aciklikus gráfhoz (DAG), így egy akció . Azonban, ReductionByKey () egy RDD-t ad vissza, amely csak egy másik szint/állapot a DAG-ban, ezért transzformáció.

Ajánlott: