Hogyan számítja ki az Lstm a paraméterek számát?
Hogyan számítja ki az Lstm a paraméterek számát?

Videó: Hogyan számítja ki az Lstm a paraméterek számát?

Videó: Hogyan számítja ki az Lstm a paraméterek számát?
Videó: True Artificial Intelligence will change everything | Juergen Schmidhuber | TEDxLakeComo 2024, November
Anonim

Tehát az Ön értékei szerint. A képletbe betáplálva:->(n=256, m=4096), összesen a paraméterek száma 4*((256*256) + (256*4096) + (256)) = 4*(1114368) = 4457472. szám súlyok van 28 = 16 (egységek_száma * egységek_száma) az ismétlődő kapcsolatokhoz + 12 (bemeneti_dim * egységek_száma) a bemenethez.

Azt is megkérdezték, hogyan találja meg a paraméterek számát?

Nak nek kiszámítja a tanulható paramétereket itt csak annyit kell tennünk, hogy megszorozzuk az m szélesség és n magasság alakjával, és figyelembe kell venni az összes ilyen szűrőt k. Ne felejtse el az egyes szűrők torzítási kifejezését. A paraméterek száma egy CONV rétegben a következő lenne: ((m * n)+1)*k), hozzáadva 1-et az egyes szűrők torzítási kifejezése miatt.

Hasonlóképpen, hány rejtett egysége van az Lstm-nek? An LSTM hálózat. A hálózat öt bemenettel rendelkezik egységek , a rejtett réteg kettőből áll LSTM memóriablokk és három kimenet egységek . Minden memóriablokknak négy bemenete van, de csak egy kimenete.

Ezt követően az is felmerülhet, hogy hogyan találja meg a paraméterek számát az RNN-ben?

1 Válasz. A W, U és V entitások az összes lépésben meg vannak osztva RNN és ezek az egyetlenek paramétereket ábrán leírt modellben. Ennélfogva paraméterek száma edzés közben tanulni = dim(W)+dim(V)+dim(U). A kérdésben szereplő adatok alapján ez = n2+kn+nm.

Hány rétege van az Lstm-nek?

Általában 2 rétegek elégnek bizonyultak az összetettebb funkciók észleléséhez. Több rétegek lehet jobb, de nehezebb is edzeni. Általános szabály, hogy 1 rejtett réteg egyszerű problémákkal dolgozzon, mint ez, és kettő is elég az ésszerűen összetett funkciók megtalálásához.

Ajánlott: