NameNode Alta disponibilitat amb Quorum Journal Manager



NameNode High Availability és una de les funcions més importants de l’Hadoop 2.0 NameNode High Availability amb Quorum Journal Manager s’utilitza per compartir registres d’edició entre els NameNodes actius i en espera.

tutorial mysql per a principiants amb exemples

Aquesta és una de les característiques més importants d’Hadoop 2.0. Abans de discutir la característica de Namenode High Availability, és essencial saber què és el quòrum. Quòrum és un terme genèric que s’utilitza en agrupacions on diem que un clúster concret és estable. Quorum proporciona una llista de màquines i ajuda a determinar la salut del clúster. Hi ha dos tipus de quòrum: el quòrum esperat i el quòrum calculat.





NameNode Alta disponibilitat amb Quorum Journal Manager (QJM)

Abans de Hadoop 2.0, el NameNode era un punt d'error únic (SPOF) en un clúster HDFS. Cada clúster tenia un NomNode únic i, si aquesta màquina no estava disponible, el clúster en general no estaria disponible fins que el NomNode es reiniciés o s'iniciés en una màquina independent. En un clàssic HA clàssic, es configuren dues màquines separades com a NameNodes. En qualsevol moment, un dels noms de nom estarà en estat actiu i l’altre en estat d’espera. L'Active NameNode és responsable de totes les operacions del client al clúster, mentre que el mode d'espera simplement actua com a esclau, mantenint l'estat suficient per proporcionar una migració després d'un error.

Perquè el node Standby mantingui el seu estat coordinat amb el node Actiu, tots dos nodes es comuniquen amb un grup de dimonis separats anomenats 'JournalNodes' (JN). Quan el node Actiu realitza qualsevol modificació de l'espai de noms, registra un registre dels canvis realitzats al JournalNodes. El node Standby és capaç de llegir la informació modificada dels JN i els supervisa regularment per si hi ha canvis. A mesura que el node d'espera veu els canvis, els aplica al seu propi espai de noms. En cas de migració per error, el mode d'espera s'assegurarà que hagi llegit tots els canvis del JounalNodes abans de canviar el seu estat a 'Estat actiu'. Això garanteix que l'estat de l'espai de noms estigui totalment sincronitzat abans que es produeixi una migració després d'un error.



Per proporcionar una conversió per error ràpida, és essencial que el node en espera ha de tenir la informació actualitzada i actualitzada sobre la ubicació dels blocs al clúster. Perquè això passi, els DataNodes es configuren amb la ubicació de NameNodes i envien a tots dos informació sobre la ubicació del bloc i els batecs.

És essencial que només un dels NameNodes hagi de ser actiu alhora. En cas contrari, l'estat de l'espai de noms es desviaria entre els dos i comportaria pèrdues de dades o resultats erronis. Per evitar-ho, els JournalNodes només permetran un únic NameNode a un escriptor alhora. Durant una migració per error, el NameNode que s’activarà assumirà la responsabilitat d’escriure al JournalNodes.

Tens alguna pregunta? Esmenteu-los a la secció de comentaris i us respondrem.



Articles Relacionats:

com acabar el programa a Java

Visió general de la Hadoop 2.0 Cluster Architecture Federation

com escriure un escàner a Java