Mejor si posteas esto en un tema. Asi está mas ordenado y le puede servir a alguien mas. Si queres me mencionas y te respondo.
El nop lo usa ahi para que el puntero de abajo quede alineado (en un offset terminado en un multiplo de 4), porque sino el procesador no lo puede leer correctamente. Por eso es que las rutinas suelen decir que se deben insertar en un offset terminado en 0,4,8 o C.
Y lo de little endian. Todo tiene que ver con little endian xD, el procesador de la gba lee todo en little endian, sea puntero o no.