mitsuo takaki java bytecode software básico. java bytecode 1.o que é bytecode 2.formato de um...

Post on 21-Apr-2015

119 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Mitsuo Takaki

Java BytecodeSoftware Básico

Java Bytecode

1.O que é Bytecode

2.Formato de um arquivo .class

3.Principais comandos

4.Motivações para aprender bytecode

5.Principais Dificuldades

Java Bytecode

1.O que é Bytecode

2.Formato de um arquivo .class

3.Principais comandos

4.Motivações para aprender bytecode

5.Principais Dificuldades

Passos de Compilação de Java

A compilação de um código java segue os seguintes passos: Recebe um código Java (alto nível). Compila para uma linguagem intermediária (baixo

nível). Este procedimento é conhecido como tradução.

Após esta compilação, o código é interpretado.

Passos de Compilação de Java

.java Compilador .class JVM

com

pila

inte

rpre

ta

O que é Java Bytecode?

Java Bytecode é a linguagem intermediária à qual um código java é modificado.

Utiliza apenas comandos simplificados e baseados em pilha.

Muito semelhante a Assembly. Linguagem baseada em pilha.

Cada opcode tem o tamanho de 1 byte (origem do nome bytecode).

Motivações

A interpretação de um código Java exigiria uma maior complexidade do interpretador. Menor velocidade de interpretação.

Durante a compilação, otimizações são feitas. Códigos mais eficientes são gerados.

Portabilidade É possível executar o código em várias plataformas por

ser interpretado.

Motivações

Simplificações são realizadas: Short, char e boolean se tornam inteiros. Laços são simplificados

For, while, do...while são iguais, apenas se comportam de forma diferente.

Códigos Equivalentes

Dois códigos podem realizar uma mesma tarefa usando diferentes linguagens.

Desta forma, é possível manter a semântica do programa original, apenas seu código é simplificado.

Códigos Equivalentes

int foo(int a) {

if (a == 0) {

return 0;

} else {

return 1;

}

}

int foo(int a):

0: ILOAD_1

1: IFEQ 4

2: BIPUSH 1

3: IRETURN

4: BIPUSH 0

5: IRETURN

Códigos Equivalentes

int foo() {

int result = 0;

while (result < 2) {

result++;

}

return result;

}

int foo():

0: BIPUSH 0

1: ISTORE_1

2: GOTO 4

3: IINC 1,1

4: ILOAD_1

5: BIPUSH 2

6: IF_ICMPGE 3

7: ILOAD_1

8: IRETURN

Java Bytecode

1.O que é Bytecode

2.Formato de um arquivo .class

3.Principais comandos

4.Motivações para aprender bytecode

5.Principais Dificuldades

Formato de um Arquivo .class

O arquivo compilado (.class) armazena as informações específica da classe. Métodos (privado, protegido, publico). Campos. Atributos. Constant Pool. ...

Formato de um Arquivo .class

Constant Pool

Local onde estão armazenadas todas as constantes. Nome das classes usadas. Nome dos métodos. Valores iniciais. ...

Inner Class

As inner class, apesar de estarem dentro de uma classe, após a compilação são “extraidas” e um .class é criado para as mesmas.

– É criado algo como: HelloWorld$1.class

Java Bytecode

1.O que é Bytecode

2.Formato de um arquivo .class

3.Principais comandos

4.Motivações para aprender bytecode

5.Principais Dificuldades

Principais Comandos

Aritméticos (inteiros): IADD – soma. ISUB – subtração. IMUL – multiplicação. IDIV – divisão. ...

Principais Comandos

Pilha: BIPUSH – empilha uma constante (inteiro). POP – remove da pilha (independente de tipo). LDC – empilha uma constant (string ou double). ...

Principais Comandos

Mudança de fluxo: IFEQ, IFNE, IFLT, IFLE, IFGT, IFGE

Compara um inteiro que está na pilha com zero. Caso o resultado seja verdadeiro, modifica o fluxo para o

endereço especificado como parâmetro. GOTO

Mudança de fluxo incondicional (modifica o fluxo sem nenhuma verificação).

Principais Comandos

Chamada de métodos: INVOKESTATIC, INVOKEINTERFACE,

INVOKEVIRTUAL, INVOKESPECIAL. Chama um método de acordo com o seu modificador

(estático, método de uma interface, método de uma instância)

Parâmetros

Alguns comandos usam parâmetros na pilha. INVOKEVIRTUAL precisa que a referência do

objeto esteja na pilha.

Além disto, alguns comandos podem possuir mais de um parâmetro. IINC 1, 1 – soma o valor 1 a variável com índice 1.

Java Bytecode

1.O que é Bytecode

2.Formato de um arquivo .class

3.Principais comandos

4.Motivações para aprender bytecode

5.Principais Dificuldades

Por que aprender bytecode?

Para se ter proficiência em Java, não é necessário aprender bytecode. Da mesma forma que para aprender uma

linguagem de alto nível, não é necessário aprender linguagem de máquina.

Existem poucas bibliotecas que permitem a manipulação de bytecode. BCEL, biblioteca da Apache, não está mais sendo

desenvolvida e possui muitos bugs.

Por que aprender bytecode?

Apenas em casos específicos será necessário o conhecimento de bytecode. No desenvolvimento de sistemas, dificilmente será

necessário conhecer alguma coisa sobre bytecode.

O compilador de Java já realiza otimizações eficientes. Escrever manualmente um código bytecode

possivelmente será menos eficiente que um código gerado pelo compilador.

Motivações

Manipular bytecode permite introduzir novas funcionalidades a códigos “fechados” (instrumentação). Alguns sistemas são disponibilizados sem código

fonte, a modificação destes códigos se torna impossível sem a manipulação de bytecode.

Debugging. É possível introduzir traces no código para

identificação de bugs e análise de fluxo.

Motivações

Análise de cobertura de testes unitários. Ferramentas que analizam a cobertura de testes de

unidade utilizam instrumentação para a inserção de traces no código.

Modificação de operadores de fluxo de controle. É possível escrever geradores automáticos de teste

de mutação.

Ferramentas que Usam Manipulação de Bytecode

• AspectJ

– Ferramenta de Orientação a Aspectos.

• EclEmma

– Mede cobertura dos testes.

• JAD (JAva Decompiler)

– Descompila classes Java.

Java Bytecode

1.O que é Bytecode

2.Formato de um arquivo .class

3.Principais comandos

4.Motivações para aprender bytecode

5.Principais Dificuldades

Principais Dificuldades - Loops

• Devido as suas simplificações, não é possível distinguir um while, do...while e for.

• Por padrão, um loop é toda estrutura de mudança de fluxo condicional que possui um fluxo no sentido inverso.

Principais Dificuldades - Loops

• Todo loop é composto por um operador de fluxo condicional.

– Condição de parada.

• É difícil identificar o inicio e o fim de loop.

Principais Dificuldades - Loops

• Para identificar um loop é necessário realizar uma análise do fluxo do programa.

• Ai ser encontrado um operador de mudança de fluxo condicional que mude o fluxo no sentido contrário, foi encontrado o fim do bloco do loop.

• O operador de condição de parada sempre aponta para o inicio do bloco.

Principais Dificuldades - Loops

int foo():

0: BIPUSH 0

1: ISTORE_1

2: GOTO 4

3: IINC 1,1

4: ILOAD_1

5: BIPUSH 2

6: IF_ICMPGE 3

7: ILOAD_1

8: IRETURN

Corpo do loop

Condição de parada

Modificando um Loop

int foo():

0: BIPUSH 0

1: ISTORE_1

2: GOTO 4

3: IINC 1,1

4: ILOAD_1

5: BIPUSH 2

6: IF_ICMPGE 3

7: ILOAD_1

8: IRETURN

ILOAD_1BIPUSH 2

IADDISTORE_1

Modificando um Loop

int foo():

0: BIPUSH 0

1: ISTORE_1

2: GOTO 4

3: IINC 1,1

4: ILOAD_1

5: BIPUSH 2

6: IF_ICMPGE 3

7: ILOAD_1

8: IRETURN

Modificando um Loop

int foo():

0: BIPUSH 0

1: ISTORE_1

2: GOTO 11

3: ILOAD_1

4: BIPUSH 2

5: IADD

6: ISTORE_1

7: IINC 1,1

8: ILOAD_1

9: BIPUSH 2

10: IF_ICMPGE 3

11: ILOAD_1

12: IRETURN

Atualiza endereços do operadores de mudança de fluxo.

Principais Dificuldades - Ifs

• Nem todo operador condicional de mudança de fluxo pode ser automáticamente traduzido como um if.

– Como visto anteriormente, este pode ser a condição de parada de um loop.

• Em um caso de if...else não existem 2 operadores, apenas um.

Principais Dificuldades - Ifs

void foo(int x, int y) {

if (x > y) {

...

} else {

...

}

}

void foo(int x, int y):

0: ILOAD_1

1: ILOAD_2

2: IF_ICMPLE 5

3: bloco do if

4: GOTO 6

5: bloco do else

6: RETURN

top related