lexml 2.0: tratamento do texto integral joão lima [email protected]
TRANSCRIPT
![Page 2: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/2.jpg)
Tópicos
• Introdução• Texto em XML
– Benefícios• Ferramentas (a serem construídas)• Unidade de Informação (information unit)• Comitê Gestor de Informações do LexML
![Page 3: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/3.jpg)
Introdução
• LexML 1.0 = Portal + Identificador Uniforme (URN)
• LexML 2.0 = LexML 1.0 + Inteiro Teor em XML
![Page 4: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/4.jpg)
![Page 5: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/5.jpg)
![Page 6: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/6.jpg)
![Page 7: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/7.jpg)
![Page 8: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/8.jpg)
![Page 9: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/9.jpg)
![Page 10: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/10.jpg)
![Page 11: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/11.jpg)
É possível fazer o mesmo para todas as Leis?
![Page 12: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/12.jpg)
É possível obter o texto vigente de uma lei para uma determinada
data?
![Page 13: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/13.jpg)
Sim, com o auxílio da tecnologia XML é possível.
![Page 14: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/14.jpg)
XML em 6 pontos
![Page 15: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/15.jpg)
XML em 6 pontos
1 – XML é um método para estruturar dados em um arquivo textual
• XML não é uma linguagem de programação e você não precisa ser programador para usar e aprender
• XML torna fácil a tarefa do computador gerar dados, ler dados e garantir que a estrutura de dados não seja ambígua
![Page 16: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/16.jpg)
XML em 6 pontos
2 – XML parece com HTML, mas não é HTML
• Como HTML, o XML usa tags e atributos• XML usa tags só para delimitar o texto, deixando
para a aplicação o trabalho de interpretar tags
![Page 17: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/17.jpg)
XML em 6 pontos
3 – XML é texto, mas isto não significa que deve ser lido
• Programas que armazenam dados freqüentemente utilizam o formato binário ou texto
• Uma vantagem do formato texto é a possibilidade de leitura do dado sem a utilização do programa que o produziu (desvincula o dado do programa)
![Page 18: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/18.jpg)
Word (Binário, proprietário)
![Page 19: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/19.jpg)
PDF (Binário, proprietário)
![Page 20: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/20.jpg)
RTF (Texto, proprietário)
![Page 21: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/21.jpg)
HTML (Texto, Padrão W3C)
![Page 22: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/22.jpg)
XML (Texto, extensível, Padrão W3C)
![Page 23: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/23.jpg)
XML em 6 pontos
4 – XML é uma família de tecnologias
![Page 24: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/24.jpg)
Família XML
XSL
XML
XSL-FO XHTML
Apresentação
Query
AcessoModelo
XPointer XPath XQuery
DOM
SAX
DTD
XMLSchema
XLink
Segurança
X Signature X Encription
![Page 25: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/25.jpg)
XML em 6 pontos
5 – XML é novo, mas não tão novo
![Page 26: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/26.jpg)
XML em 6 pontos
6 – XML é license-free, independente de plataforma e fornecedor
![Page 27: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/27.jpg)
XML e Informação Jurídica
• Documentos possuem estrutura bem definida• Necessidade de definir diversos tipos de
restrições– Obrigatoriedade– Tipos de Dado– Restrições de articulação
• Agrupadores de Artigo• Dispositivos do Artigo
• Remissões entre documentos• Outras regras da Técnica Legislativa
![Page 28: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/28.jpg)
Inteiro Teor - Estrutura
• O LexML define recomendação para validação da estrutura do inteiro teor dos
documentos utilizando XML Schema• respeitando a técnica legislativa
• Vantagens do uso de XML– múltiplos formatos de apresentação– acessibilidade– controle sobre partições do inteiro teor– consolidação automática ou semi-automática
![Page 29: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/29.jpg)
<Artigo id="art1"><Rotulo>Art. 1º.</Rotulo>
<Caput id="art1_cpt"><p>A República Federativa do Brasil, formada pela união indissolúvel dos Estados e Municípios e do Distrito Federal, constitui-se em Estado democrático de direito e tem como fundamentos:</p> <Inciso id="art1_cpt_inc1"><Rotulo>I - </Rotulo> <p>a soberania; </p> </Inciso> <Inciso id="art1_cpt_inc2"><Rotulo>II - </Rotulo> <p>a cidadania;</p> </Inciso> <Inciso id="art1_cpt_inc3"><Rotulo>III - </Rotulo> <p>a dignidade da pessoa humana;</p> </Inciso> <Inciso id="art1_cpt_inc4"><Rotulo>IV - </Rotulo> <p>os valores sociais do trabalho e da livre iniciativa;</p> </Inciso> <Inciso ID="art1_cpt_inc5"><Rotulo>V - </Rotulo> <p>o pluralismo político. </p> </Inciso>
</Caput> <Paragrafo ID="art1_par1"><Rotulo>Parágrafo Único. </Rotulo>
<p>Todo o poder emana do povo, que o exerce por meio de representantes eleitos ou diretamente, nos termos desta Constituição.</p>
</Paragrafo></Artigo>
Voz Sintetizada
![Page 30: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/30.jpg)
Contra-exemplo
Voz Sintetizada
![Page 31: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/31.jpg)
Iguais ou Diferentes?
• § 1º
• § 1º
• § 1º
![Page 32: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/32.jpg)
Iguais ou Diferentes?
• § 1º– Símbolo de ordinal
• § 1º
– Letra “o” sobrescrito
• § 1º– Símbolo de grau
![Page 33: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/33.jpg)
Ferramentas
• Editor de Normas• Conversão de Formato (Parser)• Compilação de Textos
– Semi-automática• Consolidação Legislativa
– Auxílio
![Page 34: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/34.jpg)
Editor (Projeto Norme in Rete)
![Page 35: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/35.jpg)
Parser
![Page 36: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/36.jpg)
Arquivo de Entrada
![Page 37: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/37.jpg)
Após Normalização
![Page 38: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/38.jpg)
Após Conversão
![Page 39: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/39.jpg)
Unidade de Informação(information unit)
• Tem sentido realizar a indexação de assuntos para – a constituição?– o código civil?
• Patrick Wilson (1928-2003) – Two Kinds of Power: An Essay on
Bibliographical Control (1968)– Unidade de Informação
• Fragmento do Texto + Contexto
![Page 40: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/40.jpg)
Simulação
![Page 41: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/41.jpg)
Ficha do Dispositivo
• Contexto– Agrupadores de Artigos
• Parte, Livro, Título, Capítulo, Seção, Subseção
– Detalhamento do Artigos• Caput, Parágrafo, Inciso, Alínea e Item
• Histórico dos Textos• Links para
– o documento no todo– acórdãos – doutrina
![Page 42: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/42.jpg)
Comitê Gestor
• Comitê Gestor de Informações do LexML– Comunidade de Prática
• Bibliotecários• Analistas de Informação• Arquivistas
• 4 Reuniões Ordinárias– Termo de Referência – Plano de Metas 2009-2010 (esboço)
![Page 43: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/43.jpg)
Comitê Gestor de Informação do LexML - Atribuições
• Propiciar estudos sobre a integração e compatibilização de linguagens documentárias;
• Definição dos critérios para formação do acervo LexML em relação ao conteúdo;
• Definição de requisitos de qualidade da informação para permanência do órgão na Rede LexML;
• Definição de estratégia para crescimento do acervo documental;
• Estabelecer as categorias no Portal LexML;• Estabelecer grupos de trabalho;• Planejamento de treinamentos para membros
integrantes e órgãos;
![Page 44: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/44.jpg)
• Definição das prioridades de implementação de novas funcionalidades no Portal LexML;
• Propor políticas de sistematização e padronização das informações disponibilizadas no Portal LexML;
• Propor políticas de enriquecimento do debate da importância da divulgação da informação legislativa e jurídica para a sociedade;
• Estabelecer estratégias de divulgação e intercâmbio, a longo prazo, do Portal LexML, junto a comunidades de informação e comunidades jurídicas estrangeiras;
• Estabelecer canais de comunicação com usuários do Portal;
• Propor projetos de lei sobre a gestão da informação
Comitê Gestor de Informação do LexML - Atribuições
![Page 45: LexML 2.0: Tratamento do Texto Integral João Lima joaolima@senado.gov.br](https://reader035.vdocuments.net/reader035/viewer/2022062818/5706384f1a28abb8238f78c5/html5/thumbnails/45.jpg)
Comitê Gestor de Informações do LexML
3ª Reunião Ordinária