O padrão de metadados da
INDA é o conjunto padrão de campos obrigatórios e opcionais que descrevem os conjuntos de dados no âmbito da INDA. Tem como objetivo que os dados que constam no catálogo do
Portal Brasileiro de Dados Abertos apresentem-se de uma maneira clara e uniforme para os utilizadores dos dados. Ele está estabelecido na
Cartilha Técnica para Publicação de Dados Abertos e baseia-se no padrão de metadados para dados abertos do Chile.
Padrão de metadados
Metadados são dados sobre os dados, ou seja, são informações que possibilitam organizar, classificar, relacionar e inferir novos dados sobre o conjunto de dados. A quantidade e a qualidade dos metadados de um conjunto de dados podem determinar a utilidade daquele conjunto de dados. Em outras palavras, mais e melhores metadados agregam mais valor ao conjunto de dados, além de melhorar sua classificação e a busca sobre ele.
A seguir são definidos um conjunto de metadados obrigatórios e um conjunto de metadados desejáveis.
Obrigatórios
- Título: Nome do conjunto de dados.
- Descrição: Uma breve explicação sobre os dados.
- Catálogo origem: Página (URL) do órgão onde está publicado o conjunto de dados.
- Órgão responsável: Nome e sigla do órgão ou entidade responsável pela publicação do conjunto de dados.
- Categorias no VCGE: O Vocabulário Controlado de Governo Eletrônico é uma lista hierarquizada de assuntos do governo que utiliza termos comuns e é voltada para a sociedade. Para navegar e escolher as categorias acesse o VCGE em http://vocab.e.gov.br/2011/03/vcge.
- Recursos: Um conjunto de dados pode ser composto por mais de um arquivo de dados. O critério básico para separar vários recursos em mais de um conjunto de dados é a constatação de que eles divergem em vários metadados.
- Identificador: URL persistente que aponta para o recurso na Web.
- Título: Nome do recurso.
- Formato: Formato do recurso. Ex.: XML, JSON, CSV, etc.
- Descrição: Breve detalhamento sobre o conteúdo do recurso.
Desejáveis
- Etiquetas: Lista de palavras chaves relacionadas ao conjunto de dados, e que são úteis na classificação e busca dele.
- Autoria: Instituição ou pessoa responsável pela produção do recurso.
- Documentação: URL de documento que expõe detalhes sobre o conjunto de dados.
- Cobertura geográfica: Localização ou região geográfica a que se referem os dados. Ex.: Recife.
- Cobertura temporal: Data ou período à que referem os dados. Ex.: 03/2012.
- Granularidade geográfica: Precisão geográfica da cobertura geográfica. Ex.: municipal.
- Granularidade temporal: Precisão temporal da cobertura temporal. Ex.: mês.
- Frequência de atualização: Frequência temporal com que o conjunto de dados é atualizado.
- Referências: Relações com outros conjuntos de dados.
- Metodologia: Processo de criação dos dados.
- Vocabulário/ontologia: Documentos estruturados com metadados específicos do conjunto de dados.
Implementação técnica
O padrão de metadados da INDA atualmente é implementado solicitando-se aos curadores de dados que cadastram conjuntos de dados no catálogo do
Portal Brasileiro de Dados Abertos preencham os nomes dos campos na entrada "chave" e valores na entrada "valor" para os campos de metadados extras do CKAN.
Considera-se a possibilidade implementar a utilização de um plugin como o
ckanext-scheming para que os campos do padrão de metadados sejam exibidos automaticamente no formulário de cadastro de conjuntos de dados. Assim, visa-se estimular o seu correto preenchimento e evitar erros. Para tanto, seria necessário descrever um esquema
"schema" de metadados, correspondente ao padrão, a ser utilizado pelo plugin.
Revisão do padrão
A possibilidade de se avaliar a necessidade de revisão do padrão de metadados da INDA foi discutida durante a 12ª Reunião Ordinária do
Comitê Gestor. Na ocasião, instituiu-se um subgrupo no âmbito do
GT4, com o objetivo de fazer essa avaliação, considerando a sua interação com outros padrões, como o DDI (do ANDA), PMGB (da INDE) e, ainda, com padrões mais recentemente estabelecidos internacionalmente para portais de dados abertos, tais como o DCAT e o DCAT-AP. Seria desejável, também, com o objetivo de melhorar a facilidade do cidadão encontrar os dados que procura, realizar o mapeamento com o
esquema para conjuntos de dados no schema.org, usado pelo Google e outros mecanismos de busca para indexar informações sobre conjuntos de dados.
Estão sendo discutidos também o padrão GeoDCAT-AP, que é uma extensão do DCAT-AP para dados geoespaciais, bem como a minuta do StatDCAT-AP, que analogamente está sendo proposta pela Comissão Europeia para metadados estatísticos.
Participantes:Nome | Órgão |
---|
Augusto Herrmann | DGD/STI/MP |
João Marcelo Marques | IBGE |
Moema José de Carvalho Augusto | Diretoria de geociências / IBGE |
Rafael Lopes da Silva | Diretoria de geociências / IBGE |
Ronaldo Raposo Jr. | IBGE |
Rogério Borba | IBGE |
Nívia Pereira | GGT/Diretoria de geociências/ IBGE |
Edmar Moretti | MS |
Reuniões realizadas pelo subgrupo: