Pesquisa pessoal
De Gpopai
Tabela de conteúdo |
Formatos Abertos
Ainda em construção...
Introdução
A computação pode ser considerada a tecnologia com desenvolvimento mais acentuado na atualidade, tornando-se algo onipresente na sociedade atual. Ela representou uma forma de se produzir maior quantidade de informação e de forma mais sistematizada. Uma das vertentes da escala evolucionária da computação é a internet, que permitiu que toda a informação gerada pudesse ser transmitida de forma quase instantânea, levando a uma mudança das relações sociais e consequentemente a sociedade da informação.
Esta informação, em grande parte, está caracterizada por documentos em formato texto, que são gerados por softwares de edição de textos, um dos mais difundidos e populares entre os usuários. Este tipo de software se tornou, portanto, uma ferramenta essencial para todos os usuários por se mostrar uma maneira eficaz de organizar informações para a produção de conhecimento.
Para organizar toda informação produzida estes softwares utilizam arquivos, que organizam todos os dados referentes a esta informação (conteúdo, formato, etc) e os prepara para o armazenamento físico, que pode ocorrer em mídias óticas, magnéticas, etc. De acordo com o software de edição de texto utilizado pode-se escolher diversas formas diferentes de organização destes dados, ou de codificação dos dados, que são representadas pelos diferentes formatos de arquivos.
Portanto estes formatos definem o quanto pode-se colocar barreiras ao acesso as informações contidas nos arquivos, pois a utilização de um formato que tenha sua codificação secreta leva a utilização de um software específico que consiga interpretar essa codificação e traduzir os dados na informação que eles representam. Isto ocorre, por exemplo, com o formato ".doc" da Microsoft, que foi criado para ser utilizado especificamente com o software de edição de texto Office, que só pode ser usado após pagamento de uma licença de uso.
Este tipo de restrição levou a busca de formas alternativas de acesso as informações contidas nos arquivos, como a engenharia reversa feita nos formatos da Microsoft, para que se criassem softwares capazes de acessar o conteúdo dos arquivos, até o surgimento de formatos abertos. Mas estas alternativas se mostraram ainda pouco eficazes, pois a engenharia reversa não consegue atingir a mesma qualidade de interpretação dos dados, levando a erros de configuração na apresentação da informação, e os formatos abertos ainda não atingiram o mesmo patamar de uso que os formatos da Microsoft.
Para resolver esta situação teve início um movimento para a criação de um formato de arquivo aberto reconhecido como padrão internacional, que permitisse aos desenvolvedores de software ter acesso a todas as especificações do formato e com isso fossem capazes de construir softwares que suportem esse formato. Este movimento foi emcabeçado por um consórcio de empresas chamado OASIS (Organization for the Advancement of Structured Information Standards), que implementou o formato e o submeteu a orgãos de padronização como a ISO e ECMA, que definiram o ODF (Open Document Format) como um padrão internacional. Sentindo sua hegemonia quanto aos formatos ameaçada por suas concorrentes (fazem parte da OASIS empresas como Sun e IBM), a Microsoft também implementou um formato aberto, o OOXML (Open Office XML), e o submeteu aos mesmos órgãos de padronização, fato que desencadeou uma discussão sobre o que define um formato como aberto e o que é necessário para um formato de arquivo ser considerado um padrão internacional.
Os defensores do ODF argumentam que este é o único formato que pode ser considerado aberto e padrão internacional porque é fruto de um esforço conjunto entre várias empresas e toda uma comunidade de desenvolvimento, enquanto a Microsoft argumenta que seu formato contêm mais funcionalidades e que a existência de mais de um padrão é benéfica pois oferece mais opções ao usuário.
A padronização é um documento que define um padrão. Um padrão é um conjunto de regras, que podem ser criadas para o fim desejado ou serem resultado de uso frequente e estabelecido. Como exemplo de um padrão pode-se citar o HTTP (Hypertext Transfer Protocol), protocolo de trasferência de hipertexto, que define como as informações são transmitidas na web. Este é considerado um dos grandes impulsionadores da web, pois padronizava a troca de informações entre clientes e servidores, algo que seria mais complexo se existissem mais de um padrão de comunicação.
Portanto a criação de mais de um padrão parece uma incoerência que, no limite, pode levar a manutenção da situação atual, com softwares diferentes suportando formatos diferentes. A dupla padronização pode levar a uma falta de padrões para formatos de arquivo. Com isso surgem as seguintes dúvidas: a padronização é a melhor forma para definir um formato como aberto? E mais, os critérios necessários para que um formato seja padronizado são os mesmos que os necessários para um formato ser considerado aberto?
Para entender melhor esta situação decidiu-se estudar neste trabalho quais as características que levam um formato de arquivo ser considerado aberto. Este estudo pretende basear-se na discussão envolvendo os dois candidatos a padrão aberto, o ODF e o OOXML, pois foi a partir desta discussão que surgiu o questionamento sobre o que é um formato aberto; nas legislações de países que passaram a utilizar padrões abertos como norma interna de armazenamento e distribuição de informações, temendo a dependência a uma única empresa para acesso a seus dados, por serem um indicativo do formato aberto ideal; e nos formatos de arquivo de texto existentes, para que se encontre o(s) formato(s) que apresentem as características necessárias para serem considerados abertos.
Decidiu-se delimitar o estudo aos formatos de texto por estes representarem a forma mais utilizada para organização de informação (os documentos) e por ser possível replicar os resultados para outros formatos semelhantes, como planilhas eletrônicas, apresentação, etc.
Justificativa
As informações que são transmitidas via internet normalmente estão armazenadas em formato de documentos, que estão organizados em arquivos de vários formatos. Estes formatos representam o quando esta informação está disponível e o quanto ela estará disponível no futuro, portanto é necessário um formato que garanta ao usuário a possibilidade de acessar sua informação em qualquer circunstância, ou seja, é necessário armazenar a informação em um formato de arquivo que não apresente barreiras ao acesso a esta informação.
Como não existe um padrão de formato que ofereça essas garantias ao usuário, é necessário uma síntese do que está sendo discutido para que se obtenha os critérios para se considerar um formato como aberto.
Hipótese
O fato de um formato ser padronizado não implica necessariamente que este será aberto, pois um formato aberto deve conter várias características que vão além da padronização e podem não ser contempladas por ela. A discussão existente entre os defensores do ODF e os defensores do OOXML mostrou-se como uma briga de empresas em busca de hegemonia no mercado de softwares de escritório (com destaque para editores de texto).
Objetivos
O objetivo principal desta pesquisa é encontrar os critérios que caracterizam um formato de arquivo de texto como aberto através da comparação do que foi discutido no caso da padronização com o que diz as legislações com as funcionalidades/características dos formatos existentes. Para alcançar este objetivo são necessários realizar os seguintes objetivos secundários:
=> analisar o debate sobre a padronização que ocorreu entre o ODF e o OOXML.
=> mapear os critérios utilizados pelas legislações dos países que estão utilizando formatos abertos como norma interna.
=> mapear os formato de arquivo de texto e quais funcionalidades/características estes formatos oferecem
Metodologia
Para se atingir os objetivos listado acima serão necessários os seguintes passos:
=> levantar bibliográfico existente sobre o assunto, que será baseada em sites de discussão sobre a padronização dos formatos
=> levantar os países que adotaram formatos abertos como norma interna
=> analisar quais critérios foram usados para definir um formato como aberto
=> levantar todos os principais formatos de texto. Para esse passo serão utilizados os formatos de arquivo que os softwares de edição de texto suportam. Serão utilizados os softwares de edição que rodam sobre as três principais plataformas existente, as baseadas no Unix, Windows e Macintosh
=> analisar quais funcionalidades/características estes formatos de arquivo oferecem
=> comparar os critérios utilizados pelos paises que adotaram formatos abertos com os principais tópicos resultantes da discussão sobre a padronização com as funcionalidades/características dos formatos utilizados pelos softwares de edição de texto para que se obtenham os formatos que atendam os critérios para ser considerado aberto
Cronograma
Janeiro: finalização da redação do projeto; início do levantamento bibliográfico
Fevereiro: levantamento bibliográfico; separação dos formatos de arquivo que serão analisados; início da análise dos formatos de arquivo
Março: levantamento bibliográfico; término da análise dos formatos de arquivo; início do levantamento das legislações existentes
Abril: levantamento bibliográfico; término do levantamento das legislações existentes; início da comparação entre os dados levantados
Maio: término do levantamento bibliográfico; comparação entre os dados levantados
Junho/Julho: redação do relatório