Atividade 3: Você pode repetir ? - Compressão de Texto

Apresentação

Desde que os computadores possuíam apenas uma quantidade reduzida de espaço para armazenar informações, estes precisavam armazená-las da forma mais eficiente possível. Isso é chamado compressão. Codificar os dados antes de armazená-los e decodificá-los, assim que estiverem sendo recuperados, permite ao computador armazenar mais dados ou enviá-los mais rapidamente através da Internet.

Disciplinas e conteúdos relacionados

Habilidades

Nível de Ensino

Material

Projeção da folha “Para projetar: Você pode repetir?”.

Cada criança precisará de:

Você pode repetir ?

Demonstração e discussão

Os computadores devem preservar e transmitir diversos dados. Para não usar muito espaço de armazenamento, ou levar muito tempo para enviar informações, eles comprimem o texto como explicado resumidamente a seguir.

Mostre o poema “A Aranha e a Jarra” na folha “Para projetar: Você pode repetir?”. Identifique padrões de letras neste poema. Você consegue encontrar grupos de duas ou mais letras repetidas, ou mesmo palavras ou frases inteiras? (Substitua esses padrões por caixas em branco conforme mostrado no diagrama abaixo.)

Folhas de Atividades e Materiais Adicionais

Você também pode baixar todas as folhas de atividade e materiais adicionais em formato editável aqui.

De que se trata tudo isso ?

A capacidade de armazenamento dos computadores cresce num ritmo incrível— nos últimos 25 anos, esta quantidade de armazenamento em um computador típico cresceu cerca de um milhão de vezes — mas ainda encontramos mais coisas para colocarmos em nossos computadores. Os computadores podem armazenar livros ou até mesmo bibliotecas e, agora, música e filmes também, se houver espaço. Arquivos grandes são igualmente um problema na Internet porque demoram muito tempo para serem baixados. Além disso, tentamos reduzir os computadores cada vez mais — até mesmo um relógio de pulso ou celular pode armazenar grandes quantidades de informação !

Entretanto, existe uma solução para este problema. Ao invés de comprar mais espaço de armazenamento ou um modem mais rápido, podemos comprimir os dados para que estes ocupem menos espaço. Tal processo de compressão e descompressão de dados é geralmente feito automaticamente pelo computador. Assim, notamos que o disco possui mais espaço disponível ou que as páginas da Internet são exibidas mais rapidamente, porém, o computador está, na verdade, realizando mais processamento.

Vários métodos de compressão foram inventados. O método utilizado nesta atividade, baseado no princípio de apontar para ocorrências anteriores de blocos de texto, é muitas vezes referido como “codificação Ziv-Lempel” ou “codificação LZ”, e foi inventado por dois professores israelenses na década de 1970. Este método pode ser usado para qualquer idioma e pode facilmente reduzir à metade o tamanho dos dados a serem compactados. É, por vezes, referido como “zip” em computadores pessoais, é também utilizado em imagens do tipo “GIF”, bem como em modems de alta velocidade. No caso dos modems, este método reduz a quantidade de dados que precisam ser transmitidos através da linha telefônica, sendo assim bem mais rápido.

Alguns outros métodos são baseados na ideia de que as letras usadas mais frequentemente deveriam ter códigos menores do que as outras. O Código Morse utilizou esta ideia.

Soluções e dicas

Você pode repetir?