t

Historial de documentação

Quando a informação desaparece

Luis Moura / 2019-04-03


knitr::opts_chunk$set(
	warning = FALSE,
	echo = FALSE,
	message=FALSE, 
	comment=NA
)

Quanta informação ficou perdida ao longo dos anos por causa das actualizações do software e hardware?

No tempo do Floppy Disk

Ainda me lembro de guardar documentos em Floppy disk . Mal finalizava um documento em Microsoft Word, guardava ele na disquete de modo a garantir que a informação ficava guardada para a eternidade. Mas a eternidade não foi mais que um punhado de anos. Entre mudanças de escritório e caixas perdidas, actualizações de software e hardware, passando pelos CDs, USB e Cloud Storage, os floppies simplesmente desapareceram da minha vida e com eles, inúmeros documentos.

library(knitr)
include_graphics("https://upload.wikimedia.org/wikipedia/commons/a/aa/Floppy_disk_2009_G1.jpg")

Era da Internet

Atualmente, e veja-se o caso deste Website, os documentos são criados para serem vistos na Internet. Os documentos (ou posts) são criados em Markdown, ou na versão R Markdown [@R-rmarkdown], utilizando HTML se necessário. Mas qualquer futura mudança no código informático, pode tornar os documentos incompreensíveis de serem vistos online. Neste momento, para fazer o cabeçalho desta secção em Markdown, eu usei dois “hashtags”:

## Era da Internet

Por sua vez, quando o Markdown é convertido para ser exportado para a internet, é criado o seguinte código em HTML1:

<div id="era-da-internet" class="section level2">
<h2>Era da Internet</h2>

Mas em algumas variações do Markdown, o mesmo cabeçalho é escrito da seguinte maneira:

Era da Internet
===============

Se imaginarmos que no futuro, seja optado que todo o Markdown use a segunda opção, este post vai ficar desformatado para ser visto na Internet, sendo necessário alterar manualmente todos os “##” para “==”. E este é um dos muitos exemplos que eu poderia dar de como este Website poderia ficar no mínimo desformatado.

Mesmo com $\LaTeX$, que está incluído na maioria das páginas deste Website, o problema ainda é maior, pois uma mudança no endereço CDN-Content delivery network2 do MathJax, tornaria a seguinte equação,

$$ 0\le T\le { T }{ B }\quad :\quad { S }{ e }(T)={ a }{ g }\times S\times \left[ 1+\frac { T }{ { T }{ B } } \times (\eta \times 2,5-1) \right] $$

em algo que a maioria das pessoas não conseguiria perceber:

\begin{equation}
0\le T\le { T }_{ B }\quad :\quad { S }_{ e }(T)={ a }_{ g }\times S\times \left[ 1+\frac { T }{ { T }_{ B } } \times (\eta \times 2,5-1) \right] 
\end{equation}

Ou seja, todas as fórmulas matemáticas deste Website, estão dependentes de um serviço que faz a conversão de $\LaTeX$ para símbolos matemáticos. A falha desse serviço, leva a que todos a matemática deste Website, se torne “ilegível”.

Markdown, $\LaTeX$, PDF

Neste momento, qualquer documento que seja por mim produzido, é guardado em três formatos:

$\LaTeX$ é um código maduro que produz excelentes documentos. Possivelmente não vou ter muita dificuldade em abrir um documento em $\LaTeX$ daqui a uma ou duas décadas.
Markdown é uma linguagem de muito fácil utilização e tem a vantagem de existirem dezenas editores (tanto online como para desktop) que a tornam também bastante acessível. E por causa da sua versatilidade, é facilemente convertido para outro formato, como Microsoft Word, HTML, LaTeX ou PDF.
E finalmente o PDF, que permite guardar o documento finalizado, mantendo-o seguro de possíveis alterações, para além de ser um formato mundialmente utilizado, de fácil partilha, e com décadas de uso.

Toda a documentação, é guardada tanto online como no hardrive do computador. Por sua vez, pelo menos uma vez em cada seis meses, guardo uma cópia dos documentos em um USB external hardrive.

Em todo este processo, pelo menos pretendo minimizar o risco de perder documentos tanto por causa de alguma actualização de software/hardware, como por causa de algum erro da minha parte. Daqui 20 anos, espero poder abrir o texto deste post, mesmo que ele já não esteja acessível online.

Referências


  1. HTML é a formatação final de todas as páginas deste website.
  2. Recentemente, MathJax alterou o endereço do CDN, o que obrigou à alteração de milhares de websites.