Acentuação: o preço que pagamos por estar no 3º mundo

Autor: Pedro Luis Kantek Garcia Navarro


Este artigo é um apanhado sobre as dificuldades de manusear acentos nos editores de texto que não são originalmente produzidos no Brasil.

O PROBLEMA:

O problema todo está em que quando o código ASCII foi estabelecido, não se padronizou o local em que cada caractere acentuado deveria estar. Isto possibilitou que cada software e cada fabricante colocasse tais caracteres no local desejado dentro do código, gerando despadronização.

A TABELA

A seguir, uma lista de caracteres acentuados e os seus respectivos códigos dentro da segunda parte do código ASCII, por software.

CARACTERE        WS3.45 E       WORD2.3.4        WORD5           VENTURA

Á                              F8                    E2                          B5                     C7

Í                               E6                    E4                          D6                     CD

Ó                             E7                    E5                          E0                      D1

Ú                             EE                    E7                          E9                      D6

ã                              E2                    86                          C6                      B0

õ                              E9                    92                          E4                       B1

à                             E9                    8F                          C7                       B7

Õ                              EF                   91                           E5                       B8

                              EC                  E1                           B6                       C8

Ê                              E5                  E0                           D2                      CA

Ô                              E8                  E6                           E2                       D2

À                               EB                 E3                            B7                       B6

Observações:

1 – Cada caractere é representado pela sua configuração hexadecimal.
2 – O WORD na versão 5 modificou seu esquema de representação de caracteres acentuados. Na verdade ele deixou isto por conta do sistema operacional DOS ( que a partir da versão 4 passa a ter suporte a idiomas).
3 – O Wordstar usa um esquema especial de representar caracteres acentuados. Ele usa dois caracteres especiais, para indicar a ocorrência da letra acentuada. Assim, no texto, cada caractere acentuado usa na verdade 3 bytes.

O UTILITÁRIO:

O Wordstar na versão 3.45 traz um utilitário de conversão denominado WSCONVT. A vantagem deste é que podemos introduzir tabelas de conversão semelhantes a que aparece aí ao lado. Com ele, podemos fazer as seguintes conversões:

a – De Wordstar 3.34 para caracteres acentuados – retirar os 2 caracteres indicadores
b – De acentuados para formato Wordstar – o contrário do item anterior.
c – De Wordstar 3.45 ou maior para Word 2,3 e 4
d – De Word 2,3 e 4 para Word 5
e – De word 2,3 e 4 para Wordstar 3.45 e maior
f – De Word 5 para Word 2,3 e 4
g – De Wordstar 3.45 e maior para Ventura
h – De Ventura para Wordstar 3.45 e maior

Informações sobre a utilização deste programa, com Kantek.