Rodrigo Martins

I'm a Catholic Christian, software developer, Passionate about life, codes, questions, theories and theorems. :)

Codificações De String E Caracteres Multibyte

| Comments

Olá... Resolvi começar a escrever alguma coisa também de Ruby... Vamos começar com um pouco do inicio da classe String.

Codificações de String e Caracteres multibyte

String são fundamentalmente diferentes em Ruby 1.8 e Ruby 1.9:

No Ruby 1.8, String são uma seqüência de bytes. quando cadeias são usados para representar texto (em vez de dados binários), cada byte da cadeia é considerada para representar um único caractere ASCII. no Ruby 1.8, os elementos individuais de uma String não são caracteres, mas números, o valor de byte real ou codificação de caracteres.

Em Ruby 1.9, por outro lado, as cadeias são sequências verdadeiras de caracteres, e esses caracteres não necessitam de ser confinado à Conjunto de caracteres ASCII. Em Ruby 1.9, os elementos individuais de uma cadeia são caracteres representados como cadeias de tamanho igual a 1 - em vez de inteiros códigos de caracteres. Cada String tem uma codificação que especifica a correspondência entre os bytes na cadeia e os caracteres representam os bytes. Codificações, como o UTF-8 codificação de caracteres Unicode utilizam número variável de bytes para cada carácter, e não há mais uma 1-para-1 (nem mesmo uma correspondência 2-para-1) entre bytes e subseções de caracteres. As subseções que seguem, explicam a codificação relacionada de características de strings em Ruby 1.9, e também demonstram de forma rudimentar o suporte para caracteres multibyte no Ruby 1.8 usando a biblioteca jcode.

Até o proximo.. :D

Comments