A dubbio tutte le codifiche ISO, sinon fece per come come i primi 127 codepoint corrispondessero ai codici ASCII, durante modo da conservare un qualche campione di coabitazione mediante quest’ultimo.
Il fascicolo fece alcune vittime (codifiche nazionali ancora industriali di varia attestato che non vennero recepite) di nuovo creo un qualunque orrori (che tipo di, la norme Latin-1 e quasi in persona, ma non identica, al codepage windows-1252, un’ambiguita che tipo di persiste ancora quest’oggi).
Personaggio degli effetti di attuale processo fu marcare la schiacciamento di uniformare i codici esistenti mediante un semplice elencazione con gradimento di visualizzare ogni i elemento usati dall’uomo. Il risultato dello ricerca di indivis elenco di questo qualita fu la creazione di Unicode (e ne parleremo entro un po’)
Le codifiche
Come abbiamo aforisma oltre a su, i calcolatori trasmettono l’informazione in totalita minime chiamate byte (quando sono sopra grado di elaborarla facendo riferimento ad un’unita e eccetto detta bit: un cifra binaria quale puo affidarsi 0 o 1)
Perche insecable byte puo rappresentare i numeri interi nell’intervallo 0-256, purchessia codice contente un preferibile di 256 codepoint puo essere ratificato (ambasciatore con lineamenti esterna) utilizzando certain byte verso segno. Verso questi codici e percio facile unire esibizione interna addirittura esterna, facendo contraccambiare ad qualsivoglia codepoint la sua manifestazione che tipo di singolo byte.
Esistono pero lingue che razza di hanno (molti) piuttosto scrittura dei 256 rappresentabili in indivis unito byte: il cinese e il nipponico sono paio con le oltre a importanti. Le codifiche dei codici/codepage creati per queste lingue presenta pertanto la pressatura di usare piuttosto di excretion byte per grinta atto che puo avere luogo specie durante perlomeno due modi – e tutti e due sono stati usati per diversi codici ancora codifiche.
Codifiche wide-char.
La opzione a prima vista piu comune e quella di verificare lo in persona gruppo di byte per la codificazione di purchessia codepoint. Che, Verso un notazione che abbia piu di 256 bensi minore di 65536 simboli, attuale significa che purchessia carattere sara codificato mediante due byte, da 00000000-00000000 a 11111111-11111111. Codifiche di attuale specie si Moglie Norvegia chiamano “wide-char” (lettere larghi). Sebbene quasi certamente di nuovo senza indugio comprensibili, queste codifiche hanno un argomentazione sicuro, personaggio latente anche personaggio che razza di interessa particolarmente i programmatori.
Insecable ipotesi: UCS-2 (UTF-16)
Consideriamo, come dimostrazione tutt’altro ad esempio eventuale, una regole U non solo genere (questa codifica e fondamentalmente quella che razza di, in UNICODE, e richiamo UCS-2).
2) U utilizza i primi 256 codepoint nello identico tranquillita addirittura per lo in persona significato del codepage latin-1. Attuale significa come tutte le lettere delle principali lingue europee occidentali sono contenute in indivisible single byte, il anteriore dei paio.
Il passato concetto (esso certo) e l’inefficienza di U. U invero contiene 511 simboli che razza di vengono codificati per sequenze che razza di hanno quantomeno indivis byte nullo. Ma, in quale momento U viene utilizzata per crittografare testi costituiti da recitatifs lettere occidentali, questi risultano ricevere il duplicato dello spazio (e vengono trasmessi nel subdolo del tempo) che sarebbe necessario, giacche tutti i lettere occidentali hanno una norme ove il byte piuttosto significativo e irrilevante.
Il posteriore concetto (colui fuorche dichiarazione) e noto che razza di argomentazione dell’endianness. La parola endianness e la frasario associata derivano dai nomi di paio fazioni politiche che esistevano nelle favolose isole di Lilliput ed Blefuscu (quale racconta Swift ne i “Turismo di Gulliver”) i cui membri si distinguevano per l’estremita da cui iniziavano ad avviare le uova: quella sensibile (a Lilliput, verso grida del monarca come una turno sinon era inciso aprendo indivisible uovo dall’estremita piu sottile: big endians) ovverosia quella fanciulla (a Blefuscu, a ribellione sopra il regnante: little endians). Su questa sottrazione (di nuovo sulla degoutta titolo reale), periodo scoppiata fra le paio isole una antagonismo sanguinosa qualora bravi lillipuziani ancora blefuscudiani si scannavano in stuolo. Con scelta pianificatore, l’endianness ha dato origine per grattacapi fuorche sanguinosi, tuttavia ancora piuttosto idioti di quelli provocati per Lilliput.