„Unicode“: Munur á milli breytinga

Efni eytt Efni bætt við
Comp.arch (spjall | framlög)
Comp.arch (spjall | framlög)
m →‎Saga og smáatriði: Rétt beyging "latneska letursins"? Kannski umorða?
Lína 20:
Minna notaðar kóðanir eru t.d. [[UTF-EBCDIC]] (sem er ekki leyfilegt á internetinu, en er notað í stórtölvum) þar sem stafir fara upp í 5 bæti (í upphafi leyfði UTF-8 hins vegar líka upp í 6 bæti, en er nú takmarkað við 4). Kínverjar nota [[GB 18030]] stafatöflu sem má líta á sem kóðun fyrir Unicode. Standard Compression Scheme for Unicode (SCSU), notað t.d. af Microsoft SQL Server og Binary Ordered Compression for Unicode (BOCU-1) eru þjappanir fyrir Unicode.
 
Upphaflega Unicode réð við auk latneska letriðletursins sem við erum vön, t.d. við arabísku, kýrílískt letur, grísku, hebresku, taílensku og letur fyrir [[tíbesk tungumál]]. Táknin fyrir tíbesk mál voru reyndar tekin út úr Unicode 1.1, en komu aftur inn í Unicode 2.0 í júlí 1996 á nýjum stað í stafatöflunni. Útgáfa 1.0.1 frá júní 1992 bætti við 20.902 táknum (fleirum síðar) sem notuð eru í kínversku, japönsku og kóresku. Síðar var bætt við hangul fyrir kóresku, en þau tákn voru líka færð og fjölgað í 11.172 tákn í Unicode 2.0.<!-- þá líka "Surrogate character mechanism defined"-->
 
Nýjasta útgáfan Unicode 12.1 bætti við aðeins einu nýju tákni, fram yfir Unicode 12.0, fyrir tímabil [[keisari Japans|nýs keisara í Japan]] sem tók við 2019 af föður sínum.