„Unicode“: Munur á milli breytinga

Efni eytt Efni bætt við
Comp.arch (spjall | framlög)
→‎Saga og smáatriði: "Byzantine music" tákn, eru það tákn frá Býsantsímanum (en án s-ins eins og google translate þýðir; og "Býsantsk tónlist", eða á að hafa lítinn staf, og kannski z-u?)
Comp.arch (spjall | framlög)
Lína 18:
Sem dæmi nota JSON og XML UTF-8 sem sjálfgefið, en bæði leyfa t.d. UTF-16, þó hefur verið búin til Internet JSON útgáfa (I-JSON), sem leyfir eingöngu UTF-8. Það er líka reglan í nýrri stöðum að leyfa eingöngu UTF-8.
 
Minna notaðar kóðanir eru t.d. [[UTF-EBCDIC]] (sem er ekki leyfilegt á internetinu, en er notað í stórtölvum) þar sem stafir fara upp í 5 bæti (í upphafi leyfði UTF-8 hins vegar líka upp í 6 bæti, en er nú takmarkað við 4). Kínverjar nota [[GB 18030]] stafatöflu sem má líta á sem kóðun affyrir Unicode. Standard Compression Scheme for Unicode (SCSU), notað t.d. af Microsoft SQL Server og Binary Ordered Compression for Unicode (BOCU-1) eru þjappanir fyrir Unicode.
 
Upphaflega Unicode réð við auk latneska letrið sem við erum vön, t.d. við arabísku, kýrílískt letur, grísku, taílensku og letur fyrir [[tíbesk tungumál]]. Táknin fyrir tíbesk mál voru reyndar tekin út úr Unicode 1.1, en komu aftur inn í Unicode 2.0 í júlí 1996 á nýjum stað í stafatöflunni. Útgáfa 1.0.1 frá júní 1992 bætti við 20.902 táḱnumtáknum (fleirum síðar) sem notuð eru í kínversku, japönsku og kóresku. Síðar var bætt við hangul fyrir kóresku, en þau tákn voru líka færð og fjölgað í 11.172 tákn í Unicode 2.0.<!-- þá líka "Surrogate character mechanism defined"-->
 
Nýjasta útgáfan Unicode 12.1 bætti við aðeins einu nýju tákni, fram yfir Unicode 12.0, fyrir tímabil [[keisari Japans|nýs keisara í Japan]] sem tók við 2019 af föður sínum.