„Unicode“: Munur á milli breytinga

Efni eytt Efni bætt við
Comp.arch (spjall | framlög)
→‎Saga og smáatriði: Skv. "ASCIIbetical" eru stórir stafir á undan litlum (stórir íslenskir á undan litlum eins og í dönsku?), svo ég hélt reglan i ensku líka en ekki skv. http://userguide.icu-project.org/collation
Comp.arch (spjall | framlög)
Lína 17:
 
Sem dæmi nota JSON og XML UTF-8 sem sjálfgefið, en bæði leyfa t.d. UTF-16, þó hefur verið búin til Internet JSON útgáfa (I-JSON), sem leyfir eingöngu UTF-8. Það er líka reglan í nýrri stöðum að leyfa eingöngu UTF-8.
 
Minna notaðar kóðanir eru t.d. [[UTF-EBCDIC]] (sem er ekki leyfilegt á internetinu, en er notað í stórtölvum) þar sem stafir fara upp í 5 bæti (í upphafi leyfði UTF-8 hins vegar líka upp í 6 bæti, en er nú takmarkað við 4). Kínverjar nota [[GB 18030]] stafatöflu sem má líta á sem kóðun fyrir Unicode. Standard Compression Scheme for Unicode (SCSU), notað t.d. af Microsoft SQL Server og Binary Ordered Compression for Unicode (BOCU-1) eru þjappanir fyrir Unicode.
 
Upphaflega Unicode réð við auk latneska letursins sem við erum vön, t.d. við arabísku, kýrílískt letur, grísku, hebresku, taílensku og letur fyrir [[tíbesk tungumál]]. Táknin fyrir tíbesk mál voru reyndar tekin út úr Unicode 1.1, en komu aftur inn í Unicode 2.0 í júlí 1996 á nýjum stað í stafatöflunni. Útgáfa 1.0.1 frá júní 1992 bætti við 20.902 táknum (fleirum síðar) sem notuð eru í kínversku, japönsku og kóresku. Síðar var bætt við hangul fyrir kóresku, en þau tákn voru líka færð og fjölgað í 11.172 tákn í Unicode 2.0.<!-- þá líka "Surrogate character mechanism defined"-->
Lína 29 ⟶ 27:
 
Unicode er með alls konar [[hugtök í nótnaskrift|tákn fyrir tónlist]], t.d. bætti Unicode 3.1 í mars 2001 við táknum fyrir vestræna tónlist og tákn fyrir tónlist frá Býsantímanum.
 
Minna notaðar kóðanir eru t.d. [[UTF-EBCDIC]] (sem er ekki leyfilegt á internetinu, en er notað í stórtölvum) þar sem stafir fara upp í 5 bæti (í upphafi leyfði UTF-8 hins vegar líka upp í 6 bæti, en er nú takmarkað við 4). Kínverjar nota [[GB 18030]] stafatöflu sem má líta á sem kóðun fyrir Unicode. Standard Compression Scheme for Unicode (SCSU), notað t.d. af Microsoft SQL Server og Binary Ordered Compression for Unicode (BOCU-1) eru þjappanir fyrir Unicode.
 
== Tenglar ==