Unicode
Unicode es un norma de la industria de computa per la codigi, represente, e maneja de testo espresada en la plu de la sistemes de scrive de la mundo. La norma es mantenida par la Unicode Consortium ("asosia per unicode"), e a juno 2018, la varia la plu resente (Unicode 11.0) conteni un colie de 137,439 sinias covrente 146 sistemes de scrive moderne e istorial, e alga colies de sinias e emojis. La colie es sincronida con ISO/IEC 10646, identica a unicode.
La norma de unicode es composada de un grupo de mapas per refere vidal, un metodo de codigi, e un grupo de codigas normida de leteras e sinias, un grupo de arcivos de data, e un cuantia de cosas relatada (pe la cualias de sinias, regulas per normi, decomposa, cola, desinia, e ordina de mostra bidirijal per mostra coreta de testos conteninte scrives comensante a destra e a sinistra.)
La susede de unicode a uni grupos de sinias ia condui a sua usa vasta e dominante en la internasionali e locali de programas de computa. La normas ia es utili en multe tecnolojias resente, incluinte sistemes de opera moderne, XML, Java, otra linguas de computa, e la strutur de .NET.
Unicode pote es utilida par codigos diferente per sinias. La model de unicode defini UTF-8, UTF-16, UTF-32, e alga otra codigos. UTF-8 es usada par plu ca 91% de locas ueb. Lo usa un bait per la 128 puntos de codiga prima, e asta sinco baites per otra sinias. La 128 puntos prima es la sinias de ASCII, donce cualce testo en ASCII es ance un testo en UTF-8.
Per plu, vade a la paje prima de la asosia de unicode
Sistemes de scrive | model | ||
Logografias | Cuneforma | Ieroglifos | Xines | Canji | Maia | ||
Silabarios | Tsalagi | Canadianes orijinal | Catacana | Hiragana | Linial B | ||
Abjades | Alfabeta orijinal | Arabi | Fenisia | Arami | Ivri | Maniste | Nabatea | Sogdian | Suri | Tifinagh | Ugaritica | ||
Abugidas | Bangla | Brami | Calinga | Canada | Caxmiri | Devanagari | Granta | Gujurati | Gupta | Gurmuci | Hanunuo | Itiopian | Mianmar | Odia | Sindi | Sinhales | Tai | Tamil | Telugu | Tengwar | Tibetan | Tocarian | ||
Alfabetas completa | Adlam | Bopomofo | Cartuli | Cirilica | Copta | Deseret | Deutx | Elinica | Eres | Etrusca | Glagolitica | Goto | Haieren | Hangul | Latina | Mandaia | Mongol | Ogam | N'ko | Runas | Shaw | Turces vea | Uigur | ||
Otra cosas | Scrive corente | Stenografia | Transcrive | Alfabeta Fonetical Internasional (AFI) | Unicode |