Юнікод: розьніца паміж вэрсіямі

Змесціва выдалена Змесціва дададзена
Legobot (гутаркі | унёсак)
д Bot: Migrating 87 interwiki links, now provided by Wikidata on d:q8819 (translate me)
д выпраўленьне перанакіраваньня на шаблён
Радок 1:
'''Юніко́д''' ({{langмова-en|Unicode|скарочана}}) — стандарт кадаваньня сымбаляў, які дазваляе адлюстраваць літары і знакі амаль усіх пісьмовых моваў.<ref name="techin">[http://www.unicode.org/standard/principles.html The Unicode® Standard: A Technical Introduction] {{ref-en}}</ref>
 
Стандарт быў прапанаваны ў [[1991]] годзе некамэрцыйнай арганізацыяй «Кансорцыюм Юнікоду» ({{langмова-en|Unicode Consortium, Unicode Inc.|скарочана}}).<ref name="history">[http://www.unicode.org/history/publicationdates.html History of Unicode Release and Publication Dates] {{ref-en}}</ref><ref name="consort">[http://www.unicode.org/consortium/consort.html The Unicode Consortium] {{ref-en}}</ref> Выкарыстаньне гэтага стандарту дазваляе надаць коды вельмі вялікай колькасьці сымбаляў з розных [[пісьмо|сыстэмаў пісьма]]: у дакумэнтах з выкарыстаньнем Юнікоду могуць разам выкарыстоўвацца кітайскія герогліфы, матэматычныя сымбалі, буквы [[грэцкі альфабэт|грэцкага альфабэту]], [[лацінскі альфабэт|лацінкі]] і [[кірыліца|кірыліцы]], а патрэба ў пераключэньні [[кодавая старонка|кодавых старонак]] адпадае.<ref name="foreword">[http://www.unicode.org/versions/Unicode5.2.0/Foreword.pdf Foreword] {{ref-en}}</ref>
 
Стандарт складаецца з двух асноўных разьдзелаў: унівэрсальны набор сымбаляў ({{langмова-en|UCS, universal character set|скарочана}}) і сямейства кадаваньняў ({{langмова-en|UTF, Unicode transformation format|скарочана}}). Унівэрсальны набор сымбаляў вызначае дакладную адпаведнасьць сымбаляў [[код]]ам — элемэнтам [[#Кодавая прастора|кодавай прасторы]], якія ёсьць неадмоўнымі [[цэлы лік|цэлымі лікамі]]. Сямейства кадаваньняў вызначае машыннае выяўленьне пасьлядоўнасьці кодаў UCS.
 
Коды ў стандарце Юнікод разьдзеленыя на некалькі частак. Частка з кодамі ад U+0000 да U+007F утрымлівае сымбалі з набору [[ASCII]] з адпаведнымі кодамі. Далей разьмешчаныя часткі сымбаляў розных пісьмовых сыстэмаў, пунктуацыйныя знакі і тэхнічныя сымбалі. Частка кодаў зарэзэрваваная для выкарыстаньня ў будучыні.<ref name="genstruct">[http://www.unicode.org/versions/Unicode5.2.0/ch02.pdf General Structure] {{ref-en}}</ref> Пад сымбалі кірыліцы выдзеленыя часткі знакаў з кодамі ад U+0400 да U+052F, ад U+2DE0 да U+2DFF і ад U+A640 да U+A69F.<ref name="euroscript">[http://www.unicode.org/versions/Unicode5.2.0/ch07.pdf European Alphabetic Scripts] {{ref-en}}</ref>
Радок 16:
== Сымбалі-мадыфікатары ==
[[Файл:U nieskładovaje Unicode.svg|thumb|Камбінаваньнем «у» з мадыфікатарам «брэвэ» можна атрымаць сымбаль «[[ў]]».]]
Графічныя сымбалі ў Юнікодзе разьдзяляюцца на падоўжаныя і непадоўжаныя. Непадоўжаныя сымбалі пры выяўленьні не займаюць месца ў [[радок|радку]]. Да іх адносяць, у прыватнасьці, знакі націску і іншую [[дыякрытыка|дыякрытыку]]. Як падоўжаныя, гэтак і непадоўжаныя сымбалі маюць уласныя коды. Падоўжаныя коды інакш называюць базавымі ({{langмова-en|base characters|скарочана}}), а непадоўжаныя — мадыфікатарамі ({{langмова-en|combining characters|скарочана}}); прычым апошнія ня могуць ужывацца асобна. Напрыклад, сымбаль «á» можа быць ужыты як пасьлядоўнасьць базавага сымбалю «a» (U+0061) і мадыфікатара « ́» (U+0301), гэтак і як маналітны сымбаль «á» (U+00C1).
 
Асаблівы тып мадыфікатараў — сэлектары варыянту напісаньня ({{langмова-en|variation selectors|скарочана}}). Яны ўплываюць толькі на тыя сымбалі, для якіх такія варыянты вызначаныя. У вэрсіі 5.0 стандарту варыянты напісаньня вызначаныя для шэрагу матэматычных сымбаляў, для сымбаляў традыцыйнага [[мангольскі альфабэт|мангольскага альфабэту]] і для сымбаляў [[мангольскае квадратнае пісьмо|мангольскага квадратнага пісьма]].
 
== Крыніцы ==