يونيکوډ
یونیکوډ [۲] ()کې د نړۍ په ډیرو ژبو کې د متن کوډ کولو او ښودلو او پروسس کولو یو کرکټر دی [۳] . هره ژبه د یونیکوډ بڼه لري.
عمومي مالومات | |
---|---|
خپرولو نېټه |
تاسیسات |
|
---|---|
وېبپاڼه |
unicode.org (انګرېزي ژبه) |
نور نومونه | نړيواله کوډ ليکنه (UCS) |
---|---|
ژب(ه/ې) | نړيواله |
کوډ شوې بڼې | UTF-8, UTF-16, GB18030 Less common: UTF-32, BOCU , SCSU, UTF-7 |
دا معیار د کرکټرونو د نړیوال سیټ سره په همغږۍ کې تالیف شوی او د یونیکوډ سټنډرډ په نوم د کتاب په بڼه خپور شوی. د دې معیار په وروستي نسخه کې له 110,000 څخه ډیر حروف او 100 سمبولونه شامل دي، د بصری حوالې لپاره د کوډ ډیاګرامونو سیټ، د کوډ کولو میتودونه او د کرکټر کوډ کولو معیارونو سیټ، د کریکټ ملکیتونو شمیرل لکه لوی او کوچني توري، د کمپیوټر ډیټا سیټ. د فایل حوالې او یو شمیر اړوند توکي لکه د کرکټر توضیحات، یونیکوډ برابري ، رینډرینګ، ترتیب او دوه اړخیزه ښودنه (د متن د سمې ښودلو لپاره چې د ښي څخه کیڼ سکریپټ لري لکه عربي، فارسي او عبراني، او کیڼ څخه - صحیح سکریپټونه). د مارچ 2019 پورې، وروستی بیاکتنه یونیکوډ 12.0 دی.
د کرکټر کوډ کولو په متحد کولو کې د یونیکوډ بریا د سافټویر په نړیوال کولو او ځایی کولو کې د هغې پراخه کارونې لامل شوې. دا معیار په ډیری وروستیو ټیکنالوژیو کې پلي شوی دی په شمول: XML ، جاوا پروګرامینګ ژبه ، مایکروسافټ .NET چوکاټ او عصري عملیاتي سیسټمونه .
یونیکوډ د مختلف کوډونو لخوا پلي کیدی شي. ترټولو پراخه کارول شوي کوډونه عبارت دي له: UTF-8، او تخریب شوي UCS-2، او UTF-16.
UTF-8 کوډ کول د ASCII معیار کې د کوډ کولو لپاره یوازې 1 بایټ کاروي. د سکي کوډ کولو کې د کرکټرونو کوډ په دواړو کوډونو کې یو شان دی. دا کوډ کول په هر کرکټر کې اعظمي حد 4 بایټ کاروي. UCS-2 د ټولو کرکټرونو لپاره 2 بایټونه کاروي، نو دا نشي کولی ټول کرکټرونه په اوسني یونیکوډ معیار کې کوډ کړي. UTF-16 د UCS-2 کوډ کول پراخوي او د پاتې حروفونو لپاره 4 بایټ کاروي.
تاریخ او پرمختګ
سمولد یونیکوډ هدف د زاړه کرکټر کوډ کولو محدودیتونه لرې کول دي ، لکه د ISO 8859 معیار لخوا تعریف شوي ، کوم چې په پراخه کچه په بیلابیلو هیوادونو کې کارول کیږي ، مګر یو له بل سره مطابقت نلري. ډیری زاړه کوډونه یو عام ستونزه لري چې دوی د دوه ژبو متنونو پروسس کولو ته اجازه ورکوي (عموما د لاتیني حروفونو او محلي سمبولونو کارول)، مګر له دوو څخه ډیرو ژبو پروسس کولو ته اجازه نه ورکوي.
د متن پروسس کولو کې د یونیکوډ رول د عکس پر ځای د هر کرکټر لپاره ځانګړی کوډ چمتو کول دي. په بل عبارت، یونیکوډ یو کرکټر په مجازی بڼه وړاندې کوي او د کرکټر د عکس (د اندازې، شکل، فونټ یا سټایل په ګډون) د جوړولو کار بل سافټویر ته پریږدي لکه ویب براوزر یا د کلمې پروسیسر.
نسخې
سمولیونیکوډ د معیاري کولو نړیوال سازمان سره یوځای رامینځته شوی او د ISO/IEC 10646: نړیوال کرکټر سیټ لاندې د نورو سره د کرکټر ریپرټویر شریکوي. یونیکوډ او ISO/IEC 10646 د کرکټر کوډ کولو په توګه څنګ په څنګ کار کوي. مګر د یونیکوډ معیار د پلي کونکي لپاره خورا ډیر معلومات لري ، او د داسې شیانو په اړه نور توضیحات پکې شامل دي لکه د بټ کوډ کول ، لنډیز ، او د کرکټر رینډینګ. د یونیکوډ معیار کې د کرکټر مشخصات لوی شمیر شامل دي ، پشمول د دوه اړخیز متن لیکلو ملاتړ. د دې دوه معیارونو لخوا کارول شوي شرایط یو څه توپیر لري.
د یونیکوډ کنسورشیم لومړی ځل په 1991 کې د یونیکوډ معیاري نسخه (1.0 نسخه) خپره کړه، او له هغه وخت راهیسې په منظمه توګه نوې نسخې خپروي. د یونیکوډ معیار وروستۍ نسخه، نسخه 13.0، د 2020 په مارچ کې خپره شوه او د کنسورشیم ویب پاڼې څخه په بریښنایی بڼه کې شتون لري. د معیار وروستۍ نسخه په بشپړ ډول د کتاب په بڼه خپره شوې (د کوډ ډیاګرامونو په شمول) په 2006 کې 5.0 نسخه وه، مګر د 5.2 نسخه (2009) راهیسې د معیار اصلي ځانګړتیا د غوښتنې سره سم د چاپ شوي کاغذ په توګه خپره شوې. د معیاري هرې نسخې ټول متن، په شمول د اصلي ځانګړتیاوو، معیاري ضمیمو او کوډ ډیاګرامونو په شمول، په وړیا توګه د یونیکوډ ویب پاڼه کې په PDF بڼه کې شتون لري [۴] .
تر دې دمه ، د یونیکوډ معیار لاندې لوی او کوچني نسخې خپرې شوي. تازه شوي نسخې، چې د کرکټرونو په ریپرټویر کې هیڅ بدلون نه لري، په دریم نمبر سره نښه شوي (د مثال په توګه "4.0.1 نسخه") او په لاندې جدول کې نه پریښودل کیږي [۵] .
نسخه | نېټه | کتاب | نسخه ISO/IEC 10646 متناظر | Scripts | کرکټرونه | |
---|---|---|---|---|---|---|
د یونیکوډ په هره نسخه کې چمتو شوي د [tablenote ۱] | مهمې نسخې | |||||
1.0.0 | October 1991 | ISBN 0-201-56788-1 (Vol. 1) | 24 | 7,161 | په لومړۍ ټولګه کې لاندې توري شامل دي: عربي، ارمنيايي، بنګالي، بوپوموفو، سيريليک، ديوناگري، جورجيا، يوناني او کاپټیک] , گجراتی، گرم، هنگول، عبراني، هیراگانا، Canada, Katakana, Lao , [لاتین لیکل شوی ] ]، تايي، او تبتي.[۶] | |
1.0.1 | June 1992 | ISBN 0-201-60845-6 (Vol. 2) | 25 | 28,359 | له اولينو ټولګو CJK Unified Ideographs ګڼل کيږي.[۷] | |
1.1 | June 1993 | ISO/IEC 10646-1:1993 | 24 | 34,233 | 4,306 بل سېلاب هانگولیپه لومړنۍ ټولګه کې 2,350کرکټره ورزيات شول. تبتي حذف شول.[۸] | |
2.0 | July 1996 | ISBN 0-201-48345-9 | ISO/IEC 10646-1:1993 plus Amendments 5, 6 and 7 | 25 | 38,950 | ماصلي هنګولیان سیلاب ګروپ لیرې شو او د 11,172 سیلاب ډلو یو نوی ځای جوړ شو. تبتی بیا د یوې نوې ډلې سره او په بل ځای کې اضافه شوی.
. د کرکټرونو لپاره د بدیل میکانیزم تعریف شوی. پاڼې 15 او 16 en:Private_use_(Unicode) وټاکل شوه.[۹] |
2.1 | May 1998 | ISO/IEC 10646-1:1993 plus Amendments 5, 6 and 7, as well as two characters from Amendment 18 | 25 | 38,952 | ايورو نښه Object Replacement Character زياته شوه.[۱۰] | |
3.0 | September 1999 | ISBN 0-201-61633-5 | ISO/IEC 10646-1:2000 | 38 | 49,259 | چروگکی، گعز، خمری، مغولی، برمه ای، اوقام، خط رونی، سینهالا، سریانی، تهانا، سیلاب های مشترک غیربومی کانادایی and یی و همچنین الگوهای بریل نیز اضافه شدند.[۱۱] |
3.1 | March 2001 | ISO/IEC 10646-1:2000
ISO/IEC 10646-2:2001 |
41 | 94,205 | دسرت, گوتیک، ایتالیایی باستانی، نمادهایی از موسیقی غربی و بیزانسی و 42711 CJK Unified Ideographs اضافه شدند.[۱۲] | |
3.2 | March 2002 | ISO/IEC 10646-1:2000 plus Amendment 1
ISO/IEC 10646-2:2001 |
45 | 95,221 | فیلیپینی، بوید، هاونو، تاگالوگ، و تاگبانوا اضافه شد.[۱۳] | |
4.0 | April 2003 | ISBN 0-321-18578-1 | ISO/IEC 10646:2003 | 52 | 96,447 | سیپروییت، لیمبو، B خطی، عثمانی،شاویان، تای له، اوگارتی، و شش نویسی اضافه شدند.[۱۴] |
4.1 | March 2005 | ISO/IEC 10646:2003 plus Amendment 1 | 59 | 97,720 | بوگینیز، گلاگولیتی، خروشتی،تای لو، فارسی باستانی، سیلهتی، و تیفیناگ اضافه شدند. کپتی از یونانی جداشد. اعداد و نشانه های موسیقیایی یونان باستان نیز اضافه شدند .[۱۵] | |
5.0 | July 2006 | ISBN 0-321-48091-0 | ISO/IEC 10646:2003 plus Amendments 1 and 2, as well as four characters from Amendment 3 | 64 | 99,089 | بالیایی، خط میخی،انکو، پاسپا، و فینیقی اضافه شد.[۱۶] |
5.1 | April 2008 | ISO/IEC 10646:2003 plus Amendments 1, 2, 3 and 4 | 75 | 100,713 | کاریان، چام، کایا لی،لپ چا،لیسی، لیدی، اولچیکی، رجنگ، شوراشترا،ساندانی، وای، و همچنین نشانه هایی از صفحه فستوس، ماژونگ، دومینو اضافه شد.
به علاوه اضافاتی از برمه ای، اختصارات کتابی، و نسخ خطی میانه، و حرف بزرگ ẞ رانیز در بر داشت.[۱۷] | |
5.2 | October 2009 | ISBN 978-1-936213-00-9 | ISO/IEC 10646:2003 plus Amendments 1, 2, 3, 4, 5 and 6 | 90 | 107,361 | اوستایی، باموم، هیروگلیف مصری ( در مجموعه نشانه های گاردینر 1071 کاراکتر وجود دارد)، آرامی پادشاهی، پهلوی نوشتاری، پارتی نوشتاری، جاوه ای، کایتی، فراسر، میتئی، عربستانی جنوبی باستانی، ترکی باستانی (اورخون)، سامری، تای تام، تای ویت اضافه شد. همچنین 4149 CJK Unified Ideographs به همراه توسعه جامو برای هانگولی و کاراکترهای وردیکت نیز اضافه شدند.[۱۸] |
6.0 | October 2010 | ISBN 978-1-936213-01-6 | ISO/IEC 10646:2010 plus the Indian rupee sign | 93 | 109,449 | بتک، براهمی، ماندایی،علائم راهنمایی و رانندگی، نقشه، نشانه های شیمیایی، شکلک ها، و 222 CJK Unified Ideographs اضافه شد.[۱۹] |
6.1 | January 2012 | ISBN 978-1-936213-02-3 | ISO/IEC 10646:2012 | 100 | 110,181 | چامکا، مروئیت، پولارد، شارادا، سرنگ سمپن، و تکری اضافه شدند.[۲۰] |
6.2 | September 2012 | ISBN 978-1-936213-07-8 | ISO/IEC 10646:2012 plus the Turkish lira sign | 100 | 110,182 | نشان لیره ترکیه اضافه شد.[۲۱] |
6.3 | September 2013 | ISBN 978-1-936213-08-5 | ISO/IEC 10646:2012 plus six characters | 100 | 110,187 | 5 کاراکتر برای متن دوسویه اضافه شد.[۲۲] |
7.0 | June 2014 | ISBN 978-1-936213-09-2 | ISO/IEC 10646:2012 plus Amendments 1 and 2, as well as the Ruble sign | 123 | 113,021 | باسا، آلابانیای قفقاز، دوپلویان، الباسان، گرانتا، خوجکی، خودابادی،
خطی آ، ماهاجانی، مانوی، منده کیکاکویی، مودی، مرو، نبطی، عربی شمالی باستانی، پرمیک باستانی، پاهاو، تدمیری، پو چین هاو، پهلوی نیایشی، سیدام، تیرهوتا، وارانگ، نشان گذارهای پارگرافی.[۲۳] |
8.0 | June 2015 | ISBN 978-1-936213-10-8 | ISO/IEC 10646:2014 plus Amendment 1, as well as the Lari sign, nine CJK unified ideographs, and 41 emoji characters[۲۴] | 129 | 120,737 | آهوم، آناتولی، هاتران، مولتانی، لهستانی باستانی، زبان اشاره، چروکی نشانه ای، 5771 CJK Unified Ideographs دیگر، و مجموعه کوچک نویسی چروگکی و پنج نشانه مقیاس فیتزپاتریک.[۲۵] |
9.0 | June 2016 | ISBN 978-1-936213-13-9 | ISO/IEC 10646:2014 plus Amendments 1 and 2, as well as Adlam, Newa, Japanese TV symbols, and 74 emoji and symbols[۲۶] | 135 | 128,237 | آدلام، بایکسوکی، ژانگ ژانگ، پراکال، اوساژ، تانگوت، ایموجی.[۲۷][۲۸] |
10.0 | June 2017 | ISBN 978-1-936213-16-0 | ISO/IEC 10646:2017 plus 56 emoji characters, 285 hentaigana characters, and 3 Zanabazar Square characters[۲۹] | 139 | 136,755 | زانابازار، سویومبو، ماسارام گوندی، نوشو، هنتایگانا، هیراگانا، 7494 CJK Unified Ideographs دیگر، و ایموجی |
11.0 | June 2018 | ISBN 978-1-936213-19-1 | ISO/IEC 10646:2017 plus Amendment 1, as well as 46 Mtavruli Georgian capital letters, 5 CJK unified ideographs, and 66 emoji characters.[۳۰] | 146 | 137,439 | دوگری، خدرولی، گونجالا، حنیفی، ایندی، ماکاسارس، مدفدری، سغدی، مایا، 5 CJK Unified Ideographs با اولویت بالا، نشانه های شطرنج چینی، نشنه پنج ستاره، و 146 ایموجی دیگر[۳۱] |
12.0 | March 2019 | ISBN 978-1-936213-22-1 | ISO/IEC 10646:2017 plus Amendments 1 and 2, as well as 62 additional characters.[۳۲] | 150 | 137,993 | الیمایی، ناندیناگاری، نیاکنگ، وانچو، پولارد اضافاتی برای علامت های زبان یی و میائو چینی، حروف کوچکژاپنی هیراگانا و کاتاکانا، نشانه ها و شاخه های تاریخی تامیل، حروف لائو برای پالی، حروف لاتین برای حرف نوشتار مصری و اوگاریتیک، نشانه ای هیروگلیف، و 161 ایموجی[۳۳] |
12.1 | May 2019 | ISBN 978-1-936213-25-2 | 150 | 137,994 | افزودن یک کارکتر در U+32FF برای شکل مربع اسم ریوا.[۳۴] | |
13.0 | March 2020 | ISBN 978-1-936213-26-9 | ISO/IEC 10646:2020[۳۵] | 154 | 143,924 | زبان خوارزمی، دیوی، خیطان، کوردی یزیدی، اضافات سری G CJK Unified Ideographs، اضافات زبان عربی برای زبان هوسه و زبان ولوف و دیگر زبانهای افریقایی و نوشتار زبان هندکو و زبان پنجابی در پاکستان، بوپوموفو، و اضافتی برای کانوتی، نشانه های مدرک خلاقیت عمومی، کاراکترهای گرافیکی برای تلتکست و سیستم های رایانه ای دهه های 70 و 80، و همچنین 55 ایموجی.[۳۶] |
- ↑ د حروفونو شمیره د ټولو لیکلو، فارمیټ کولو، او کنټرول حروفونو مجموعې سره مساوي ده. (د بېلګې په ډول , excluding private-use characters, noncharacters and surrogate code points).
په وینډوز کې یونیکوډ
سمولپه وینډوز API کې، د یونیکوډ افعال د W ضمیمې سره راځي. (مثال: CreateWindowExW) لاحقه W د پراخه کریکټ اصطلاح لومړی توری دی. د پروګرامینګ ژبو کې، د ډیټا ډولونه چې د یونیکوډ ملاتړ کوي ورته نومونه لري لکه WCHAR، او ځینې وختونه ورته ملټي بایټ کرکټر ویل کیږي (به کې هم ویل کیږي.
اړوندې پوښتنې
سمول- یونیکوډ داخل کړئ
- د کرکټر کوډ کول
- کرکټر
- د یونیکوډ بڼه
بهرنۍ لینک
سمولپايڅوړ
سمول- ↑ سرچينې تړی: https://www.unicode.org/Public/UCD/latest/ucd/Blocks.txt.
- ↑ "Unicode Transcriptions". The Unicode Consortium. 2011-11-11. Retrieved 2012-02-22.
- ↑ Unicode Standard
- ↑ "Unicode 6.1 Paperback Available". announcements_at_unicode.org. نه اخيستل شوی 2012-05-30.
- ↑ "Enumerated Versions of The Unicode Standard". نه اخيستل شوی 2016-06-21.
- ↑ "Unicode Data 1.0.0". نه اخيستل شوی 2010-03-16.
- ↑ "Unicode Data 1.0.1". نه اخيستل شوی 2010-03-16.
- ↑ "Unicode Data 1995". نه اخيستل شوی 2010-03-16.
- ↑ "Unicode Data-2.0.14". نه اخيستل شوی 2010-03-16.
- ↑ "Unicode Data-2.1.2". نه اخيستل شوی 2010-03-16.
- ↑ "Unicode Data-3.0.0". نه اخيستل شوی 2010-03-16.
- ↑ "Unicode Data-3.1.0". نه اخيستل شوی 2010-03-16.
- ↑ "Unicode Data-3.2.0". نه اخيستل شوی 2010-03-16.
- ↑ "Unicode Data-4.0.0". نه اخيستل شوی 2010-03-16.
- ↑ "Unicode Data-4.1.0". نه اخيستل شوی 2010-03-16.
- ↑ "Unicode Data 5.0.0". نه اخيستل شوی 2010-03-17.
- ↑ "Unicode Data 5.1.0". نه اخيستل شوی 2010-03-17.
- ↑ "Unicode Data 5.2.0". نه اخيستل شوی 2010-03-17.
- ↑ "Unicode Data 6.0.0". نه اخيستل شوی 2010-10-11.
- ↑ "Unicode Data 6.1.0". نه اخيستل شوی 2012-01-31.
- ↑ "Unicode Data 6.2.0". نه اخيستل شوی 2012-09-26.
- ↑ "Unicode Data 6.3.0". نه اخيستل شوی 2013-09-30.
- ↑ "Unicode Data 7.0.0". نه اخيستل شوی 2014-06-15.
- ↑ "Unicode 8.0.0". Unicode Consortium. نه اخيستل شوی 2015-06-17.
- ↑ "Unicode Data 8.0.0". نه اخيستل شوی 2015-06-17.
- ↑ "Unicode 9.0.0". Unicode Consortium. نه اخيستل شوی 2016-06-21.
- ↑ "Unicode Data 9.0.0". نه اخيستل شوی 2016-06-21.
- ↑ Lobao, Martim (7 June 2016). "These Are The Two Emoji That Weren't Approved For Unicode 9 But Which Google Added To Android Anyway". Android Police. نه اخيستل شوی 4 September 2016.
- ↑ "Unicode 10.0.0". Unicode Consortium. نه اخيستل شوی 2017-06-20.
- ↑ "The Unicode Standard, Version 11.0.0 Appendix C" (PDF). Unicode Consortium. نه اخيستل شوی 2018-06-11.
- ↑ "Announcing The Unicode® Standard, Version 11.0". blog.unicode.org. نه اخيستل شوی 2018-06-06.
- ↑ "The Unicode Standard, Version 12.0.0 Appendix C" (PDF). Unicode Consortium. نه اخيستل شوی 2019-03-05.
- ↑ "Announcing The Unicode® Standard, Version 12.0". blog.unicode.org. نه اخيستل شوی 2019-03-05.
- ↑ "Unicode Version 12.1 released in support of the Reiwa Era". blog.unicode.org. نه اخيستل شوی 2019-05-07.
- ↑ "The Unicode Standard, Version 13.0– Core Specification Appendix C" (PDF). Unicode Consortium. نه اخيستل شوی 2020-03-11.
- ↑ "Announcing The Unicode® Standard, Version 13.0". blog.unicode.org. نه اخيستل شوی 2020-03-11.
سرچينې
سمول- «یونیکد چیست؟». ترجمهٔ روزبه پورنادر. کنسرسیوم یونیکد. دریافتشده در ۱۰ ژوئیهٔ ۲۰۰۹..mw-parser-output cite.citation{font-style:inherit}.mw-parser-output q{quotes:"\"""\"""'""'"}.mw-parser-output code.cs1-code{color:inherit;background:inherit;border:inherit;padding:inherit}.mw-parser-output .cs1-lock-free a{background:url("//upload.wikimedia.org/wikipedia/commons/thumb/6/65/Lock-green.svg/9px-Lock-green.svg.png")no-repeat;background-position:right .1em center;padding-right:1em;padding-left:0}.mw-parser-output .cs1-lock-limited a,.mw-parser-output .cs1-lock-registration a{background:url("//upload.wikimedia.org/wikipedia/commons/thumb/d/d6/Lock-gray-alt-2.svg/9px-Lock-gray-alt-2.svg.png")no-repeat;background-position:right .1em center;padding-right:1em;padding-left:0}.mw-parser-output .cs1-lock-subscription a{background:url("//upload.wikimedia.org/wikipedia/commons/thumb/a/aa/Lock-red-alt-2.svg/9px-Lock-red-alt-2.svg.png")no-repeat;background-position:right .1em center;padding-right:1em;padding-left:0}.mw-parser-output div[dir=ltr] .cs1-lock-free a,.mw-parser-output div[dir=ltr] .cs1-lock-subscription a,.mw-parser-output div[dir=ltr] .cs1-lock-limited a,.mw-parser-output div[dir=ltr] .cs1-lock-registration a{background-position:left .1em center;padding-left:1em;padding-right:0}.mw-parser-output .cs1-subscription,.mw-parser-output .cs1-registration{color:#555}.mw-parser-output .cs1-subscription span,.mw-parser-output .cs1-registration span{border-bottom:1px dotted;cursor:help}.mw-parser-output .cs1-hidden-error{display:none;font-size:100%}.mw-parser-output .cs1-visible-error{font-size:100%}.mw-parser-output .cs1-subscription,.mw-parser-output .cs1-registration,.mw-parser-output .cs1-format{font-size:95%}.mw-parser-output .cs1-kern-left,.mw-parser-output .cs1-kern-wl-left{padding-left:0.2em}.mw-parser-output .cs1-kern-right,.mw-parser-output .cs1-kern-wl-right{padding-right:0.2em}
- مشارکتکنندگان ویکیپدیا. «Unicode». در دانشنامهٔ ویکیپدیای انگلیسی، بازبینیشده در ۱۱ ژوئن ۲۰۰۹.