Не каждый человек может написать своё имя в Юникоде

в 10:24, , рубрики: IT-стандарты, Unicode, utf-8, типографика, Юникод

Казалось бы, в Юникод включили уже все возможные и невозможные символы. В последней версии Unicode 7.0 добавлено 23 новых письменности, включая древнепермское письмо и почти полностью расшифрованное линейное письмо А минойской цивилизации 2000 г до н.э., сотни экзотических эмотиконов.

Общее количество символов в Unicode превысило 110 000 штук. Казалось бы, там уже есть все распространённые символы. Оказывается, это не так. До сих пор остались люди, которые не могут написать в Юникоде даже собственное имя. Им приходится прибегать к разным трюкам.

О своей проблеме рассказал индийский IT-специалист, имя которого мы не можем правильно напечатать, разве что в транслитерации: Адитья Мукереджи.

Родной язык парня — бенгальский, это седьмой по популярности язык в мире, который значительно опережает по численности носителей даже русский. Вы можете представить, что не все символы русского языка представлены в Unicode? А вот для бенгальского это привычное дело.

Не каждый человек может написать своё имя в Юникоде - 1
Бенгальские символы

Бенгальский представлен в Unicode с самой первой версии, но с самого начала в нём не хватало символов. Жителям страны приходилось изобретать велосипеды, восполняя недостающие символы при письме комбинациями похожих букв и цифр, как в хакерском l33tspeak. Так, его собственное имя можно написать со сходной графемой из родственной письменности: আদিত্য.

Не каждый человек может написать своё имя в Юникоде - 2
Отсутствующая буква

В 2005 году некоторые символы добавили, но не все. В его имени до сих пор не хватает буквы, хотя оно — вовсе не какая-то экзотика, а повсеместно встречается в Индии и даже входит в 1000 самых популярных имён в США.

Адитья Мукереджи обвиняет в технической некомпетентности сотрудников консорциума Unicode, которые занимаются подготовкой стандарта. Смелый специалист даже делает расистские намёки. По его мнению, среди сотрудников слишком много белых англоговорящих людей. Дерзость можно понять: он как продвинутый пользователь цифровой техники немало уже натерпелся за свою жизнь из-за «неудачного» имени.

Адитья опасается, что консорциум Unicode не собирается изменять список из 224 024 символов, которые планируется включить в Unicode в ближайшие годы.

Эта история представляется ещё и интересным примером того, что современные технологии могут не только упростить жизнь, но и осложнить её.

Автор: alizar

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js