Серия «Что нового в Юникоде»

Одним глазком в Юникод 16.0

Юникод 15.1 пока не поддерживается никем и никак. Но к 16.0 уже готовятся: 1 ноября приняли первые семь эмодзиков. Окончательный выпуск будет осенью 2024.

Эмодзи

Одним глазком в Юникод 16.0 Unicode, Письменность, Эмодзи, Длиннопост

Вот она, великолепная семёрка

Колобок с мешками под глазами — усталый, измученный, похмелье, бессонница

Отпечаток пальца — биометрия, место преступления, мелочи, опознание

Корнеплод — свёкла, дайкон, редька, борщ, репетиция, дать в репу

Голое дерево — осень, зима, засуха, экология, депрессия

Арфа — лира, кифара, цитра, классическое исполнительское искусство, Ирландия

Лопата — откопать, подкопать, закопать (прямо или фигурально), вкалывать

Клякса — грязь, пятно, праздник Холи, краска, соус, пейнтбол

Автоматически вместе с кодом государства появился Сарк, островок в Ла-Манше, владение Великобритании.

Одним глазком в Юникод 16.0 Unicode, Письменность, Эмодзи, Длиннопост

600 человек, и уже код государства CQ

Кириллица

Добавлена одна буква, появившаяся в 2013 году,— ТЬ из языка ханты (уральская семья, 9 тыс. на 2010). Очевидная лигатура из Т и мягкого знака.

Одним глазком в Юникод 16.0 Unicode, Письменность, Эмодзи, Длиннопост

Типа их алфавит

Автор заявки — пикабушник! Мне казалось, что это единственная действующая буква из 16-го Юникода, но нет: есть ещё заглавная буква ɤ, придуманная в 2014 для языка восточный дан (Кот-д’Ивуар, 650 тыс., неписьменный). И целый алфавит гарай.

Около 700 символов со старых компьютеров

Одним глазком в Юникод 16.0 Unicode, Письменность, Эмодзи, Длиннопост

Вот лишь немногие из этих символов

Amstrad CPC, Apple II, Mattel Aquarius и множество других. Полагается, что значимые старые платформы исчерпаны и больше символов со старых компьютеров не будет. Вот, как пример, карты ханафуда на одном из японских терминалов.

Одним глазком в Юникод 16.0 Unicode, Письменность, Эмодзи, Длиннопост

В этом увидят красоту разве что японцы

Вы только посмотрите на их изобретательность: мордашки, кресты, машинки, диоды, резисторы — и из всего этого нарисовали карты.

Алфавит Тодри

Одним глазком в Юникод 16.0 Unicode, Письменность, Эмодзи, Длиннопост

Алфавит Тодри. Авторское Послание к евреям

Тип: алфавит, слева направо, без регистра, экспериментальный

Язык: албанский (на то время — арабица)

Существовал: середина XVIII века…≈1800

Албанский язык, очень далёкий родственник современного греческого, под властью турок несколько веков использовал арабскую вязь. И просвещённые умы около 1800 придумывали другие алфавиты — частично для конспирации от турок, частично для культурной автономии. Уже закодированы виткутьский алфавит (≈1850) и алфавит Эльбасанского Евангелия (до 1800). Вот перед нами третий образчик, также использовавшийся в районе города Эльбасана. Потому алфавит также нередко зовётся «эльбасанским», и чтобы одно не путать с другим, назвали в честь автора — Теодора Хаджифилиппа по прозвищу «учитель Тодри».

Гарай

Одним глазком в Юникод 16.0 Unicode, Письменность, Эмодзи, Длиннопост

Гарай. Авторский букварь

Тип: алфавит, справа налево, с заглавными, экспериментальный

Языки: волоф (6,9 млн на 2017, латиница, арабица, адлам); мандинка (2,1 млн ≈2020, латиница, арабица, нко); оба — Сенегал, нигеро-конголезская семья

Существовал: с 1961

Что такое 1961? Это типа освобождение Африки, и некто Ассане Файе из Сенегала придумал вот такой алфавит. В любом случае в конкуренции победила латиница и количество грамотных в гарае в наши дни исчисляется сотнями, но письменность не умерла и изучается.

Одним глазком в Юникод 16.0 Unicode, Письменность, Эмодзи, Длиннопост

На ум приходит знаменитая шутка из комикса xkcd

Заглавная буква снабжена большим крючком. В конце слова часто добавляют длинный хвост, что, впрочем, не обязательно и будет поддерживаться шрифтами лишь когда туда добавится Тьюринг-полное программирование. Есть и другие места, где разработчики шрифтов ждут настоящего программирования: сложные стили арабского, египетские иероглифы, европейские ноты, стенография Дюплойе.

Тигалари (=западная грантха, тулу-малая́лам, грантха-малая́лам)

Одним глазком в Юникод 16.0 Unicode, Письменность, Эмодзи, Длиннопост

Тигалари. Книга санскритом на пальмовом листе

Тип: брахмийская абугида (особый вид слоговой письменности родом из Индии), слева направо, религиозная

Языки: санскрит (индоевропейская семья), кáннада, малая́лам, тулу (все три — Западная Индия, дравидийская семья). На последнем чаще пишут кáннадой и даже на переписях относят к говорящим на кáннаде.

Существовала: IX…XVII век, крайне редко поныне

Письменность сестринская с уважаемой письменностью малая́лам, и крайне мало используется в индуизме.

Подход к кодированию живых и исторических индийских письменностей очень разный. например, в деванáгари (крупной письменности для хинди, маратхи и более мелких языков):

  • क [ка] = ка

  • क् [к] = ка + вирама

  • क्ष [кша] = ка + вирама + ша

  • क्षी [кши:] = ка + вирама + ша + ии

Сделано это, чтобы задействовать поменьше клавиш на стандартный стиль — а если нужен другой, есть спецсимволы, которые можно хоть через AltGr. Сложно, но не все в Индии «индусы», есть и те, кто запрограммирует как надо.

В исторических письменностях разделяют видимую вираму (убирает гласную A) и виртуальную вираму (=conjoiner, склеивает согласные). Это упрощает создание шрифтов, перепечатывание документов в авторской орфографии, прочтение авторской орфографии на неполноценном шрифте.

Одним глазком в Юникод 16.0 Unicode, Письменность, Эмодзи, Длиннопост

Conjoiner — спецсимвол, склеивает согласные. Virama — видимая, убирает гласную

Цифры берут кто на какие горазд, предлагается унифицировать с кáннадой.

Но это не всё!

Юникод 16.0 — это будет мега-обновление! (В 2022 Консорциум Юникода потерял двух ключевых людей и вынужден был сделать небольшой выпуск.) С новой пачкой эмодзиков будут:

  • сунвар (Непал, алфавит без регистра, 1942)

  • гурунг или кхема (Непал, брахмийская абугида, около 1972)

  • кират-рай (Индия, брахмийская абугида, около 1920)

  • ол-онал (Индия, алфавит без регистра, 1992)

Я пишу программу «Юникодия» — энциклопедию символов Юникода. Качать тут.

Показать полностью 9

Юникод 15.1: что намечается нового

Юникод 15.1: что намечается нового Unicode, Эмодзи, Длиннопост

Юникод 15.1 выходит в сентябре этого года. Поскольку версия намечается малая, то и пост будет небольшой.

Эмодзи

К моменту, когда версия 15.0 подходила к фиксации, начались те самые события, и Консорциум стали просто бомбардировать соответствующими эмодзи: казак, вышиванка, вышитое полотенце, тризуб, колючая проволока, взрыв, булава, хлóпок, тонущий корабль. Как думаете, сколько из них взяли в дело?

(Переведите «хлóпок» на украинский, загуглите — и да завянут уши! С тонущим кораблём — имеется в виду история флагмана Черноморского флота и матерная фраза, ставшая символом этой войны.)

Ни одного.

Но всё-таки немножко эмодзиков появилось, все — ZWJ-последовательности.

Нулевой соединитель (ZWJ = zero width joiner) — невидимый символ с кодом 200D₁₆, призванный соединять символы в лигатуру, если шрифт способен. За пределами эмодзи используется в сингальском (Шри-Ланка).

1. Шесть новых эмодзи

Лайм =🍋+ZWJ+🟩
Съедобный гриб = 🍄+ZWJ+🟫
Разорванная цепь = 🔗+ZWJ+💥
Колобок, кивающий вертикально = 🙂+ZWJ+↕️
Колобок, кивающий горизонтально = 🙂+ZWJ+↔️
Феникс = 🐦️+ZWJ+🔥

2. Новые семьи

Семей существует много разных: из нескольких поколений (бабка+родители+ребёнок+младенец), межрасовые, с питомцами, и непонятно, как всё это собрать, не устроив комбинаторный взрыв. Так что добавили только бесполые семьи, состоящие из «неопределённого взрослого» и «неопределённого ребёнка». Видимо, потому, что имеет право на жизнь вот такая иконка.

Юникод 15.1: что намечается нового Unicode, Эмодзи, Длиннопост

🧑+ZWJ+🧑+ZWJ+🧒+ZWJ+🧒
🧑+ZWJ+🧒+ZWJ+🧒
🧑+ZWJ+🧑+ZWJ+🧒
🧑+ZWJ+🧒

3. Стандартизированы эмодзи с направлением движения

Даже при том, что текст идёт слева направо, меняем направление движения — меняется смысл.

Юникод 15.1: что намечается нового Unicode, Эмодзи, Длиннопост
Юникод 15.1: что намечается нового Unicode, Эмодзи, Длиннопост

В Юникоде 15.0 таких последовательностей не было, только много лет существовал механизм. Теперь будет 108.

Китайские иероглифы

Обещают добавить около 600 новых символов. Однако поскольку штатный иероглифист умер, неизвестно, смогут ли новые иероглифисты подхватить его работу. Зато сделали две новых вещи.

Первая — серьёзно перелопатили базу иероглифов, важно только специалистам.

Юникод 15.1: что намечается нового Unicode, Эмодзи, Длиннопост

Вторая — добавлены пять символов структуры иероглифов. Давно, с версии 3.0, вот этот иероглиф с кодом 2DA21₁₆ можно было описать как ⿰書史, Появились, например, знаки «иероглиф отражён», «иероглиф повёрнут», «у иероглифа стёрта черта».

Юникод 15.1: что намечается нового Unicode, Эмодзи, Длиннопост
Юникод 15.1: что намечается нового Unicode, Эмодзи, Длиннопост

Изменения глифов

Изменены два глифа.

Юникод 15.1: что намечается нового Unicode, Эмодзи, Длиннопост

A798 «F с чертой» используется в африканских языках, и вместо реконструированной буквы теперь найденная в документах. AB5A «игрек с короткой правой ногой» — используется для описания диалектов немецкого, нашли в документах некурсивный вариант.

Напоминаю: я пишу программу «Юникодия» — энциклопедию символов Юникода. Качать тут.

Показать полностью 7

Что ожидается нового в Юникоде 15

Я уже писал с большим опозданием про Юникод 14. Время не стоит на месте, и вышла версия 15-бета. Поехали?


Добавлений мало: 2 новых письменности, 20 эмодзи и 4488 символов, большая часть — иероглифы. Будет 149. 185 символов, плюс 63 старых управляющих.


Эмодзи

Что ожидается нового в Юникоде 15 Unicode, Эмодзи, Длиннопост

Начнём с того, что больше всего интересует нас в новом Юникоде,— эмодзи. Появилась кханда — символ сикхизма, состоящий из меча, чакры (местного индийского сюрикена) и двух сикхских ножей. Кто не знает: сикх всегда носит специальный кривой нож.


Из музыкальных инструментов — флейта/дудка и маракасы, из животных — лось, осёл, гусь, медуза, крыло. Из растений — гиацинт, стручок, имбирь. Из «колобков» добавился трясущийся/дрожащий, из рук — толкающая влево/вправо. Сердечки добавились голубое, серое и розовое. Появился знак радиосети.


Интересная история с веером. На Востоке много танцев с веерами, некоторые веера — настоящие произведения искусства. Но дело не только в этом: в западном языке эмодзи много ребусов — например: (простите, в роли веера — танцовщица)


💩🎯💃 = shit hits the fan — вброс «нетонущего» на вентилятор

💃♣️ = fan club — фан-клуб


Я лично недоволен разве что афро-гребнем, которым негры из своих кудрей делают умопомрачительные причёски. Не стоит добавлять его, не добавив гребня обычного.


Кави

Что ожидается нового в Юникоде 15 Unicode, Эмодзи, Длиннопост

Кави (старояванское письмо) — мёртвое письмо индийского происхождения, использовавшееся на островах Индонезии с VIII до XVI века. Оттуда происходит современное яванское письмо.


Мундари (алфавит Нага)

Что ожидается нового в Юникоде 15 Unicode, Эмодзи, Длиннопост

Мундари — австроазиатский язык, использующийся в Индии, Бангладеш и Непале. Хочется сказать «небольшой», но какой он небольшой с 1,5 миллионами в одной только Индии? — Эстония поменьше будет.


Пишут кто на чём горазд: латиницей, ори́ей, деванáгари, бенгальским. С 23-мя согласными на латинице потребуются умляуты. Индийское письмо лучше приспособлено под широкие алфавиты — но оно полуслоговое (т.н. абугида), а мундари — язык не индоевропейский. Так что не удивительно, что около 1950 некто Рохидас Наг придумал новый алфавит, и он даже прижился.


Сверху на таблице написано «Мундари бани» — одно из названий нового алфавита.


И почему-то индийцы любят добавлять собственные цифры, в каждой письменности свои, мундари не исключение. Знаки препинания обычные международные.


ККЯ


4000 иероглифов самого разного происхождения, в основном старые вьетнамские (современный Вьетнам пишет латиницей), а также найденные британскими исследователями в старых китайских газетах. Ничего особенного.


Для четырёх имевшихся иероглифов перерисовано изображение, причём все их типограф Эндрю Уэст уже нарисовал правильные. (Я и сам с ним советовался, когда работал над своей «Юникодией».)


Форматирование египетских иероглифов

Что ожидается нового в Юникоде 15 Unicode, Эмодзи, Длиннопост

Расширили форматирование египетских иероглифов. Как ни странно, Юникод нужен, чтобы кодировать имеющиеся тексты — и добавили несколько символов для египетских источников. Где-то иероглиф развёрнут, где-то часть затёрта…

Что ожидается нового в Юникоде 15 Unicode, Эмодзи, Длиннопост

Когда-то давно в Юникоде 2 (1996) сделали так называемый «великий корейский бардак» — передвинули блок хангыля. Прошло 25 лет, и в Юникоде 14 (2021) сделали беспрецедентную вещь — расширили блок «Ахом» на 16 символов. Точно так же в Юникоде 15 расширили блок форматирующих символов для иероглифов.


Кактовикские цифры

Что ожидается нового в Юникоде 15 Unicode, Эмодзи, Длиннопост

Эскимосы (или инуиты, если политкорректно) Канады и Аляски считают двадцатками, 74 они произносят как «три двадцатки, пятнадцать без одного». Цифры придуманы школьниками из городка Кактовик (Аляска) в 1980-е годы. В эскимосском нет слова «ноль», однако решили делать настоящую позиционную систему с основанием 20.


Пользуясь только арабскими десятичными цифрами, эскимосы были в числе худших по математике из всех США — а пользуясь и теми, и другими, они стали выше среднего уровня, примерно как двуязычный часто смотрит на мир с двух разных сторон. Эскимосы Канады также рекомендуют новую систему.


Кириллица

Что ожидается нового в Юникоде 15 Unicode, Эмодзи, Длиннопост

Добавились более 60 модифицирующих символов для кириллической записи транскрипции. Нечто подобное — правда, не в таком страшном объёме, как в этих вузовских учебниках — нам преподавали и в школе.


И не могу не рассказать о замене одного редкого глифа для церковных книг — символ A66E «Cyrillic letter Multiocular O». Вот такая необычная буква иногда применялась в выражении «многоокие серафимы».

Что ожидается нового в Юникоде 15 Unicode, Эмодзи, Длиннопост

С 2008 года, когда этот символ появился, в глифе было семь букв О, стало десять. В моей «Юникодии», кстати, это уже отмечено, откорректированные глифы я стараюсь ловить оперативно, хотя не всегда выходит: несколько десятков египетских иероглифов устаревшие (до Юникода 14), и просто не знаю, что с ними делать.


На Украине война, в любой момент могу пропасть, и перехожу на военные правила выпуска программы: блоки Юникода 15 будут, когда будет хоть что-то без тофу («квадратиков»). Хоть эти самые эскимосские цифры. (Основная работа — локализация на английский, и пока ей края нет).


Остальное не заслуживает детального рассмотрения. Сменили пару глифов — для современной буквы сунданского языка (Индонезия) и для древних (около IX века) орхоно-енисейских (тюркских) рун. Добавили три символа из турецкого Корана. В деванáгари добавили несколько знаков из джайнизма XVII века. В лаосском добавили двойную крышку для передачи религиозного языка пали.


Напоминаю: я пишу программу «Юникодия» — энциклопедию символов Юникода. Качать тут.

Показать полностью 7

Что нового в Юникоде 14?

В сентябре 2021 вышел Юникод версии 14. Постараюсь описать, что в нём нового.


Напоминаю: Юникод — это кодировка символов в наших компьютерах. Сейчас она содержит более 140 тысяч позиций, и ни один шрифт не поддерживает Юникод полностью.


Китайский, корейский, японский


Обычно в Юникод за раз добавляется от 2 до 6 тысяч иероглифов. В этот раз ККЯ-символов всего двадцать шесть. Зато много внутренних изменений в базах — например, для 6000 иероглифов уточнили кантонское начертание.


И самое интересное — создали базу необычных иероглифов: простых, сложных, симметричных… Приведу три рекордно-сложных иероглифа:

• U+30EDD бян (упрощённое написание), используется в количестве двух штук в названии китайской лапши бянбян.

• U+30EDE бян — он же, традиционное написание.

• U+3106C дайто/отодо — чисто японский иероглиф, означающий «вид дракона в полёте». Состоит из трёх иероглифов «облако» и трёх иероглифов «дракон». Long dragon is sooo loooong, как говорят (long — англ. «длинный», кит. «дракон»)…

Что нового в Юникоде 14? Unicode, Иероглифы, Коран, Длиннопост, Эмодзи

Эти символы появились год назад в Юникоде 13, сейчас их просто отметили как необычные.


Бянбянная где-то в Сиане, Китай. Обратите внимание на иероглифы.

Что нового в Юникоде 14? Unicode, Иероглифы, Коран, Длиннопост, Эмодзи

Арабский


Добавили в общей сложности 74 символа! — для арабского это рекорд.


Бошняцкий (диалект сербохорватского, который часто пишут арабицей), пегон (запись яванских языков арабскими буквами) — этим никого не удивишь. Где ислам, там арабица. Интереснее другое.


Добавлено 33 знака из комментариев к Корану — например, из Корана издания короля Фахда аль-Сауда (а это, извините, почти современность, этот мэн умер в 2005).

Что нового в Юникоде 14? Unicode, Иероглифы, Коран, Длиннопост, Эмодзи

Декламирование Корана — важное занятие ардритов мусульман с планеты Земля, и это подсказки для чтеца, которые придумал некто Варш, живший в Египте, получивший своё прозвище за светлую кожу (варш — местное название какого-то молочного продукта) и умерший в 810.


Второе интересное добавление — четырнадцать символов — связано с деятелями ислама. Но разрешите сначала процитировать знаменитую сказку.

И Сулейман ибн Дауд — мир с ними обоими! — приказал принести два сосуда: один медный, а другой глиняный, и заточил меня в глиняном сосуде, а брата моего, Омара Хоттабовича,— в медном.

Подобных шаблонных фраз в исламе хватает, и их сокращают в лигатуры. Вот, например, «да будут освящены его тайны» — о суфийских святых.

Что нового в Юникоде 14? Unicode, Иероглифы, Коран, Длиннопост, Эмодзи

Хотели добавить ещё подобных фраз, но… нашли в шрифтах, зато не обнаружили в печатных текстах. Ну и обратите внимание на развёрнутый вопросительный знак — это отдельный арабский символ U+061F, существовавший с самого первого Юникода.


После всех этих добавлений в базовой плоскости осталось 16 нераспределённых позиций. И я даже вангую, на что их пустят — в Юникоде 15 и 16 ни на что. А в дальнейшем — на символы разного назначения, которые кровь из носу должны быть именно в базовой плоскости (например, валютные).


Две новых письменности для умирающих языков


Тото — маленький сино-тибетский язык, используемый в деревне Тотопара (Восточная Индия) племенем тото (1400 человек на 2014). Пишут бенгальской или собственной алфавитной письменностью, которую придумал в 2015 старейшина Дханирам Тото. По интернету ходит очень красивый шрифт неизвестного авторства (SIL International? — авторы «Шехерезады», одного из лучших арабских шрифтов). Запись слева направо.


Одно и то же слово, записанное тото, бенгальским и латиницей.

Что нового в Юникоде 14? Unicode, Иероглифы, Коран, Длиннопост, Эмодзи

Тангса или тасе-нага — семейство сино-тибетских языков на 100 тысяч человек (Мьянма, Северо-Восточная Индия). Письменность — различные виды латиницы (то есть нет стандарта на всех — видимо, связано с тем, что в языках четыре тона). В 1990 индиец Лакхум Моссанг создал алфавит и до смерти в 2020 обучил ему около 100 человек (напрашивается картинка с xkcd про стандарты). Запись слева направо.

Что нового в Юникоде 14? Unicode, Иероглифы, Коран, Длиннопост, Эмодзи

Четыре с половиной исторических письменности


Кипро-минойское письмо — частично расшифрованная слоговая письменность с написанием слева направо, использовавшаяся во II тысячелетии до нашей эры. Шансы на исчерпывающую дешифровку призрачны: все известные надписи насчитывают 2500 символов. Для сравнения: нерасшифрованное линейное письмо А — 7 тысяч, линейное письмо Б на момент расшифровки — 30 тысяч.

Что нового в Юникоде 14? Unicode, Иероглифы, Коран, Длиннопост, Эмодзи

Староуйгурское письмо — промежуточное между согдийским (консонантное, справа налево по строкам, при этом текст часто опрокидывали на 90° влево — получалось слева направо по столбцам) и старомонгольским (чистый алфавит, только слева направо по столбцам). Использовалось около 700…1800.


Компьютерное кодирование по согдийскому принципу — запись справа налево, на 90° влево опрокидывают программно. Вертикальный монгольский — как старо-, так и квадратный Пагба-ламы — наоборот, записывается слева направо и опрокидывается на 90° вправо.


В общем, видно, что вертикальное письмо сделано из заваленного горизонтального, писавшегося справа налево.

Что нового в Юникоде 14? Unicode, Иероглифы, Коран, Длиннопост, Эмодзи

Знáменное пение — православная традиция одноголосого пения, появившаяся около XI века и сохранившаяся у старообрядцев (в современных церквях пение многоголосое). Знамёна указывают выпеваемую фигуру, а высота задаётся так называемыми признáками, часто красного цвета. Если европейские ноты в Юникоде нефункциональны, позволяют записать простым текстом разве что «Кузнечика» и служат в первую очередь для упрощения жизни программистам нотного ПО, уменьшения нотных PDF’ов, то для знаменного пения проект «Пономарь» сделал полностью рабочий шрифт. Это, видимо, и впечатлило Консорциум.


А ещё посмотрите, как смешно называются символы в таблице Юникода: Znamenny combining mark Nizko s kryzhem on left.

Что нового в Юникоде 14? Unicode, Иероглифы, Коран, Длиннопост, Эмодзи

Виткутьский алфавит для албанского языка. В эпоху становления национальных государств (около 1800) известно как минимум четыре местечковых албанских алфавита. Причины две: конспирация от турок (Албания получила независимость в 1912 с распадом Турции) и желание местных просвещённых умов иметь свой алфавит, как у греков и славян.


Назван по селу Виткуть, родине изобретателя.

Что нового в Юникоде 14? Unicode, Иероглифы, Коран, Длиннопост, Эмодзи

Ну а что за половинка? — сильно перерисовали египетские иероглифы по консенсусу египтологов. Например, женщина была с бородой, стала без, в пику Кончи́те Вурст. Причём видно, что случилось: исходные изображения 2009 года были достаточно историчными, но некачественными. В 2016 заменили изображениями, близкими к шрифту «Hieroglyphica» — красивыми, но не всегда правильными.

Что нового в Юникоде 14? Unicode, Иероглифы, Коран, Длиннопост, Эмодзи

Эмодзи


Эмодзи, то есть картиночки для сокращения SMS и твитов — ну как без них?


Тролль — должен означать не столько сказочное существо, сколько интернет-провокатора. В транспортных символах добавили колесо и спасательный круг. В прочих — диско-шар, лотос, гнездо с яйцами и без, севшую батарейку.


Добавилась хамса — распространённый в иудаизме и исламе оберег в виде руки с глазом.

Что нового в Юникоде 14? Unicode, Иероглифы, Коран, Длиннопост, Эмодзи
Ты нарисовал плакат с пальцем? — появился палец, указывающий на зрителя. А также руки сердцем.


Лицо с диагональным ртом — простой смайлик, набираемый текстовыми символами :-\ Даже удивительно, почему его не было раньше.


Лицо с открытыми глазами и рукой поверх рта — это попытка Консорциума как-то стабилизировать разнобой глифов. Дело в том, что Microsoft и Google отображают смайлик 1F92D «лицо с улыбающимися глазами и рукой поверх рта» правильно (сдерживает смех). А у Apple и Facebook глаза широко открыты — удивление или ужас. Этот самый ужас перенесли на другую кодовую позицию.


Ну и как я не мог упомянуть самый главный эмодзи Юникода 14 — беременного мужчину? Таковой действительно существовал — Томас Бити, Ж→М-транс, выносивший трёх детей, будучи по документам мужчиной. Хотя главной причиной была инклюзивность, автор «Эмодзипедии» — между прочим, член комитета Консорциума по эмодзи — заявляет, что англичане могут «наесться до беременности», то есть до такого отвала, что плохо себя чувствуют. А у нас «беременный» — это с пивным пузом.


Появился и просто «беременный человек» — как для тех, у кого тяжело с осознанием пола, так и для женщин с короткой причёской (большинство эмодзи бесполы, и чтобы сделать картинку мужчиной или женщиной, нужно добавить дополнительные символы).


Прочее


Из валютных символов добавился киргизский сом.


В эфиосемитском языке себат-бет (эфиопское письмо) в 2013 случилась орфографическая реформа, которая дала письменность всему семейству гураге. Канадская слоговая письменность захватила эскимосов инуитов племени наттилик. Несколько редких символов латиницы. Все три письменности впервые обзавелись блоками за пределами базовой плоскости.


Ну и напоследок немного самопиара. Я автор «Юникодии», справочника символов для Windows. Качать тут.

Показать полностью 12
Отличная работа, все прочитано!