Одним глазком в Юникод 16.0
Юникод 15.1 пока не поддерживается никем и никак. Но к 16.0 уже готовятся: 1 ноября приняли первые семь эмодзиков. Окончательный выпуск будет осенью 2024.
Эмодзи
Вот она, великолепная семёрка
Колобок с мешками под глазами — усталый, измученный, похмелье, бессонница
Отпечаток пальца — биометрия, место преступления, мелочи, опознание
Корнеплод — свёкла, дайкон, редька, борщ, репетиция, дать в репу
Голое дерево — осень, зима, засуха, экология, депрессия
Арфа — лира, кифара, цитра, классическое исполнительское искусство, Ирландия
Лопата — откопать, подкопать, закопать (прямо или фигурально), вкалывать
Клякса — грязь, пятно, праздник Холи, краска, соус, пейнтбол
Автоматически вместе с кодом государства появился Сарк, островок в Ла-Манше, владение Великобритании.
600 человек, и уже код государства CQ
Кириллица
Добавлена одна буква, появившаяся в 2013 году,— ТЬ из языка ханты (уральская семья, 9 тыс. на 2010). Очевидная лигатура из Т и мягкого знака.
Типа их алфавит
Автор заявки — пикабушник! Мне казалось, что это единственная действующая буква из 16-го Юникода, но нет: есть ещё заглавная буква ɤ, придуманная в 2014 для языка восточный дан (Кот-д’Ивуар, 650 тыс., неписьменный). И целый алфавит гарай.
Около 700 символов со старых компьютеров
Вот лишь немногие из этих символов
Amstrad CPC, Apple II, Mattel Aquarius и множество других. Полагается, что значимые старые платформы исчерпаны и больше символов со старых компьютеров не будет. Вот, как пример, карты ханафуда на одном из японских терминалов.
В этом увидят красоту разве что японцы
Вы только посмотрите на их изобретательность: мордашки, кресты, машинки, диоды, резисторы — и из всего этого нарисовали карты.
Алфавит Тодри
Алфавит Тодри. Авторское Послание к евреям
Тип: алфавит, слева направо, без регистра, экспериментальный
Язык: албанский (на то время — арабица)
Существовал: середина XVIII века…≈1800
Албанский язык, очень далёкий родственник современного греческого, под властью турок несколько веков использовал арабскую вязь. И просвещённые умы около 1800 придумывали другие алфавиты — частично для конспирации от турок, частично для культурной автономии. Уже закодированы виткутьский алфавит (≈1850) и алфавит Эльбасанского Евангелия (до 1800). Вот перед нами третий образчик, также использовавшийся в районе города Эльбасана. Потому алфавит также нередко зовётся «эльбасанским», и чтобы одно не путать с другим, назвали в честь автора — Теодора Хаджифилиппа по прозвищу «учитель Тодри».
Гарай
Гарай. Авторский букварь
Тип: алфавит, справа налево, с заглавными, экспериментальный
Языки: волоф (6,9 млн на 2017, латиница, арабица, адлам); мандинка (2,1 млн ≈2020, латиница, арабица, нко); оба — Сенегал, нигеро-конголезская семья
Существовал: с 1961
Что такое 1961? Это типа освобождение Африки, и некто Ассане Файе из Сенегала придумал вот такой алфавит. В любом случае в конкуренции победила латиница и количество грамотных в гарае в наши дни исчисляется сотнями, но письменность не умерла и изучается.
На ум приходит знаменитая шутка из комикса xkcd
Заглавная буква снабжена большим крючком. В конце слова часто добавляют длинный хвост, что, впрочем, не обязательно и будет поддерживаться шрифтами лишь когда туда добавится Тьюринг-полное программирование. Есть и другие места, где разработчики шрифтов ждут настоящего программирования: сложные стили арабского, египетские иероглифы, европейские ноты, стенография Дюплойе.
Тигалари (=западная грантха, тулу-малая́лам, грантха-малая́лам)
Тигалари. Книга санскритом на пальмовом листе
Тип: брахмийская абугида (особый вид слоговой письменности родом из Индии), слева направо, религиозная
Языки: санскрит (индоевропейская семья), кáннада, малая́лам, тулу (все три — Западная Индия, дравидийская семья). На последнем чаще пишут кáннадой и даже на переписях относят к говорящим на кáннаде.
Существовала: IX…XVII век, крайне редко поныне
Письменность сестринская с уважаемой письменностью малая́лам, и крайне мало используется в индуизме.
Подход к кодированию живых и исторических индийских письменностей очень разный. например, в деванáгари (крупной письменности для хинди, маратхи и более мелких языков):
क [ка] = ка
क् [к] = ка + вирама
क्ष [кша] = ка + вирама + ша
क्षी [кши:] = ка + вирама + ша + ии
Сделано это, чтобы задействовать поменьше клавиш на стандартный стиль — а если нужен другой, есть спецсимволы, которые можно хоть через AltGr. Сложно, но не все в Индии «индусы», есть и те, кто запрограммирует как надо.
В исторических письменностях разделяют видимую вираму (убирает гласную A) и виртуальную вираму (=conjoiner, склеивает согласные). Это упрощает создание шрифтов, перепечатывание документов в авторской орфографии, прочтение авторской орфографии на неполноценном шрифте.
Conjoiner — спецсимвол, склеивает согласные. Virama — видимая, убирает гласную
Цифры берут кто на какие горазд, предлагается унифицировать с кáннадой.
Но это не всё!
Юникод 16.0 — это будет мега-обновление! (В 2022 Консорциум Юникода потерял двух ключевых людей и вынужден был сделать небольшой выпуск.) С новой пачкой эмодзиков будут:
сунвар (Непал, алфавит без регистра, 1942)
гурунг или кхема (Непал, брахмийская абугида, около 1972)
кират-рай (Индия, брахмийская абугида, около 1920)
ол-онал (Индия, алфавит без регистра, 1992)
Я пишу программу «Юникодия» — энциклопедию символов Юникода. Качать тут.