выражаем латиницу кириллицей

Научно-технические вопросы применения русского языка в программировании. Проекты с сайта программирование-по-русски.рф, кроме ЯОС . Информация об организациях и людях, использующих или изучающих русский язык в программировании. Сравнение операционных систем.
Ответить
БудДен
Сообщения: 2839
Зарегистрирован: 07.10.18 14:01

выражаем латиницу кириллицей

Сообщение БудДен » 07.10.18 14:14

#транслит

Думаю, можно говорить о как минимум двух стандартах - обратимой псевдофонетической и обратимой технической. Техническая - есть явный смысл попытаться сделать однобуквенным.

j = й, q = ь, y = ы - это (яролит). Ведь логично, чтобы яролит и латилит были согласованы. h - это только ш, а что же ещё? Оно, собственно, и в яролите поблизости. v = в - яролит. Для w остаётся: ё ж ц ч щ ъ ю. Очевидно, ю (сходство в звучании на самом деле есть).

Код: Выделить всё

a b c d e f g h i j k l m n o p q r s t u v w x y z
а б ц д е ф г ш и й к л м н о п ь р с т у в ю х ы з
Вроде всё правильно, а казалось неочевидным. При такой технической и псевдофонетическая уже не нужна.

БудДен
Сообщения: 2839
Зарегистрирован: 07.10.18 14:01

Re: выражаем латиницу кириллицей

Сообщение БудДен » 07.10.18 16:53

Совместимость между этим вот «латинитом» и яролитом теряется на следующих буквах:
шйюх = hjwx

Обсуждение на ЛОРе: https://www.linux.org.ru/forum/talks/14525807

Примеры:

Код: Выделить всё

линух.орг.ру, юиндоюс.цом
Йошн Леннон
гит цлоне шттпс://гитшуб.цом/алтоцмс
гит цшекоут -ф девелоп
Мосцою
спутник, новицшок
Ыандех тахи 
Исторический прецедент - азбука морзе, она же КОИ-7, она же "инжалид дежице".

Iwann
Сообщения: 3
Зарегистрирован: 14.01.19 12:04

Re: выражаем латиницу кириллицей

Сообщение Iwann » 14.01.19 13:44

Здравствуйте! Хотел прокомментировать Ваш "яролит". Не нашёл отдельной темы по данному вопросу, отпишусь здесь.
Обратимая транслитерация - очень нужная вещь и, предполагаю, очень востребованная в скором времени. Например, при создании единых баз данных в разных сферах (банковской, медицинской, страховой). Несколько замечаний-предложений:
1. буквы Ё и Й лучше транслитеровать как je и ji. Поясню. Во-первых, логика передачи гласных букв в любом случае будет нарушена в угоду краткости и удобству. По логике А-a Я-ja Э-e Е-je Ы-i И-ji О-o Ё-jo У-u Ю-ju, т.е. как по звукам. Но, как у Вас написано, по частоте употребления буква Е превышает Э в разы, также и Ы-И. Поэтому частые буквы переводим одним знаком, редкие двумя с нарушением общей логики. Во-вторых, как указывает В. Зайцев, в русском языке буквы Е и Ё часто взаимозаменяемые (ель-ёлка, ёж-ежовый и т.д.). Поэтому логично сохранить это и в латинице. Также и с Й - основа И + надстрочный знак - в варианте ji видна основа И. Наконец, в Вашем варианте jj префикс j одновременно и постфикс, что не есть хорошо.
2. Ь всё-таки лучше передавать с помощью h. Визуально более всего похож. Плюс подчёркивается вспомогательность ь и h. Но поскольку h это постфикс и одним символом нельзя, то можно использовать j+h. Ь - jh. Ъ - jjh.
3. Щ - самый сложный. Основа Ш + ?. Логично как у Вас sh+h. Но, как вариант, можно добавить освободившуюся q (как хвостик). Щ - shq. Но это вкусовщина.
4. Э - eh явно выпадает из общей системы передачи гласных. Если Э-eh, то тогда уж Ы-ih. Но лично мне Ваш вариант Ы-y нравится (часто именно так его и используют, например Рыжков-Ryzhkov, рыбка-rybka и т.д.) Поэтому предлагаю вариант Э - w. W визуально похожа как лежачая Э. Э-3-W чем-то похожи.
5. Дополнение по дореформенной орфографии. Фита (=тэта) 100% в латинице передаётся как th - Фёдор (Theodor), Матфей (Matthew), Афины (Athens) и т.д. Ижица - vh, как у Вас. А вот И десятеричное и Ять можно как раз по нестандартной системе ih и eh. Но, есть убеждение, что для ИТ-сферы это не потребуется уже никогда.
В заключение, прогноз, что данная система нафиг никому не будет нужна, ровно до того момента как мировые глобальные лидеры не решат всех подключить к какой-нибудь единой глобальной системе (платежные, страховые системы, возможно единая связь).

Аватара пользователя
Лис [Вежливый]
Сообщения: 561
Зарегистрирован: 08.10.18 13:32

Re: выражаем латиницу кириллицей

Сообщение Лис [Вежливый] » 14.01.19 14:25

как мировые глобальные лидеры не решат
БудДен и есть мировой глобальный лидер. И он уже решил, решение своё опубликовал. Пока ещё не все с ним согласны, но со временем склонятся перед его волей.

БудДен
Сообщения: 2839
Зарегистрирован: 07.10.18 14:01

Re: выражаем латиницу кириллицей

Сообщение БудДен » 14.01.19 15:52

Яролит совпадает с советским стандартом 1968 года, который задаёт кодировку и для многих других кириллических письменностей. Единственное отличие - это кодировка ь и ъ как q и jq, а в советском были знаки препинания, что, очевидно, плохо для компьютерных систем. К слову замечу, что первую версию я придумал лет 7 назад, сейчас действует третья. Т.е. яролит достаточно хорошо созрел. А совпадение с советским стандартом выявилось случайно. Более поздние советские стандарты хуже. Поэтому вряд ли следует что-то менять. Дореформенная кириллица, скорее всего, выпадает, если принять во внимание кириллицы для других языков, хотя я этот вопрос не изучал. Насчёт того, нужен ли такой транслит - да, это нужно в куче разных мест уже сегодня, есть масса самопальных разнородных, необратимых транслитов и это плохо. Наше государство в теории должно хотеть это упорядочить. Но это в теории.

Кроме того, вообще транслит можно строить по-разному. Мой заточен на универсальность и на передачу написания. А есть транслиты для передачи звучания. А есть те, где за счёт добавления иных значков сохраняется количество букв. А есть те, которые понятны иностранцам. Тут вопрос вкуса, а на вкус и цвет товарищей нет.

Придумано и опубликовано ещё 2-3 способа кодировки. Каждый может для своих внутренних целей придумать свой. Вопрос - о консенсусе в рамках всего общества, и такой консенсус может инициировать только государство. Какой бы вариант государство не приняло - я с радостью буду его выполнять, если он удовлетворяет условию обратимости в пределах букв.

Касабельно единиых баз - уже есть Visa и хотя бы те же автомобильные номера. В номерах взяли просто пересечение кириллицы и латиницы - попробуйте найти хоть на одном современном номере букву «ю».

А вообще - приветствую на нашем форуме, пишите ещё :)

Ответить