Страница 1 из 1

Как перевести "code point" юникода?

Добавлено: 25.04.20 00:33
БудДен
Хочу, вслед за голангом, назвать его "руной". Тут останется терминологическая неясность, т.к. обходим вопрос о нормализации.
Но мы пока будем считать, что проблемы нормализации нет, и что есть однозначное соответствие между изображением и циферками, формирующими это изображение. Потому что в русском языке нет такой проблемы, как диакритические знаки. Может быть, есть знак ударения, но это уже не про буквы, а про вёрстку.

Соответственно:
  • буквой назвать нельзя, т.к. есть цифры, скобки и проч
  • называть кодовым пойнтом или как-то ещё - это нонсенс, т.к. это будет ещё тип данных, который будет очень часто встречаться и должен состоять из минимального количества букв
  • символом назвать нельзя, т.к. есть символ в смысле лиспа, и я не исключаю, что он ещё появится. Кроме того, символ - это 6 букв.
  • знаком назвать можно, но тоже наверняка возникнет неоднозначность. Например, есть "знак препинания". А буква тогда знак чего? А цифра? А пробел? Хотя это получается второй по приоритету вариант: руна мне нравится тем, что она ничем не занята, соответственно, вероятность неоднозначности снижается. И можно даже впихнуть в неё эту проблему с диакритикой.
  • соответственно, почему бы не назвать руной?
Ваши мнения? Видимо, придётся завести отдельный форум под разработку понятийного аппарата или даже пойти куда-нибудь, где людей побольше. Если есть идеи, куда можно с такими темами зайти, то милости прошу высказывать.

А вот статья про это же в голанге, на мой взгляд, не худшая. https://golang-blog.blogspot.com/2019/0 ... olang.html

Re: Как перевести "code point" юникода?

Добавлено: 25.04.20 05:26
Лис [Вежливый]
Изображение = глиф.
https://ru.wikipedia.org/wiki/Глиф
(др.-греч. γλύφω «вырезаю; гравирую») — элемент письма, конкретное графическое представление графемы, иногда нескольких связанных графем — составной глиф, — или только части графемы, например — диакритический знак.

руны = письменность древних германцев, употреблявшаяся с I—II по XII век на территории современных Дании, Швеции и Норвегии, по X—XIII век — в Исландии и Гренландии, а в шведской провинции Даларна — вплоть до XIX века. ... Имеет связь с древнегерманским корнем run («тайна»).
https://ru.wikipedia.org/wiki/Руны

графема — единица текста
https://ru.wikipedia.org/wiki/Графема
(др.-греч. γράφω, «пишу» + суффикс «-ема») — минимальная единица письменности: в алфавитных системах письма — буква (или другое отражение фонемы), в неалфавитных системах письма — слоговой знак, иероглиф, идеограмма и другие[1]. Графема однозначно отличима от любой другой единицы этой же письменности; варианты одной и той же графемы называются аллографами (от греч. άλλος, «другой» и греч. γράφω, «пишу»).

https://ru.stackoverflow.com/questions/ ... -code-unit
code point - это примерно то же, что мы привыкли называть символом. Но не совсем. Например, буква «ё» может быть как одним codepoint'ом, так и двумя - буквой «е» и символом "две точки над предыдущей буквой"

Символ
https://ru.wikipedia.org/wiki/Символ
(др.-греч. σύμβολον — «совместное бросание», условный знак, сигнал) — неиконический знак, изображение , не имеющее видимого сходства с обозначаемым предметом.

Знак
https://ru.wikipedia.org/wiki/Знак
соглашение (явное или неявное) о приписывании чему-либо какого-либо определённого смысла, значения.
Буквы являются знаками звуков и, вместе со словами, являются знаками человеческого языка.
https://lexicography.online/etymology/з/знак
Общеславянское слово, образованное от глагола знати, имевшего смысл «отличить, выделить».
Древнерусское — знакъ. В древнерусском языке слово употребляется с XI в.
есть "знак препинания". А буква тогда знак чего? А цифра? А пробел?
Знак алфавита, знак числа, знак форматирования :)
Знак юникода.
почему бы не назвать руной?
Германопреклонение! Деды воевали.

Re: Как перевести "code point" юникода?

Добавлено: 25.04.20 14:20
БудДен
Не германопреклонение, а просто заимствование.
У тебя есть конкретное предложение или ты просто предлагаешь эн вариантов для дальнейшего сужения выбора?

Re: Как перевести "code point" юникода?

Добавлено: 25.04.20 23:46
Павиа
code point я бы переводил как юникод позиция

Re: Как перевести "code point" юникода?

Добавлено: 26.04.20 00:53
БудДен
Мне нужно очень короткое название для типа Char32, которое примерно равно кодовой позиции юникода, на русском языке. Желательно, не длиннее 4 букв.

Re: Как перевести "code point" юникода?

Добавлено: 26.04.20 01:41
Павиа
Номер для "code point"
Знак32 для Char32

Re: Как перевести "code point" юникода?

Добавлено: 03.05.20 13:02
БудДен
Ладно, будет Char = Знак , хотя так неметодично. Проверим хотя бы глагол:

https://тхаб.рф/wiki/Руководство_по_язы ... 0.AF.D0.94
- там "Знак".

В 1С называется "Символ" и там есть функция "код Символа", но это нам точно не годится. В Кумире - тоже символ.

А где моя табличка?

А вот она: https://docs.google.com/spreadsheets/d/ ... 1175422206

В Си обычно переводят как "Символ". Для Яра я взял "литера" - и ведь помню, что знак почему-то не подошёл.

Литера

Добавлено: 03.05.20 23:38
Лис [Вежливый]
https://kartaslov.ru/значение-слова/литера

Ли́тера (от лат. littera — буква):
Литера — другое название буквы, устаревшее.

https://en.wiktionary.org/wiki/litera#Noun

lītĕra , v. littera.
A Latin Dictionary. Founded on Andrews' edition of Freund's Latin dictionary. revised, enlarged, and in great part rewritten by. Charlton T. Lewis, Ph.D. and. Charles Short, LL.D. Oxford. Clarendon Press. 1879.

Типографская литера — брусок с рельефным изображением буквы для переноса на бумагу
https://ru.wikipedia.org/wiki/Типографская_литера

Re: Как перевести "code point" юникода?

Добавлено: 03.05.20 23:58
Лис [Вежливый]
https://www.nkj.ru/archive/articles/4175/
"Прежде славяне, когда были язычниками, не имели письмен, - говорится в Сказании черноризца Храбра "О письменах", - но [считали] и гадали с помощью черт и резов".
латиница (littera) - заимствование. Автохтоннее (исконнее) использовать сокращение "черт", от слов "черты и резы".

Черт32 ≈ Char32

(здесь ещё можно увидеть, как английское слово char является заимствованным из древнерусского)

В 21-м веке слово "черты" можно спутать со словами "чёрт" и "че́рти". Но это более позднее иностранное влияние.

к̶а̶р̶т̶и̶н̶к̶а̶ ̶п̶р̶о̶ ̶в̶л̶и̶я̶н̶и̶е̶

Re: Как перевести "code point" юникода?

Добавлено: 04.05.20 00:47
Лис [Вежливый]
https://www.nkj.ru/archive/articles/4175/
вторая Б - буки. Корень слова буки восходит к индоевропейскому, от которого происходит и название дерева "бук", и "book" - книга (по-английски), и русское слово "буква". (А может быть, в какие-то далекие времена дерево бука использовалось для нанесения "черт и резов" или, быть может, в дославянские времена была какая-то письменность со своими "буквами"?)
Бука32

Рез32. Тридцатидвухбитный рез. Вообще идеально, если бы не путаница с сокращением от слова "результат".

Re: Как перевести "code point" юникода?

Добавлено: 04.05.20 16:28
БудДен
Лис, убери это пожалуйста, а то забаню. Мне не нужны проблемы с законом. Я не имею времени разбираться, тянет ли эта картинка на разжигание религиозной розни или оскорбление чувств верующих - у меня другие задачи. Мне надо, чтобы мой форум не закрыли и он продолжал работать. У тебя время до 00:00 по Москве.

Re: Как перевести "code point" юникода?

Добавлено: 05.05.20 17:46
Лис [Вежливый]
Sigil (от лат. sigillum, что означает «печать»)
- an inscribed or painted symbol considered to have magical power.

Транскрипцией получаем слово "сигил".

Тестим:
https://ru.wikipedia.org/wiki/Сигил

Сигил или сигилла — символ (или комбинация нескольких конкретных символов или геометрических фигур), обладающий магической силой

Сигилы широко использовались магами, алхимиками и прочими «учёными средневековья» для вызова и управления духа или демона.

Картинка, способная оскорбить православных (ибо демонопоклонничество грешно):
Изображение