Как перевести "code point" юникода?

Научно-технические вопросы применения русского языка в программировании. Проекты с сайта программирование-по-русски.рф, кроме ЯОС . Информация об организациях и людях, использующих или изучающих русский язык в программировании. Сравнение операционных систем.
БудДен
Сообщения: 854
Зарегистрирован: 07.10.18 14:01

Как перевести "code point" юникода?

Сообщение БудДен » 25.04.20 00:33

Хочу, вслед за голангом, назвать его "руной". Тут останется терминологическая неясность, т.к. обходим вопрос о нормализации.
Но мы пока будем считать, что проблемы нормализации нет, и что есть однозначное соответствие между изображением и циферками, формирующими это изображение. Потому что в русском языке нет такой проблемы, как диакритические знаки. Может быть, есть знак ударения, но это уже не про буквы, а про вёрстку.

Соответственно:
  • буквой назвать нельзя, т.к. есть цифры, скобки и проч
  • называть кодовым пойнтом или как-то ещё - это нонсенс, т.к. это будет ещё тип данных, который будет очень часто встречаться и должен состоять из минимального количества букв
  • символом назвать нельзя, т.к. есть символ в смысле лиспа, и я не исключаю, что он ещё появится. Кроме того, символ - это 6 букв.
  • знаком назвать можно, но тоже наверняка возникнет неоднозначность. Например, есть "знак препинания". А буква тогда знак чего? А цифра? А пробел? Хотя это получается второй по приоритету вариант: руна мне нравится тем, что она ничем не занята, соответственно, вероятность неоднозначности снижается. И можно даже впихнуть в неё эту проблему с диакритикой.
  • соответственно, почему бы не назвать руной?
Ваши мнения? Видимо, придётся завести отдельный форум под разработку понятийного аппарата или даже пойти куда-нибудь, где людей побольше. Если есть идеи, куда можно с такими темами зайти, то милости прошу высказывать.

А вот статья про это же в голанге, на мой взгляд, не худшая. https://golang-blog.blogspot.com/2019/0 ... olang.html

Аватара пользователя
Лис [Вежливый]
Сообщения: 259
Зарегистрирован: 08.10.18 13:32

Re: Как перевести "code point" юникода?

Сообщение Лис [Вежливый] » 25.04.20 05:26

Изображение = глиф.
https://ru.wikipedia.org/wiki/Глиф
(др.-греч. γλύφω «вырезаю; гравирую») — элемент письма, конкретное графическое представление графемы, иногда нескольких связанных графем — составной глиф, — или только части графемы, например — диакритический знак.

руны = письменность древних германцев, употреблявшаяся с I—II по XII век на территории современных Дании, Швеции и Норвегии, по X—XIII век — в Исландии и Гренландии, а в шведской провинции Даларна — вплоть до XIX века. ... Имеет связь с древнегерманским корнем run («тайна»).
https://ru.wikipedia.org/wiki/Руны

графема — единица текста
https://ru.wikipedia.org/wiki/Графема
(др.-греч. γράφω, «пишу» + суффикс «-ема») — минимальная единица письменности: в алфавитных системах письма — буква (или другое отражение фонемы), в неалфавитных системах письма — слоговой знак, иероглиф, идеограмма и другие[1]. Графема однозначно отличима от любой другой единицы этой же письменности; варианты одной и той же графемы называются аллографами (от греч. άλλος, «другой» и греч. γράφω, «пишу»).

https://ru.stackoverflow.com/questions/ ... -code-unit
code point - это примерно то же, что мы привыкли называть символом. Но не совсем. Например, буква «ё» может быть как одним codepoint'ом, так и двумя - буквой «е» и символом "две точки над предыдущей буквой"

Символ
https://ru.wikipedia.org/wiki/Символ
(др.-греч. σύμβολον — «совместное бросание», условный знак, сигнал) — неиконический знак, изображение , не имеющее видимого сходства с обозначаемым предметом.

Знак
https://ru.wikipedia.org/wiki/Знак
соглашение (явное или неявное) о приписывании чему-либо какого-либо определённого смысла, значения.
Буквы являются знаками звуков и, вместе со словами, являются знаками человеческого языка.
https://lexicography.online/etymology/з/знак
Общеславянское слово, образованное от глагола знати, имевшего смысл «отличить, выделить».
Древнерусское — знакъ. В древнерусском языке слово употребляется с XI в.
есть "знак препинания". А буква тогда знак чего? А цифра? А пробел?
Знак алфавита, знак числа, знак форматирования :)
Знак юникода.
почему бы не назвать руной?
Германопреклонение! Деды воевали.

БудДен
Сообщения: 854
Зарегистрирован: 07.10.18 14:01

Re: Как перевести "code point" юникода?

Сообщение БудДен » 25.04.20 14:20

Не германопреклонение, а просто заимствование.
У тебя есть конкретное предложение или ты просто предлагаешь эн вариантов для дальнейшего сужения выбора?

Павиа
Сообщения: 64
Зарегистрирован: 23.05.19 21:28

Re: Как перевести "code point" юникода?

Сообщение Павиа » 25.04.20 23:46

code point я бы переводил как юникод позиция

БудДен
Сообщения: 854
Зарегистрирован: 07.10.18 14:01

Re: Как перевести "code point" юникода?

Сообщение БудДен » 26.04.20 00:53

Мне нужно очень короткое название для типа Char32, которое примерно равно кодовой позиции юникода, на русском языке. Желательно, не длиннее 4 букв.

Павиа
Сообщения: 64
Зарегистрирован: 23.05.19 21:28

Re: Как перевести "code point" юникода?

Сообщение Павиа » 26.04.20 01:41

Номер для "code point"
Знак32 для Char32

БудДен
Сообщения: 854
Зарегистрирован: 07.10.18 14:01

Re: Как перевести "code point" юникода?

Сообщение БудДен » 03.05.20 13:02

Ладно, будет Char = Знак , хотя так неметодично. Проверим хотя бы глагол:

https://тхаб.рф/wiki/Руководство_по_язы ... 0.AF.D0.94
- там "Знак".

В 1С называется "Символ" и там есть функция "код Символа", но это нам точно не годится. В Кумире - тоже символ.

А где моя табличка?

А вот она: https://docs.google.com/spreadsheets/d/ ... 1175422206

В Си обычно переводят как "Символ". Для Яра я взял "литера" - и ведь помню, что знак почему-то не подошёл.

Аватара пользователя
Лис [Вежливый]
Сообщения: 259
Зарегистрирован: 08.10.18 13:32

Литера

Сообщение Лис [Вежливый] » 03.05.20 23:38

https://kartaslov.ru/значение-слова/литера

Ли́тера (от лат. littera — буква):
Литера — другое название буквы, устаревшее.

https://en.wiktionary.org/wiki/litera#Noun

lītĕra , v. littera.
A Latin Dictionary. Founded on Andrews' edition of Freund's Latin dictionary. revised, enlarged, and in great part rewritten by. Charlton T. Lewis, Ph.D. and. Charles Short, LL.D. Oxford. Clarendon Press. 1879.

Типографская литера — брусок с рельефным изображением буквы для переноса на бумагу
https://ru.wikipedia.org/wiki/Типографская_литера

Аватара пользователя
Лис [Вежливый]
Сообщения: 259
Зарегистрирован: 08.10.18 13:32

Re: Как перевести "code point" юникода?

Сообщение Лис [Вежливый] » 03.05.20 23:58

https://www.nkj.ru/archive/articles/4175/
"Прежде славяне, когда были язычниками, не имели письмен, - говорится в Сказании черноризца Храбра "О письменах", - но [считали] и гадали с помощью черт и резов".
латиница (littera) - заимствование. Автохтоннее (исконнее) использовать сокращение "черт", от слов "черты и резы".

Черт32 ≈ Char32

(здесь ещё можно увидеть, как английское слово char является заимствованным из древнерусского)

В 21-м веке слово "черты" можно спутать со словами "чёрт" и "че́рти". Но это более позднее иностранное влияние.

к̶а̶р̶т̶и̶н̶к̶а̶ ̶п̶р̶о̶ ̶в̶л̶и̶я̶н̶и̶е̶
Последний раз редактировалось Лис [Вежливый] 04.05.20 21:07, всего редактировалось 1 раз.

Аватара пользователя
Лис [Вежливый]
Сообщения: 259
Зарегистрирован: 08.10.18 13:32

Re: Как перевести "code point" юникода?

Сообщение Лис [Вежливый] » 04.05.20 00:47

https://www.nkj.ru/archive/articles/4175/
вторая Б - буки. Корень слова буки восходит к индоевропейскому, от которого происходит и название дерева "бук", и "book" - книга (по-английски), и русское слово "буква". (А может быть, в какие-то далекие времена дерево бука использовалось для нанесения "черт и резов" или, быть может, в дославянские времена была какая-то письменность со своими "буквами"?)
Бука32

Рез32. Тридцатидвухбитный рез. Вообще идеально, если бы не путаница с сокращением от слова "результат".

Ответить