обработка словоформ

Научно-технические вопросы применения русского языка в программировании. Проекты с сайта программирование-по-русски.рф, кроме ЯОС . Информация об организациях и людях, использующих или изучающих русский язык в программировании. Сравнение операционных систем.
Ответить
БудДен
Сообщения: 2839
Зарегистрирован: 07.10.18 14:01

обработка словоформ

Сообщение БудДен » 01.04.21 11:03

соответствие порядка падежу
Уже писал, что если при этом не проверять соответствие падежа порядку, будет дыра для внедрения хитрых уязвимостей, когда мозг читает не то, что делается. Поэтому, если писать окончания, то их надо обрабатывать, а не просто отбрасывать.
И это тоже здорово было бы добавить в статью.
БудДен написал(а):
Чтобы сделать именно учёт падежей и их влияние на смысл кода, нужно менять язык программирования.
Менять вообще не обязательно, можно сделать поверх любого отдельным слоем. Просто они не дойдут до уровня какого-нибудь отладчика.
Этот отдельный слой всё равно будет другим ЯП, который нужно разработать.
1) "начинаем цикл" и "начало цикл" это одно и то же.

2) главное не перепутать строку "конец цикла",
которой завершается внутренний цикл,
со строкой "цикл конец",
которой завершается внешний цикл.

3) переменную "простое число" в первой версии можно писать с пробелом.

4) строка условия "если остаток то цикл обнулить" уже записана в одну строку,
а в первой версии можно писать лишь двумя строками.
Если записать одной строкой, то фокус не удастся (факир был пьян).

5) строки "число инкремент" и "инкремент число" выполняют одно и то же действие.
Тут почти всё порождает проблемы. По 1 - затрудняется поиск. П 2 - с учётом п 5 нелогично, п.3 - потенциально порождает проблемы конфликтов с ключевым словом "число", когда может возникнуть более одного смысла текста. П 5. Зачем эта гибкость, тем более, что это всё равно не является русским языком?

MihalNik
Сообщения: 244
Зарегистрирован: 05.11.18 11:02

Re: обработка словоформ

Сообщение MihalNik » 16.04.21 10:01

БудДен писал(а):как писать программы на русском языке красиво, с падежами, или обходя падежи
Это разные уровни и подходы.
БудДен писал(а):
01.04.21 11:03
Этот отдельный слой всё равно будет другим ЯП, который нужно разработать.
Как минимум 1 способ не разрабатывать ЯП - использовать сокращения.
БудДен писал(а):Из того, что я знаю - придумать значок для замены любых окончаний
Тут ничего придумать нельзя - и в русском языке это вопрос решенный, и в большинстве существующих ЯП из коробки хоть и по-другому, но тоже выбора нет. Только "_", т.е. длин_, ширин_, меньш_числ_ и т.п.
Будет выглядеть как упражнение по русскому языку. Строго говоря - оно им и является, так что в образование нужно подавать сразу как двух зайцев.
Из недостатков - в обычных ЯП полное название подсказываться не будет, даже если в комментарии добавлять - нужна поддержка в средах разработки. Но переходить к определениям они умеют, значит, примечаниями можно перебиться. Для простых и однозначных окончаний можно и без пояснений оставлять висячие "_".
БудДен писал(а):
01.04.21 11:03
Уже писал, что если при этом не проверять соответствие падежа порядку, будет дыра для внедрения хитрых уязвимостей, когда мозг читает не то, что делается. Поэтому, если писать окончания, то их надо обрабатывать, а не просто отбрасывать.
И это тоже здорово было бы добавить в статью.
Если типы двух параметров совпадают (или если вовсе нет типизации), то компилятор не отличит их перестановку, а не проверяемые окончания иногда можно будет выбрать так, что порядок прочитается как противоположный существующему. Т.е. возможно написать и
"присваивается(длина, ширине)" и "присваивается(длине, ширина)". В тоже время, если это обычный ЯП и множественность имен, то одно из этих выражений вводит в заблуждение.
Когда же использованы сокращения, вроде "присваивается(длин_, ширин_)", требуется явное понимание порядка следования в определении.

Аватара пользователя
Лис [Вежливый]
Сообщения: 561
Зарегистрирован: 08.10.18 13:32

Re: обработка словоформ

Сообщение Лис [Вежливый] » 16.04.21 12:44

Демотивирующая гипотеза:
никогда, никогда вы не сделаете обработку русского языка, если не будете опираться на разработки русских лингвистов, такие как модель «Смысл<->Текст» Мельчука, словари Апресянов и алгоритмы проповедуемые Рахлиной. Хитрых хаков (в виде ограничения на использование фиксированного падежа и требования использования только некоторых избранных конструкций предложения) недостаточно. Если бы было достаточно - это бы уже сделали.
Последний раз редактировалось Лис [Вежливый] 16.04.21 21:32, всего редактировалось 1 раз.

MihalNik
Сообщения: 244
Зарегистрирован: 05.11.18 11:02

Re: обработка словоформ

Сообщение MihalNik » 16.04.21 17:52

Лис [Вежливый] писал(а):
16.04.21 12:44
Хитрых хаков (в виде ограничения на использование фиксированного падежа и требования использования только некоторых избранных конструкций предложения) недостаточно. Если бы было достаточно - это бы уже сделали.
История говорит о другом. Что переписчики книг боролись с печатью. Что программирующие английским языком борются с программирующими русским. Потому что это барьер, защищающий их з/пл, только и всего.
Лис [Вежливый] писал(а):
16.04.21 12:44
Демотивирующая гипотеза:
никогда, никогда вы не сделаете обработку русского языка, если не будете опиратся на разработки русских лингвистов, такие как модель «Смысл<->Текст» Мельчука, словари Апресянов и алгоритмы проповедуемые Рахлиной.
Там, вероятно, другие задачи. Так что это демотивация разве что для самого Лиса. И любителей разбирать чужие переписки.
Последний раз редактировалось MihalNik 16.04.21 20:42, всего редактировалось 2 раза.

БудДен
Сообщения: 2839
Зарегистрирован: 07.10.18 14:01

Re: обработка словоформ

Сообщение БудДен » 16.04.21 20:26

Лис может написать в статье отдельный пункт про вот эти упомянутые вещи. МихалНик, Вы слишком уж лаконичны. Например, "это разные уровни и подходы" можно расписать на сколько-нибудь страниц. На самом деле такая статья будет полезна. Есть два гуманитария, один на очень громкой должности другой на просто громкой, которые хотят защищать РЯ в ИТ, но они ничего не понимают в ИТ. Надо строить мостик к ним. Через вот эти вот "исследования русских лингвистов" можно попробовать это сделать.

Лично я полностью убеждён, что без обработки словоформ на первом этапе можно обойтись, потому что это сложно, эта задача не решена даже для английского языка, и без её решения вполне можно перевести словарный запас на русский, а это по объёму больше, по сложности легче и по эффекту существеннее, чем обрабатывать словоформы.

Но нам нужно создать повестку дня, чтобы включить гуманитариев в наш процесс. Бросить пылинку для создания первого кристаллика в перенасыщенном растворе.

Кроме того, отсутствие обработки словоформ - это одна из тех вещей, которые эстетически отвращают людей от кода на 1С, значит, нужно это сглаживать.

Трудитесь, соратники, а я попробую попереводить объекты синтаксического дерева лисокомпилятора (удалось выкроить время и заставить себя этим заняться).

MihalNik
Сообщения: 244
Зарегистрирован: 05.11.18 11:02

Re: обработка словоформ

Сообщение MihalNik » 16.04.21 20:36

БудДен писал(а):
16.04.21 20:26
МихалНик, Вы слишком уж лаконичны. Например, "это разные уровни и подходы" можно расписать на сколько-нибудь страниц.
Можно, но на это нужно время и силы. Ответ на #1 был через день, записан через неделю, отправлен еще через одну...
А "из коробк_" все равно ничего кроме знак_ сокращен_ "_" в большинств_ ЯП работать не будет.
БудДен писал(а):
16.04.21 20:26
Кроме того, отсутствие обработки словоформ - это одна из тех вещей, которые эстетически отвращают людей от кода на 1С, значит, нужно это сглаживать.
Это только одно из пугал в 1С. Второе - собственно определения предметной области, спущенные законодательством сверху.
Последний раз редактировалось MihalNik 16.04.21 20:54, всего редактировалось 1 раз.

БудДен
Сообщения: 2839
Зарегистрирован: 07.10.18 14:01

Re: обработка словоформ

Сообщение БудДен » 16.04.21 20:53

Ну никто ж с палкой не гонит, хотя чем быстрее, тем скорее. Сейчас идёт какая-то грантовая кампания и не скажу кто приглашал в ней участвовать (могу кому-нибудь в личке написать). Но нужно сформировать тему из области "русский язык и нац.безопасность". Денег вряд ли дадут, если дадут, то мало и, скорее всего, не нам, но всё равно надо создать прецедент.

MihalNik
Сообщения: 244
Зарегистрирован: 05.11.18 11:02

Re: обработка словоформ

Сообщение MihalNik » 16.04.21 20:57

БудДен писал(а):
16.04.21 20:53
Сейчас идёт какая-то грантовая кампания и не скажу кто приглашал в ней участвовать (могу кому-нибудь в личке написать).
Мне русский язык удобен и без данных кампаний.
С одной стороны весь "вопрос" - несколько строчек в законодательстве.
С другой стороны - это само по себе еще ничего не меняет.

БудДен
Сообщения: 2839
Зарегистрирован: 07.10.18 14:01

Re: обработка словоформ

Сообщение БудДен » 16.04.21 21:14

Понял, я был неубедителен. Жаль.

MihalNik
Сообщения: 244
Зарегистрирован: 05.11.18 11:02

Re: обработка словоформ

Сообщение MihalNik » 16.04.21 21:27

БудДен писал(а):
16.04.21 21:14
Понял, я был неубедителен. Жаль.
Дело не в убедительности.
То что кратко изложил выше - при желании сможет развернуто показать любой.
Сразу же начать применять и дать другим посмотреть что получится.
Людям нужны образцы достаточно читаемых исходников, не ломающих мозг.

А вот лазать по декорациям, ища, не сделал ли кто в них по ошибке дверь во власть - странное занятие.
Последний раз редактировалось MihalNik 16.04.21 21:44, всего редактировалось 1 раз.

БудДен
Сообщения: 2839
Зарегистрирован: 07.10.18 14:01

Re: обработка словоформ

Сообщение БудДен » 16.04.21 21:28

У нас есть один сотрудник, который всерьёз утверждал, что переводить сигнатуры для стат. анализатора из одного формата в другой - это работа для секретарши. У хакеров есть такая проблема (это не моё мнение), что они считают всех такими же умными как и они сами. Не любой может, и не любой будет.

MihalNik
Сообщения: 244
Зарегистрирован: 05.11.18 11:02

Re: обработка словоформ

Сообщение MihalNik » 16.04.21 21:51

БудДен писал(а):
16.04.21 21:28
У нас есть один сотрудник, который всерьёз утверждал, что переводить сигнатуры для стат. анализатора из одного формата в другой - это работа для секретарши. У хакеров есть такая проблема (это не моё мнение), что они считают всех такими же умными как и они сами. Не любой может, и не любой будет.
Не любой, но в долгосрочном ожидании кто-то делает.
Я не говорю, что отказываюсь статью писать. Но только по одному сокращению нужна целая статья с примерами для разных ЯП.

БудДен
Сообщения: 2839
Зарегистрирован: 07.10.18 14:01

Re: обработка словоформ

Сообщение БудДен » 16.04.21 21:59

Да конечно нужна, это целое направление. Сделайте что можете, в любом случае будет хорошо. Возьмите любой аспект (их много на самом деле).

MihalNik
Сообщения: 244
Зарегистрирован: 05.11.18 11:02

Re: обработка словоформ

Сообщение MihalNik » 16.04.21 22:22

MihalNik писал(а):
16.04.21 21:51
Но только по одному сокращению нужна целая статья с примерами для разных ЯП.
Идем далее и видим, что в каждом ЯП свои ключевые слова, которые также надо перевести.
Плюс сделать их поддержку, если ее нет. Она есть в школьной сборке Оберона, ЯОС (можно объединить) и Алфоре.
Может где-то еще. В Сях есть #define. То есть по каждому языку требуется целая статья.

Ответить