Авторитетность издания
ВАК - К1
RSCI, ядро РИНЦ
Добавить в закладки
Следующий номер на сайте
№4
Ожидается:
16 Декабря 2025
Инструментарий для определения лингво-статистической близости языков с использованием модели тюркской морфемы
Tools for determining a linguistic-statistical affinity of languages using the turkic morpheme model
Дата подачи статьи: 13.06.2017
УДК: 519.688
Статья опубликована в выпуске журнала № 1 за 2018 год. [ на стр. 172-176 ]Аннотация:В статье предлагаются новый подход и инструментарий для лингво-статистического сравнения близости тюркских языков с использованием модели тюркской морфемы. Модель тюркской морфемы является структурированным описанием тюркских морфем, которое состоит из свойств морфем и ситуаций их проявления на всех языковых уровнях (фонологическом, морфологическом, синтаксическом, семантическом). Инструментарий для определения лингво-статистической близости тюркских языков реализован в виде веб-ресурса, который обрабатывает информацию о языке, представленную в БД модели тюркской морфемы. Сравнение близости языков лингво-статистическими методами с использованием модели тюркской морфемы можно осуществлять для разных языковых уровней: морфологического, синтаксического, лексического. В данной работе описаны четыре метода для сравнения на морфологическом уровне: сравнение количества аффиксальных морфем, соответствующих грамматической категории, количества алломорфов, входящих в состав одной морфемы, слитности и раздельности написания морфемы, порядка следования аффиксальных морфем в словоформе. В настоящее время БД модели заполнена для татарского, казахского, крымскотатарского, турецкого, узбекского языков, что позволяет проводить попарное сравнение их лингво-статистической близости. Предложенный метод может быть использован при сравнении морфологий языков для получения информации о близости диалектов к литературному языку, а также о близости диалектов одного языка диалектам и литературному языку других языков. Эти методы и инструментарий применимы не только для тюркских, но и для любых близкородственных языков агглютинативного типа.
Abstract:The article proposes a new approach and tools for linguistic-statistical comparing of Turkic languages affinity using the Turkic morpheme model. This model is a structured description of Turkic morphemes, which consists of morpheme properties and their manifestation contexts at all language levels (phonological, morphological, syntactic and semantic) [3, 5]. The tools determining the linguistic-statistical affinity of Turkic languages is implemented as a web resource that processes information about the language represented in the morpheme model database. Comparing the affinity of languages by linguistic-statistical methods using the Turkic morpheme model can be made at different lan-guage levels: morphological, syntactic, lexical. The paper describes four following methods: comparing the number of affixational mor-phemes corresponding to a grammatical category; comparing the number of allomorphs in one morpheme; comparing the joined-up and separate writing of morphemes; comparing the order of affixational morphemes within the word form. Nowadays the model database is filled up for Tatar, Kazakh, Crimean Tatar, Turkish and Uzbek languages. It allows comparing linguistic-statistical affinity of the languages in pairs. The proposed method can be used to compare language morphologies to obtain information on the affinity of dialects to a literary lan-guage, as well as to detect the affinity of one language dialects to dialects and a literary language of other languages. Our methodology and tools can be used not only for Turkic languages, but for any closely related languages of the agglutinative type.
| Авторы: Альменова А.Б. (almen_akmaral-baijan@mail.ru) - Институт прикладной семиотики Академии наук Республики Татарстан (младший научный сотрудник), Казань, Россия, Аспирант | |
| Ключевые слова: бд, тюркская морфема, модель, тюркские языки, лингво-статистическое сравнение близости языков |
|
| Keywords: database, Turkic morpheme, mathematical model, turkic languages, linguistic-statistical comparison of languages |
|
| Количество просмотров: 11918 |
Статья в формате PDF Выпуск в формате PDF (29.74Мб) |
Инструментарий для определения лингво-статистической близости языков с использованием модели тюркской морфемы
DOI: 10.15827/0236-235X.121.172-176
Дата подачи статьи: 13.06.2017
УДК: 519.688
Статья опубликована в выпуске журнала № 1 за 2018 год. [ на стр. 172-176 ]
В статье предлагаются новый подход и инструментарий для лингво-статистического сравнения близости тюркских языков с использованием модели тюркской морфемы. Модель тюркской морфемы является структурированным описанием тюркских морфем, которое состоит из свойств морфем и ситуаций их проявления на всех языковых уровнях (фонологическом, морфологическом, синтаксическом, семантическом). Инструментарий для определения лингво-статистической близости тюркских языков реализован в виде веб-ресурса, который обрабатывает информацию о языке, представленную в БД модели тюркской морфемы.
Сравнение близости языков лингво-статистическими методами с использованием модели тюркской морфемы можно осуществлять для разных языковых уровней: морфологического, синтаксического, лексического. В данной работе описаны четыре метода для сравнения на морфологическом уровне: сравнение количества аффиксальных морфем, соответствующих грамматической категории, количества алломорфов, входящих в состав одной морфемы, слитности и раздельности написания морфемы, порядка следования аффиксальных морфем в словоформе.
В настоящее время БД модели заполнена для татарского, казахского, крымскотатарского, турецкого, узбекского языков, что позволяет проводить попарное сравнение их лингво-статистической близости.
Предложенный метод может быть использован при сравнении морфологий языков для получения информации о близости диалектов к литературному языку, а также о близости диалектов одного языка диалектам и литературному языку других языков. Эти методы и инструментарий применимы не только для тюркских, но и для любых близкородственных языков агглютинативного типа.
Альменова А.Б. (almen_akmaral-baijan@mail.ru) - Институт прикладной семиотики Академии наук Республики Татарстан (младший научный сотрудник), Казань, Россия, Аспирант
Ключевые слова: бд, тюркская морфема, модель, тюркские языки, лингво-статистическое сравнение близости языков
Ссылка скопирована!
| Постоянный адрес статьи: http://www.swsys.ru/index.php?page=article&id=4418 |
Версия для печати Выпуск в формате PDF (29.74Мб) |
| Статья опубликована в выпуске журнала № 1 за 2018 год. [ на стр. 172-176 ] |
Статья опубликована в выпуске журнала № 1 за 2018 год. [ на стр. 172-176 ]
Возможно, Вас заинтересуют следующие статьи схожих тематик:Возможно, Вас заинтересуют следующие статьи схожих тематик:
- Программное обеспечение для учета и хранения клинической и социодемографической информации о больных
- Унифицированное описание функционирования информационных радиоэлектронных систем для оценки программного обеспечения учебно-тренировочных средств
- Модель формирования адаптивной среды обучения и оценка ее эффективности
- Модель интерактивной обучающей системы
- Модель мультиагента прогнозирования автоматизированных систем управления
Назад, к списку статей


, где Cc – число общих для обоих языков грамматических категорий; C1 и C2 – количество грамматических категорий каждого из языков.
, где ai1 и ai2 – количество алломорфов i-й морфемы каждого из языков; n – число общих морфем сравниваемых языков.
, где Cdiff – число несовпадений слитности написания; Cс – число общих для обоих языков грамматических категорий.
, где Sc – число общих для обоих языков последовательностей грамматических категорий; S1 и S2 – количество последовательностей грамматических категорий каждого из языков.