На правах рекламы:
ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Авторитетность издания

ВАК - К1
RSCI, ядро РИНЦ

Добавить в закладки

Следующий номер на сайте

2
Ожидается:
16 Июня 2024

В Академии наук Республики Татарстан совместно с Казанским (Приволжским) федеральным университетом и компанией «ТемирТех» исследовались инструменты для разработки двуязычного русско-татарского тезауруса.

18.04.2018

В области компьютерной лингвистики и искусственного интеллекта существует множество задач, для решения которых активно используются электронные тезаурусы и онтологии. Это задачи информационного поиска и обработки естественного языка, среди которых расширение поискового запроса, автоматическая рубрикация документов, вычисление семантической близости, разрешение лексической многозначности, разрешение кореференции, суммаризация текста, вопросно-ответные системы. Электронные многоязычные тезаурусы используются также для кросс-языкового поиска и машинного перевода.

Электронные тезаурусы разработаны для многих языков мира, однако для татарского языка до сих пор такого тезауруса не существует. В связи с этим задача разработки тезауруса для татарского языка, а также двуязычного русско-татарского тезауруса весьма актуальна. Разработка подобного ресурса требует специализированных програм- мных средств, к которым предъявляются следующие требования:

- поддержка выбранного формализма представления тезаурусных знаний;

- поддержка многоязычных тезаурусов;

- поддержка коллективной работы;

- возможность публикации тезауруса в облаке Linking Open Data;

- кроссплатформенность;

- свободная лицензия.

Настоящая работа имеет две цели: провести развернутый обзор программных инструментов для разработки тезаурусов и представить новый программный инструмент, отвечающий всем заявленным выше требованиям (эта цель возникла из анализа результатов обзора).

Подробное описание дается в статье «Программная система для разработки многоязычного тезауруса», авторы: Кириллович А.В. (Академия наук Республики Татарстан, Казанский (Приволжский) федеральный университет, Казань), Баширов А.М. (Академия наук Республики Татарстан, Компания «ТемирТех», Казань), Гатиатуллин А.Р. (Академия наук Республики Татарстан, Казань).