На правах рекламы:
ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Авторитетность издания

ВАК - К1
RSCI, ядро РИНЦ

Добавить в закладки

Следующий номер на сайте

2
Ожидается:
16 Июня 2024

В Тюменском государственном университете создан программный комплекс – интеллектуальная система автоматического определения категории потенциальных адресатов текста.

15.11.2016

Решение задач автоматической классификации текстов в последние годы стало одним из приоритетных направлений развития исследований в областях информационного поиска и искусственного интеллекта. Средства автоматической классификации текстов находят применение не только при отборе наиболее релевантных результатов поисковых запросов, но и при решении таких прикладных задач, как фильтрация спама, составление персональных подборок новостей, автоматическое аннотирование, снятие неоднозначности при автоматическом переводе, определение языка текста.

Задача классификации текстов подразделяется на две подзадачи: обучение классификатора и непосредственная классификация текстов. Наибольшую трудность при этом составляет первая подзадача, от успешности решения которой в итоге зависит достоверность проведенной классификации.

Для обучения классификатора прежде всего проводится построение модели текста – представление в виде набора признаков. Решение задачи поиска классификационных признаков зависит от тематики текстов и цели классификации. Выделению значимых классификационных признаков посвящены работы многих исследователей.

Подробное описание дается в статье «Интеллектуальная система автоматического определения категории потенциальных адресатов текста», автор Глазкова А.В. (Тюменский государственный университет, Тюмень).