Development of a computer system for generating semantic template of a group of documents by using latent semantic analysis

Вантажиться...
Ескіз

Дата

2016

Назва журналу

Номер ISSN

Назва тому

Видавець

Технологический центр, ЧП, Украинский государственный университет железнодорожного транспорта

Анотація

Засобами мови програмування Python розроблена ком- п'ютерна система (КС) для генерації семантичного шаблону групи документів методом латентне-семантичного аналізу (ЛСА). Система утримує вісім програмних модулів, кожний з яких виконує один етап ЛСА. Унікальними є модуль контр- олю частотної матриці слів-документів та модуль виміру семантичної відстані між документами шаблону. Адаптація КС до змісту та структури шаблону документів здійснюєть- ся зміною складу працюючих модулів. З використанням КС досліджено вплив на результати генерації шаблонів методом ЛСА таких факторів, як: нормалізація частотної матриці, виключення один раз вживаних слів, виключення докумен- тів, не пов’язаних зі спільними словами,обрання міри відліку семантичної відстані між документами

Опис

Автори Yuriy Taranenko, Maryna Kabanova Дата публікації 2016 Журнал Восточно-Европейский журнал передовых технологий Випуск 4 (2) Сторінки 35-41 Видавець Технологический центр, ЧП, Украинский государственный университет железнодорожного транспорта Опис Засобами мови програмування Python розроблена комп'ютерна система (КС) для генерації семантичного шаблону групи документів методом латентне-семантичного аналізу (ЛСА). Система утримує вісім програмних модулів, кожний з яких виконує один етап ЛСА. Унікальними є модуль контролю частотної матриці слів-документів та модуль виміру семантичної відстані між документами шаблону. Адаптація КС до змісту та структури шаблону документів здійснюється зміною складу працюючих модулів. З …

Ключові слова

Ключові слова: метод латентне-семантичного аналі- зу, комп’ютерна система, семантична відстань, семантич- ний шаблон, програмний модуль, засоби мови програмування Python

Бібліографічний опис