Мультимовний класифікатор змістового наповнення текстових документів
Вантажиться...
Дата
2024
Автори
Назва журналу
Номер ISSN
Назва тому
Видавець
УНІВЕРСИТЕТ ІМЕНІ АЛЬФРЕДА НОБЕЛЯ
Анотація
У кваліфікаційній роботі було досліджено докладний аналіз існуючих методів
машинного навчання та обробки природної мови (NLP) для вирішення задачі
класифікації текстів. Запропонований мультимовний класифікатор заснований на
глибокому навчанні та використовує сучасні нейронні архітектури, такі як
рекурентні нейронні мережі (RNN) та трансформери. Особлива увага приділяється
проблемі перекладу текстів різними мовами та представленню текстових даних у
мультимовних векторних просторах.
У результаті експериментальних досліджень проводиться оцінка
продуктивності розробленого класифікатора на багатомовних корпусах текстових
даних. Результати показують, що запропонований метод здатний ефективно
класифікувати тексти різними мовами і перевищує існуючі підходи у цій галузі.
Ця робота може бути корисною для фахівців у галузі обробки текстів та машинного
навчання, а також для розробників систем автоматичного оброблення інформації,
що працюють з мультимовними даними.
Ця робота може бути корисною для фахівців у галузі обробки текстів та
машинного навчання, а також для розробників систем автоматичного оброблення
інформації, що працюють з мультимовними даними.
Опис
Ключові слова
мультимовний класифікатор, текстові документи, обробка природної мови (NLP), PHP, автоматична обробка тексту