Особенности решения задачи распознавания именованных сущностей на русском датасете
Аннотация
Дата поступления статьи: 13.07.2025В данной статье рассматриваются особенности реализации моделей для распознавания именованных сущностей. В ходе работы проведен ряд экспериментов как с традиционными моделями, так и с известными архитектурами нейронных сетей, гибридной моделью, рассматриваются особенности результатов, их сравнение и возможные объяснения. В частности, показано, что гибридная модель с добавлением двунаправленной долгой краткосрочной памяти может давать более качественные результаты, чем базовая двунаправленная модель представлений на основе трансформеров. Также показано, что улучшенная путем добавления прореживающего слоя для регуляризации, взвешенной функции потерь и линейного классификатора поверх выходов, двунаправленная модель представлений на основе трансформеров может давать высокие значения метрик. Для наглядности в работе приведены графики обучения моделей и таблицы с метриками для сравнения. В процессе работы сформированы выводы и рекомендации.
Ключевые слова: анализ текста, искусственный интеллект, распознавание именованных сущностей, нейронные сети, глубокое обучение, машинное обучение
.