Бейслайны трансферного обучения для анализа тональности русскоязычных текстов
Заказчики
Высшая школа бизнеса, Департамент бизнес-информатики НИУ ВШЭИсполнитель
С.И. Сметанин, аспирантская школа по компьютерным наукам НИУ ВШЭ Руководитель проекта
Комаров Михаил МихайловичЦель исследования
Определение бейслайнов трансферного обучения для анализа тональности русскоязычных текстов.Результат
Были выявлены наиболее часто используемые публичные наборы данных для анализа тональности на русском языке и наиболее актуальные языковые модели, которые официально поддерживают русский язык. Была произведена тонкая настройка языковых моделей (Multilingual BERT, RuBERT и Multilingual USE) получены высоки и в некоторых случаях лидирующие результаты классификации на семи наборах данных: SentRuEval-2016, SentiRuEval-2015, RuTweetCorp, RuSentiment, LINIS Crowd, Kaggle Russian News Dataset, а также RuReviews. Обученные модели были опубликованы в открытом доступе для исследовательского сообщества. Публикации
- Smetanin S., Komarov M. Deep transfer learning baselines for sentiment analysis in Russian // Information Processing & Management, 2021 (Q1)
- Smetanin S., Komarov M. Share of Toxic Comments among Different Topics: The Case of Russian Social Networks // IEEE 23rd Conference on Business Informatics, 2021
- Smetanin S. Pulse of the Nation: Observable Subjective Well-Being in Russia Inferred from Social Network Odnoklassniki // Mathematics, 2022 (Q2)
Рисунки
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.