• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Бейслайны трансферного обучения для анализа тональности русскоязычных текстов

Заказчики

Высшая школа бизнеса, Департамент бизнес-информатики НИУ ВШЭ​

Исполнитель

С.И. Сметанин, аспирантская школа по компьютерным наукам НИУ ВШЭ ​

Руководитель проекта

Комаров Михаил Михайлович​

Цель исследования

Определение бейслайнов трансферного обучения для анализа тональности русскоязычных текстов.​

Результат

Были выявлены наиболее часто используемые публичные наборы данных для анализа тональности на русском языке и наиболее актуальные языковые модели, которые официально поддерживают русский язык. Была произведена тонкая настройка языковых моделей (Multilingual BERT, RuBERT и Multilingual USE) получены высоки и в некоторых случаях лидирующие результаты классификации на семи наборах данных: SentRuEval-2016, SentiRuEval-2015, RuTweetCorp, RuSentiment, LINIS Crowd, Kaggle Russian News Dataset, а также RuReviews. Обученные модели были опубликованы в открытом доступе для исследовательского сообщества. ​

Публикации

  1. Smetanin S., Komarov M. Deep transfer learning baselines for sentiment analysis in Russian // Information Processing & Management, 2021 (Q1)
  2. Smetanin S., Komarov M. Share of Toxic Comments among Different Topics: The Case of Russian Social Networks // IEEE 23rd Conference on Business Informatics, 2021
  3. Smetanin S. Pulse of the Nation: Observable Subjective Well-Being in Russia Inferred from Social Network Odnoklassniki // Mathematics, 2022 (Q2)

Рисунки


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.