Анализ тональности текста

Материал из Поле цифровой дидактики


Описание Ана́лиз тона́льности те́кста (сентимент-анализ, англ. Sentiment analysis, англ. Opinion mining) — класс методов контент-анализа в компьютерной лингвистике, предназначенный для автоматизированного выявления в текстах эмоционально окрашенной лексики и эмоциональной оценки авторов (мнений) по отношению к объектам, речь о которых идёт в тексте. Тональность — это эмоциональное отношение автора высказывания к некоторому объекту (объекту реального мира, событию, процессу или их свойствам/атрибутам), выраженное в тексте. Эмоциональная составляющая, выраженная на уровне лексемы или коммуникативного фрагмента, называется лексической тональностью (или лексическим сентиментом). Тональность всего текста в целом можно определить как функцию (в простейшем случае сумму) лексических тональностей составляющих его единиц (предложений) и правил их сочетания.
Область знаний Лингвистика
Авторы
Поясняющее видео
Близкие понятия
Среды и средства для освоения понятия CODAP, R, RAWGraphs

Основной целью анализа тональности является нахождение мнений в тексте и выявление их свойств. Какие именно свойства будут исследоваться, зависит уже от поставленной задачи. К примеру, целью анализа может быть автор, то есть лицо, которому принадлежит мнение.

Непосредственное мнение содержит высказывание автора об одном объекте. Формальное определение непосредственного мнения выглядит так: непосредственным мнением называется кортеж из пяти элементов (e, f, op, h, t), где:

  • (entity, feature) — объект тональности e (сущность, насчет которой высказывается автор) или его свойства f (атрибуты, части объекта) ;
  • orientation или polarity — тональная оценка (эмоциональная позиция автора относительно упомянутой темы);
  • holder — субъект тональности (автор, то есть кому принадлежит это мнение);
  • момент времени time, когда было оставлено мнение.