Анализ тональности текста
Материал из Поле цифровой дидактики
| Описание | Ана́лиз тона́льности те́кста (сентимент-анализ, англ. Sentiment analysis, англ. Opinion mining) — класс методов контент-анализа в компьютерной лингвистике, предназначенный для автоматизированного выявления в текстах эмоционально окрашенной лексики и эмоциональной оценки авторов (мнений) по отношению к объектам, речь о которых идёт в тексте. Тональность — это эмоциональное отношение автора высказывания к некоторому объекту (объекту реального мира, событию, процессу или их свойствам/атрибутам), выраженное в тексте. Эмоциональная составляющая, выраженная на уровне лексемы или коммуникативного фрагмента, называется лексической тональностью (или лексическим сентиментом). Тональность всего текста в целом можно определить как функцию (в простейшем случае сумму) лексических тональностей составляющих его единиц (предложений) и правил их сочетания. |
|---|---|
| Область знаний | Лингвистика |
| Авторы | |
| Поясняющее видео | |
| Близкие понятия | |
| Среды и средства для освоения понятия | CODAP, R, RAWGraphs |
Основной целью анализа тональности является нахождение мнений в тексте и выявление их свойств. Какие именно свойства будут исследоваться, зависит уже от поставленной задачи. К примеру, целью анализа может быть автор, то есть лицо, которому принадлежит мнение.
Непосредственное мнение содержит высказывание автора об одном объекте. Формальное определение непосредственного мнения выглядит так: непосредственным мнением называется кортеж из пяти элементов (e, f, op, h, t), где:
- (entity, feature) — объект тональности e (сущность, насчет которой высказывается автор) или его свойства f (атрибуты, части объекта) ;
- orientation или polarity — тональная оценка (эмоциональная позиция автора относительно упомянутой темы);
- holder — субъект тональности (автор, то есть кому принадлежит это мнение);
- момент времени time, когда было оставлено мнение.
