Как сравнить тексты: различия между версиями
Материал из Поле цифровой дидактики
Patarakin (обсуждение | вклад) |
Patarakin (обсуждение | вклад) Нет описания правки |
||
| Строка 41: | Строка 41: | ||
== Лингвистический анализ текста == | == Лингвистический анализ текста == | ||
* [[Как провести лингвистический анализ текста]] | * [[Как провести лингвистический анализ текста]] | ||
== Семантический анализ текста == | |||
* [[Как провести семантический анализ текста]] | |||
{{#ask: [[Как провести семантический анализ текста]] | ?Description }} | |||
Версия от 17:40, 10 декабря 2025
| Описание | Статья описывает методику комплексного сравнительного анализа текстовых корпусов. На примерестудентов историков и филологов с площадки Digida.mgpu.ru, с использованием инструментов R и Voyant Tools. |
|---|---|
| Область знаний | Лингвистика, Литература, Статистика |
| Область использования (ISTE) | |
| Возрастная категория | 16
|
| Поясняющее видео | |
| Близкие рецепту понятия | Статистика |
| Среды и средства для приготовления рецепта: | R, VOYANT Tools |
Введение
Корпус текстов студентов историков (45 статей из категории "Работы историков ИГН") и студентов филологов (49 статей из категории "Работы филологов ИГН") отражает различные подходы к работе с текстом, обусловленные спецификой дисциплин. Сравнительный анализ этих корпусов позволит выявить различия в стиле письма, лексико-семантических предпочтениях, структурировании информации и когнитивных стратегиях.
Теоретические основания
Сравнительный анализ основан на следующих принципах:
- Corpus linguistics — анализ больших текстовых совокупностей с использованием компьютерных методов
- Distant reading (Моретти) — макроскопический анализ корпуса как альтернатива микроанализу
- Stylometry — количественное изучение авторского стиля через лингвистические параметры
- Academic discourse analysis — выявление особенностей научного стиля различных дисциплин
Подготовка данных и сбор текстов
| Description | |
|---|---|
| Как извлечь данные из категории Digida | Мы хотим проанализировать тексты, которые хранятся в статья определенной категории поля цифровой дидактики. Есть 2 способа - экспорт статей и использование MediaWiki API |
| Description | |
|---|---|
| Как провести поверхностный анализ текста | Поверхностный анализ текста — это анализ легко измеримых, формальных характеристик текста, которые не требуют глубокого лингвистического анализа или интерпретации смысла. К ним относятся:
|
- Результат интерпретации
- средний объём статей между историками и филологами
- синтаксическую сложность (длину предложений)
- различия в средней длине слова (терминологичность текстов)
- Summary — общая статистика (Total Words, Unique Words, Average Word Length, Average Words per Sentence)
- Trends — сравнение распределения ключевых слов между историками и филологами
Лингвистический анализ текста
Семантический анализ текста
| Description | |
|---|---|
| Как провести семантический анализ текста |
|
