<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE rdf:RDF[
	<!ENTITY rdf 'http://www.w3.org/1999/02/22-rdf-syntax-ns#'>
	<!ENTITY rdfs 'http://www.w3.org/2000/01/rdf-schema#'>
	<!ENTITY owl 'http://www.w3.org/2002/07/owl#'>
	<!ENTITY swivt 'http://semantic-mediawiki.org/swivt/1.0#'>
	<!ENTITY wiki 'digida.mgpu.ru'>
	<!ENTITY category 'digida.mgpu.ruCategory-3A'>
	<!ENTITY property 'digida.mgpu.ruProperty-3A'>
	<!ENTITY wikiurl 'http://digida.mgpu.ru/index.php/'>
]>

<rdf:RDF
	xmlns:rdf="&rdf;"
	xmlns:rdfs="&rdfs;"
	xmlns:owl ="&owl;"
	xmlns:swivt="&swivt;"
	xmlns:wiki="&wiki;"
	xmlns:category="&category;"
	xmlns:property="&property;">

	<owl:Ontology rdf:about="http://digida.mgpu.ru/index.php/Special:ExportRDF/.Инструментарий_для_текстового_анализа">
		<swivt:creationDate rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2026-04-07T09:16:08+03:00</swivt:creationDate>
		<owl:imports rdf:resource="http://semantic-mediawiki.org/swivt/1.0"/>
	</owl:Ontology>
	<swivt:Subject rdf:about="digida.mgpu.ru.Инструментарий_для_текстового_анализа">
		<rdf:type rdf:resource="digida.mgpu.ruCategory-3AПонятие"/>
		<rdfs:label>.Инструментарий для текстового анализа</rdfs:label>
		<rdfs:isDefinedBy rdf:resource="http://digida.mgpu.ru/index.php/Special:ExportRDF/.Инструментарий_для_текстового_анализа"/>
		<swivt:page rdf:resource="http://digida.mgpu.ru/index.php/.Инструментарий_для_текстового_анализа"/>
		<swivt:wikiNamespace rdf:datatype="http://www.w3.org/2001/XMLSchema#integer">0</swivt:wikiNamespace>
		<swivt:wikiPageContentLanguage rdf:datatype="http://www.w3.org/2001/XMLSchema#string">ru</swivt:wikiPageContentLanguage>
		<property:Description rdf:datatype="http://www.w3.org/2001/XMLSchema#string">'''Источник: база Digida'''
1) '''Общая логика''' (единый аналитический цикл)
Во всех трёх направлениях инструменты выстраиваются в цепочку: получение данных → предобработка → расчёты/модели → визуализация → интерпретация (разведочный/исследовательский анализ данных). 
Практически это означает: сначала выбирают формат данных (CSV/JSON, тексты корпусов), затем приводят данные к “чистому” виду, после чего применяют методы (частоты, метрики, модели) и подбирают визуальные формы для объяснения результата аудитории. 
2) '''Инструментарий текстового анализа''' (Text Mining)
Типовые задачи: частотный анализ, выделение ключевых слов, анализ тональности, тематическое моделирование, анализ стиля/психолингвистических маркеров. 
Этапы и методы (что поддерживают инструменты):
Предобработка текста: токенизация, стемминг, лемматизация, удаление стоп-слов, нормализация. 
Статистические представления: документно-терминная матрица, n-граммы; метрики значимости терминов (например, TF‑IDF). 
Анализ тональности: выявление эмоционально окрашенной лексики и оценок автора/мнений по отношению к объектам. 
Ключевые средства (по Digida):
VOYANT Tools (браузерный сервис) — быстрый визуальный анализ корпусов: облака слов, частотные графики, коллокации, KWIC (контексты употребления). 
Для представления результатов часто подключают инструменты визуализации (например, RAWGraphs) и строят графики/сети слов и тд, как мы делали на занятиях
3) '''Инструментарий сетевого анализа'''
Сетевой анализ — методология исследования связей между акторами (узлами): людьми, документами, понятиями, событиями и т.д. 
Базовые представления данных:
Граф (узлы + рёбра)
Матрица смежности как формальная запись структуры взаимодействий и основа для вычисления метрик. 
Основные метрики (что обычно считают):
число узлов/связей, плотность, центральности и др. — как показатели структуры и интенсивности взаимодействий. 
Ключевые средства (по Digida):
NetLogo как среды расчёта сетевых показателей и моделирования.
VOSviewer — построение и визуализация библиометрических сетей (соавторство, совместная встречаемость терминов, цитирования и т.п.).
Graphviz — автоматическая визуализация графов по текстовому описанию (язык DOT; утилита dot и др.), удобна для воспроизводимых схем и сетей.
VUE — среда “визуального понимания”, поддерживает импорт CSV и создание карт/схем, применяется как один из «макроскопов» для работы со сложностью. 4) Инструментарий визуальной аналитики
Назначение: выявлять закономерности, аномалии и структуры данных в режиме EDA и представлять выводы в понятной форме (графики, диаграммы, интерактивные панели). 
Ключевые средства (по Digida):
DataLens — инструмент визуализации (в Digida указан как близкий к Power BI / Tableau по назначению).</property:Description>
		<swivt:wikiPageModificationDate rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2026-01-22T18:01:35Z</swivt:wikiPageModificationDate>
		<property:Modification_date-23aux rdf:datatype="http://www.w3.org/2001/XMLSchema#double">2461063.2510995</property:Modification_date-23aux>
		<swivt:wikiPageSortKey rdf:datatype="http://www.w3.org/2001/XMLSchema#string">.Инструментарий для текстового анализа</swivt:wikiPageSortKey>
	</swivt:Subject>
	<owl:DatatypeProperty rdf:about="http://semantic-mediawiki.org/swivt/1.0#creationDate" />
	<owl:Class rdf:about="digida.mgpu.ruCategory-3AПонятие" />
	<owl:ObjectProperty rdf:about="http://semantic-mediawiki.org/swivt/1.0#page" />
	<owl:DatatypeProperty rdf:about="http://semantic-mediawiki.org/swivt/1.0#wikiNamespace" />
	<owl:DatatypeProperty rdf:about="http://semantic-mediawiki.org/swivt/1.0#wikiPageContentLanguage" />
	<owl:DatatypeProperty rdf:about="digida.mgpu.ruProperty-3ADescription" />
	<owl:DatatypeProperty rdf:about="http://semantic-mediawiki.org/swivt/1.0#wikiPageModificationDate" />
	<owl:DatatypeProperty rdf:about="digida.mgpu.ruProperty-3AModification_date-23aux" />
	<owl:DatatypeProperty rdf:about="http://semantic-mediawiki.org/swivt/1.0#wikiPageSortKey" />
	<!-- Created by Semantic MediaWiki, https://www.semantic-mediawiki.org/ -->
</rdf:RDF>