Voyant Tools Михайлова София

Материал из Поле цифровой дидактики

Анализ статьи «Artificial Intelligence and Software Based Artificial Intelligence» с помощью Voyant Tools

Введение

Настоящая страница представляет собой результат цифрового анализа научной статьи «Artificial Intelligence and Software Based Artificial Intelligence» (автор: Askarov Elbek, Кокандский университет). Статья опубликована в журнале «Oriental Renaissance: Innovative, educational, natural and social sciences» (выпуск 2, №12, декабрь 2022). В работе рассматриваются понятие искусственного интеллекта (ИИ), его практическое применение (медицина, управление проектами, робототехника) и программное обеспечение на основе ИИ.

Для анализа текстовых характеристик документа использовалась веб-платформа Voyant Tools — инструмент корпусного анализа, позволяющий выявить частотность терминов, контексты употребления ключевых слов, а также получить общую статистику корпуса.

Анализируемый корпус

В качестве корпуса выступил полный текст статьи (объём — около 3500 слов). Язык текста — английский, присутствуют также аннотация и ключевые слова на русском языке.

Цели анализа

  • Выявить наиболее частотные термины, связанные с искусственным интеллектом.
  • Проанализировать распределение ключевых понятий по тексту.
  • Визуализировать связи между терминами (семантическая сеть).
  • Оценить общие статистические параметры корпуса (лексическая плотность, объём и т.д.).

Визуализация корпуса в Voyant Tools

1. Облако слов (Cirrus)

2. График трендов (Trends)

3. Семантическая сеть (TermsBerry)

4. Таблица терминов корпуса (CorpusTerms)

5. Сводная статистика корпуса (Summary)

6. Ленточные диаграммы (Bubblelines)

Выводы

Применение методов цифрового анализа текста (корпусной лингвистики и визуализации данных) позволяет глубже понять ключевые темы научной статьи. Ожидается, что анализ выявит:

  • Доминирование терминов, связанных с ИИ (artificial, intelligence, software, learning).
  • Наличие кластеров, связывающих robots с medicine, а algorithms с machine learning.
  • Высокую лексическую плотность, характерную для научно-технических текстов.

Интерактивные виджеты позволяют самостоятельно исследовать корпус: менять набор стоп-слов, искать коллокации, отслеживать распределение терминов.