Анализ заголовков главных страниц сайтов мировых новостных агентств за период с 05.04.2022 по 05.05.2022 г.

Этой заметкой мы начинаем цикл публикаций об исследовании, инициированном Центром военно-политических исследований МГИМО МИД России.
 
Исследование проводится на площадке лаборатории электронно-вычислительной техники имени Павла Чеповского кафедры математики, эконометрики и информационных технологий МГИМО МИД России.
 
Цель: Анализ международных отношений на основе открытых источников с использованием методов математической статистики.
 
Сбор данных происходит с использованием оригинального робота, круглосуточно снимающего главные новости с главных страниц трех новостных агентств мирового уровня и агрегатора новостей Яндекса.
 
С сайтов, имеющих полный перевод на русский язык, берутся тексты сразу на русском, а с остальных копируются оригиналы и производится их машинный перевод.
 
На данный момент обрабатывается четыре источника:
 
    country     |             srcname             |            url
----------------+---------------------------------+----------------------------
 Россия         | Яндекс-новости                  | https://yandex.ru/news/
 Великобритания | Агентство Рейтер                | https://www.reuters.com/
 Китай          | Агентство Синьхуа               | http://russian.news.cn/
 Иран           | Иранское национальное агентство | http://ru.irna.ir/archive/
 
 
Общее количество собранных данных за период с 05.04.2022 по 05.05.2022 г., т.е. за 1 месяц, составило: 35 627 записей, 545 017 слов.
 
Количество новостей по странам, источникам, языкам:
 
    country     |             srcname             |     langname      |  num
----------------+---------------------------------+-------------------+-------
 Россия         | Яндекс-новости                  | русский           | 24403
 Великобритания | Агентство Рейтер                | английский        |  4941
 Великобритания | Агентство Рейтер                | русский (перевод) |  4874
 Китай          | Агентство Синьхуа               | русский           |   951
 Иран           | Иранское национальное агентство | русский           |   458
 
 
Среднесуточное количество новостей:
 
    country     |             srcname             |     langname      | avg
----------------+---------------------------------+-------------------+-----
 Россия         | Яндекс-новости                  | русский           | 787
 Великобритания | Агентство Рейтер                | английский        | 170
 Великобритания | Агентство Рейтер                | русский (перевод) | 168
 Китай          | Агентство Синьхуа               | русский           |  34
 Иран           | Иранское национальное агентство | русский           |  17
 
 
 
Слово «Украина» встречается всего 3 344 раз, по источникам:
 
    country     |             srcname             |     langname      | num
----------------+---------------------------------+-------------------+------
 Россия         | Яндекс-новости                  | русский           | 2761
 Великобритания | Агентство Рейтер                | русский (перевод) |  533
 Китай          | Агентство Синьхуа               | русский           |   45
 Иран           | Иранское национальное агентство | русский           |    5
 
 
Слово «Украина» встречается в среднем за сутки всего 111 раз, по источникам:
 
    country     |             srcname             |     langname      |  avg
----------------+---------------------------------+-------------------+-------
 Россия         | Яндекс-новости                  | русский           | 89.10
 Великобритания | Агентство Рейтер                | русский (перевод) | 18.38
 Китай          | Агентство Синьхуа               | русский           |  2.14
 Иран           | Иранское национальное агентство | русский           |  1.25
 
 
А.Немченко
 
  • Эксклюзив