Графон на минималках, большие данные в большом университете - TheШаттл

Графон на минималках, большие данные в большом университете


Тренды
Графон на минималках, большие данные в большом университете

Студенческий центр анализа данных ДВФУ совместно с SocialDataHub провёл исследование страниц студентов в социальной сети «ВКонтакте». В рамках исследования Центр составил и проанализировал социальные графы школ университета. Объясняем, что происходит.

Графон на минималках,  большие данные в большом университете

Цифры управляют миром

 

Студенческий центр анализа данных ДВФУ совместно с SocialDataHub провёл исследование страниц студентов в социальной сети «ВКонтакте». В рамках исследования Центр составил и проанализировал социальные графы школ университета. Объясняем, что происходит. 

 

  • Навигация

«Родоначальником теории графов считается Леонард Эйлер. В 1736 году в одном из своих писем он формулирует и предлагает решение задачи о семи Кёнигсбергских мостах, ставшей впоследствии одной из классических задач теории графов. Термин«граф» впервые ввёл Сильвестр, Джеймс Джозеф в 1878 году в своей статье в Nature»

– Википедия

 

Как можно пройти по всем семи мостам Кёнигсберга, не проходя ни по одному из них дважды?

Что ещё за граф?

Граф — это совокупность объектов со связями между ними. Объекты представляются как вершины или узлы графа, а связи — как дуги, или рёбра. В нашем случае вершины – это студенты.

Графы в ДВФУ?

Студенческий центр анализа данных провёл исследование публичных страниц в социальной сети ВКонтакте , которые связаны непосредственно с ДВФУ.

Комментарий от Студенческого центра анализа данных:

Данные о социальных профилях студентов выкачивались с помощью скриптов на Python-е с использованием vk-api. После выкачивания данных нужно было сматчить профили вконтакте с общеуниверситетским списком студентов. В основном для этого использовалась информация об образовании в социальных профилях и наличие подписок на группы ДВФУ

Далее между найденными профилями были установлены связи. Связи мы рассматривали в двух вариантах и, соответственно, в статье будут представлены 2 вида графов для каждой школы. Первый – граф по взаимной дружбе между студентами школы. Второй – по реакции на контент (лайки) от студентов соответствующей школы. Данное разделение позволит проанализировать студенческий контингент по различным моделям поведения в социальных сетях. В случае графов по взаимной дружбе – модель поведения, направленная на расширение сети контактов, а в случае графов по лайкам – на получение реакции на контент личной страницы.

В таблице представлены данные по количеству профилей и связей, по которым построены графы:

Примечание от редакции:

Например, собранные данные были применены для рассылки приглашений на презентацию проекта интернет-журнала The Шаттл. Основная цель – получить максимальный медийный отклик при минимальном количестве участников.

Как читать графы?

Графы в данной статье построены с использованием алгоритма «Force Atlas». Алгоритм располагает узлы графа в двумерном пространстве так, чтобы все ребра были более или менее одинаковой длины, и чтобы было как можно меньше пересекающихся границ.

Ниже на картинках изображена группа студентов из 5 человек, на их примере мы объясним как читать граф.

  1. Точки на графе– являются узлами, то есть студентами. 
  2. Ребра между ними — взаимная дружба или реакция на контент (лайки). 

3. Размер узла зависит от количества исходящих из него рёбер. Чем больше узел графа, тем в большем количестве социальных связей в своей школе состоит студент. В исследовании мы называем таких студентов лидерами мнений. На каждом из графов школ мы указали топ-3 лидеров мнений.

Комментарий от Студенческого центра анализа данных:

в рамках данного исследования мы считаем лидером мнений студента, который имеет от 2% всех возможных социальных связей в рамках Школы.

 

4. Цвет узла отображает средний балл за последние две сессии. Данные взяты из подсчета среднего балла для заявок на Заселение-2018.

  • Красный цвет — средний балл от 0 до 3.9. 
  • Жёлтый цвет — средний балл от 4 до 4.9.
  • Зелёный цвет — 5 баллов.

Комментарий от Студенческого центра анализа данных:

На графы не попали студенты, которые не имеют друзей в VK, закрытые страницы, и те пользователи, которые ничего не лайкают.Также на графах нет первокурсников бакалавров и магистров — для них нет данных об успеваемости.

 

Инженерная школа

 

Инженерная школа, граф по друзьям, 1001 студент


 

Инженерная школа, граф по лайкам, 1012 студентов

 

Инженерная школа, сравнение графов, слева – граф по друзьям, справа – граф по лайкам


  • Здесь мы можем предположить, что среди студентов Инженерной школы, при относительно равном количестве хорошистов, троечники больше ориентированы на реакцию на контент, а отличники на расширение социальных связей. Следует отметить, что ИШ единственная школа, в рамках данной статьи, которая имеет большой перевес (10-15%) по группам успеваемости относительно графов по друзьям и по лайкам.
  • На обоих графах, в качестве лидеров мнений, выявлены разные люди, а значит Топ-3 лидеров мнений не пересекается. Можно предположить, что на данном этапе исследования в школе не выявлены лидеры мнений, которые одинаково успешно сочетают модели поведения по расширению социальных связей и реакции на контент.
  • Под цифрой 1 на изображении обозначено скопление зелёных узлов — это студенты направления «Горное дело» – самая мощная концентрация отличников в ИШ (35% от всех отличников студентов ИШ, попавших в выборку).
  • На графе под цифрами 2 заметно скопление лидеров мнения. Последующий анализ профилей показал, что большинство этих студентов являются членами таких студенческих организаций, как «Студенческий совет ИШ», Студенческий строительный отряд «Приморец».

 

Мы решили узнать как относятся студенты к тому, что они стали лидерами мнений.


Как ты думаешь почему ты стала лидером общественного мнения? 

—  Не считаю себя лидером общественного мнения, не пропагандирую какие-либо взгляды на этот мир или что-то в этом роде. Моя страница в соцсетях — это всего лишь немного обо мне и местах, в которых я бываю. Мне безумно нравится делиться с людьми теми эмоциями, которые я получаю от покорения той или иной вершины, посещения каких-либо мест, наделенных сильной энергетикой. То, что по результатам исследований я стала лидером мнения, для меня неожиданность. Видимо людям нравится наблюдать за моими передвижениями. Также скорее всего это связано с проведением общественных форумов, после которых добавляются (появляются) друзья и нарисовываются новые связи.

Екатерина Войтенко, студентка Инженерной школы


Как ты думаешь почему ты стал лидером общественного мнения?

 Мне сложно ответить на этот вопрос. С одной стороны, за 4,5 года моей студенческой жизни я успел побыть в нескольких организациях (одну из которых возглавлял), общался с действительно большим количеством людей, может для кого-то я и стал этим самым лидером.
Но, с другой стороны, я не часто публично выражаю свое мнение, поэтому однозначно назвать себя так мне сложно.

Александр Литвинец, студент Инженерной школы

Школа биомедицины


 

Школа биомедицины, граф по друзьям, 346 студентов

 

Школа биомедицины, граф по лайкам, 220 студентов

 

Школа биомедицины, сравнение графов, слева – граф по друзьям, справа – граф по лайкам


  • Областью под цифрами 1 обозначена группа магистров направления «Биотехнологии». Магистры расположились отдельно на обоих графах и находятся на окраине коммуникационной сети.
  • Под цифрами 2 находятся различные курсы направления «Фармация». Данные группы имеют слабую коммуникацию с остальными студентами Школы.
  • Скопление под цифрами 3 – студенты направления «Лечебное дело». Данная группа находится вблизи центра графа и является одним из коммуникационных центров школы.
  • Под цифрами 4 обозначены скопление студентов направления «Пищевая биотехнология».
  • Следует отметить, что в данной школе самый большой процент отличников.
  • Последующий анализ профилей показал, что основным коммуникационным центром школы является Студенческий совет ШБМ.


Считаешь ли себя лидером общественного мнения?

— Да, я считаю себя лидером общественного мнения. 

Как ты думаешь почему ты стал лидером общественного мнения?

— В первую очередь я стал им, потому что создаю в жизни самостоятельно условия, в которых хочу существовать. От меня не слышат недовольства в сторону университета, государства, мира в целом, но видят, что я делаю, делаю то, что мне по душе и получаю от этого удовольствие, при этом принося его и другим. Думаю, это главное. Кроме того, популярность в соцсетях играет свою роль. Староста курса, 2 года председатель студсовета ШМБ, руководитель клуба оперативной хирургии, старший Наставник и т.д.

Коньков Данил, студент Школы биомедицины

Юридическая школа


 

Юридическая школа, граф по друзьям, 375 студентов.

 

Юридическая школа, граф по лайкам, 227 студентов.

 

Юридическая школа, сравнение графов, слева – граф по друзьям, справа – граф по лайкам


  • Под цифрой 1 обозначены скопления студентов, которые учатся на втором курсе «Юриспруденции», под цифрой 2 – третий курс, под цифрой 3 – четвёртый курс. В рамках данного исследования Юридическая школа показала самую однородную коммуникационную структуру, которая сконцентрирована, как оказалось, вокруг формальных связей. Можно предположить, что коммуникационная политика школы не направлена на развитие сети неформальных связей.
  • Обособленная группа на графе под цифрой 4 — студенты магистры. В данной школе магистры также расположены отдельно и не входят в коммуникационную сеть школы.
  • Маленькая группа в центре графа под цифрой 5 – лидеры мнения Юридической школы. Данные студенты являются членами «Студенческого совета ЮШ».
  • При равном количестве отличников, хорошистов и троечников, на графе по лайкам большее количество социальных связей, а, соответственно, и больший размер вершин имеют представители группы троечников. Здесь можно предположить, что студенты, которые больше ориентированы на реакцию на контент менее успешны в учебе.


Считаешь ли ты себя лидером общественного мнения и почему?

Да, пожалуй, считаю. Почему я — потому что мое мнение ориентировано прежде всего на благо людей.

Светлана Бурцева, студентка Юридической школы


Как ты думаешь почему ты стал лидером общественного мнения?

Наверное потому что не стесняюсь высказывать своё мнение в обществе. Стараюсь активно участвовать в различных обсуждениях.

Тигран Восканян, студент Юридической школы


Как ты думаешь почему ты стала лидером общественного мнения?

— На самом деле, я сама не поняла, как стала стала лидером. Я обычная студентка – сижу в соцсетях, выкладываю фотографии, нахожусь в группах ДВФУ и читаю их ежедневно, лайкаю понравившиеся мне записи. В инстаграме часто просматриваю сториз с отметками университета, сама добавляю сториз с ДВФУ, снимаю видео в кампусе, которые выкладываю в ленту, стараюсь делать красивые фото в вузе, которые иногда репостят сами группу ДВФУ с отметкой меня. Если мне кто-нибудь напишет в вк или директ помочь с советом или каким-либо вопросом, отвечу. Также я люблю заходить на странички людей, с которыми хоть как-то пересекались в университете — просматривать профили, «лайкать» понравившиеся мне фотографии.

Александра Канунникова, студентка Юридической школы

Школы естественных наук


 

Школа естественных наук, граф по друзьям, 777 студентов

 

Школа естественных наук, граф по лайкам, 409 студентов

 

Школа естественных наук, сравнение графов, слева – граф по друзьям, справа – граф по лайкам


  1. На графе заметно четкое разделение по цветам: слева – скопление отличников, справа – троечников. По левую сторону от разделительной черты на графах расположены студенты естественнонаучных направлений, по правую – компьютерные и математические направления. Похоже, что математикам сложнее.
  2. На графе по лайкам отчетливо выделены вершины красного цвета. Здесь, как и в Юридической школе, можно предположить, что студенты, которые больше ориентированы на реакцию на контент менее успешны в учебе.
  3. Большое скопление под цифрой 1 – студенты второго курса «Прикладной математики и информатики».
  4. Скопление под цифрой 2 с большим количеством хорошистов – студенты 2-го курса «Математические методы защиты информации». Данная группа расположена на окраине коммуникационной сети.
  5. Скопление под цифрой 2 с большим количеством хорошистов – студенты 2-го курса «Математические методы защиты информации».
  6. На графе можно заметить небольшое скопление под цифрой 3 – это студенты направления «Технологии химических и нефтеперерабатывающих производств» 2-го курса. Данное направление расположено вдали от центра графа и слабо включено в коммуникационную сеть школы.
  7. Под цифрой 4 видно маленькое скопление отличников. Этому скоплению принадлежат студенты-магистры направления «Органическая, элементоорганическая и биоорганическая химия».
  8. Под цифрой 5 можно заметить скопление отличников. Это студенты 4-го курса «Охрана окружающей среды и рациональное использование природных ресурсов».


Считаешь ли ты себя лидером общественного мнения и почему?

— Сама я себя лидером мнения уж точно не считаю, но, возможно, это связано с тем, что я долгое время была активистом студсовета своей школы.

Возможно, из-за того, что долгое время являлась неким информатором студентов своей школы о событиях, которые проходят в ДВФУ, сообщала об измерениях в учебном процессе, если узнавала о них заранее, поэтому и к моему мнению теперь прислушиваются.

Ксения Гладкова, студентка Школы естественных наук

Школы экономики и менеджмента


 

Школа экономики и менеджмента, граф по друзьям, 1001 студент

 

Школа экономики и менеджмента, граф по лайкам, 721 студент

 

Школа экономики и менеджмента, сравнение графов, слева – граф по друзьям, справа – граф по лайкам


  1. В первую очередь следует отметить, что визуально количество троечников на графе по лайкам кажется большим, чем на графе по друзьям. Здесь, как и в предыдущих двух школах, заметно, что троечники больше ориентированы на реакцию на контент.
  2. Скопление отличников под цифрой 1 – это группа магистров направления «Международная экономика: инновационно-технологическое развитие». Магистры, как и в других школах, в коммуникационную сеть школы включены слабо.
  3. Большое скопление хорошистов под цифрой 2 – пятый курс «Экономической безопасности».
  4. Скопление отличников под цифрой 3 – студенты четвертого курса направления «Государственное и муниципальное управление». Одна из самых успешных академических групп Школы.
  5. Под цифрой 4 наблюдается скопление третьекурсников различных направлений с большим количеством социальных связей на обоих графах. Можно предположить, что подобная плотность социальных связей связана с тем, что, будучи на первом курсе, данные студенты были включены в проект «Основы проектной деятельности», который предполагает интенсивное межгрупповое взаимодействие.
  6. Под цифрой 5 можно увидеть скопление студентов 2-го курса направления «Экономика». Интересно, что на графе по друзьям они более включены в коммуникационную сеть, чем на графе по лайкам.


Считаешь ли ты себя лидером общественного мнения и почему?

—  Вряд ли меня можно назвать полноценным лидером общественного мнения: в моем Инстаграм никто не покупает рекламу, никто не зовет на открытие H&M. Даже скидки на жилье нет, хотя мой социальный рейтинг выше 4.6 (отсылка к т/с «Черное зеркало»). 

Если говорить про реальную жизнь, то я постоянно раздаю советы: «Почитай вот это, а на этот фильм не ходи». Не знаю, слушает ли меня хоть кто-то. 

Можно проверить на ваших читателях. Пусть гуманитарии прочитают «Конструкции или почему не ломаются вещи» Гордона Джеймса, а технари – «Откуда берутся деньги, Карл?» Елены Котовой. Хорошие книги вне профессиональной сферы знаний помогут расширить кругозор.

Если кто-то повелся на мою дешевую провокацию – пишите, обсудим.

На самом деле я примерно представляю, почему алгоритмы сделали меня ЛОМом. Последние 2.5 года я писал посты для разных групп ВК и пытался разобраться в алгоритмах этой социальной сети. 

Разнообразие контента, лайки и комментарии под постами от разных людей, стабильность выкладки. Все это влияет на выдачу моего поста в твоей умной ленте. А если друзей много и контент разнообразный, то пост увидит много людей. Так уж вышло, что я добавлялся в друзья ко всем людям, с кем хоть как-то контактировал. Накрутил друзей вот и стал лидером мнений. Если бы еще контент качественный выкладывал – цены бы мне не было.

Никита Тутыхин, студент Школы экономики и менеджмента

Школа региональных и международных исследований


 

Школа региональных и международных исследований, граф по друзьям, 767 студент

 

Школа региональных и международных исследований, граф по лайкам, 486 студент

 

Школа региональных и международных исследований, сравнение графов, слева – граф по друзьям, справа – граф по лайкам


  1. Скопление студентов под цифрой 1 — студенты-магистры направления «Филология». Магистры данного направления находятся вдали от центра, слабо включены в коммуникационную сеть и практически не связаны между собой.
  2. Большое скопление студентов под цифрой 2 — студенты различных курсов направления «Международные отношения». Стоит заметить, что их узлы имеют большой размер и это самый мощный коммуникацонный центр Школы. Большинство из данных студентов являются членами студенческой организации «Модель ООН на Дальнем востоке».
  3. Под цифрой 3 заметно небольшое скопление студентов 3-го курса направления «Преподавание русского языка и литературы».
  4. Большое скопление хорошистов под цифрой 4 – студенты 4-го курса направления «Международные отношения и внешняя политика».


Как ты думаешь почему ты стал лидером общественного мнения?

—  Очень сложно вообще что-либо о себе говорить. Постоянно стремлюсь к этому статусу и порой выходит так, что этот статус получаю.

Прежде всего хочу отметить то, что дало мне огромный толчок для развития – это Модель ООН на Дальнем Востоке. Организация действительно следует своему девизу «мы воодушевляем молодежь развивать себя и мир вокруг», что и отразилось на моей дальнейшей деятельности.

Также считаю, что причина лидерства в разносторонности деятельности. Одна из моих главных целей в жизни — пребывание в состоянии «человек-оркестр», когда ты можешь работать над несколькими абсолютно непохожими задачами. Для меня лидер общественного мнения — человек, к которому без опаски можно подойти и просто побеседовать. К этому я также стремлюсь, ведь общение в наше время есть двигатель любого прогресса.

Егор Климович, студент Школы региональных и международных исследований


Считаешь ли ты себя лидером общественного мнения и почему? 

—  Не считаю себя лидером общественного мнения. Моё мнение обычно не строится на чьих-то взглядах. Я просто стою за то, что считаю правильным.

Наверное, с моим мнением могут некоторые согласиться, но это лишь предположение.

Анастасия Врищ, студентка Школы региональных и международных исследований

Школы искусств и гуманитарных наук


 

Школа искусств и гуманитарных наук, граф по друзьям, 681 студент

 

Школа искусств и гуманитарных наук, граф по лайкам, 421 студент

 

Школа искусств и гуманитарных наук, сравнение графов, слева – граф по друзьям, справа – граф по лайкам


  1. Под цифрой 1 студенты 3-го курса направления «История России».
  2. Под цифрой 2 скопление студентов 2-го курса «Графический дизайн».
  3. Под цифрой 3 – студенты 3 курса направления «Реклама и связи с общественностью». Как можно заметить, некоторые из этих студентов имеют узлы больших размеров. Возможно это связано с тем, что многие из них состоят в Ассоциации российских и иностранных студентов.
  4. Под цифрой 4 заметно скопление студентов 4 курса направления «Психологическое консультирование и психодиагностика».
  5. Стоит заметить, что скопление под цифрами 4 и 5 находятся от центра графа дальше, чем остальные. Это можно объяснить тем, что эти скопления принадлежат к Школе педагогики и Школе искусств, культуры и спорта, которые недавно частично или полностью были включены в состав ШИГН. Дугой на графах отмечена коммуникационная граница данных событий.


Считаешь ли ты себя лидером общественного мнения? 

— Когда мне об этом сказали, я спросила: «А что это значит?» Кажется, я до сих пор не понимаю, что это такое.

Влада Дуглас, студентка Школы искусств и гуманитарных наук


Как ты думаешь почему ты стал лидером общественного мнения? 

— Лидер мнения? Звучит очень смешно) Я не думаю что я лидер общественного мнения, но это приятно если меня таковым считают. У меня есть парочка мыслишек:

  1. Я всегда знаю про все что происходит в мире и не только в кругу общения, но так же во всем мире.
  2. Часто я стараюсь убедить своего собеседника в том что моя информация правильна, так как часто читаю многие исследования и смотрю много документальных фильмов.

Илья Амельченя, студент Школы искусств и гуманитарных наук

Первые общие выводы

  1. Заметно влияние студенческих общественных организаций на сеть коммуникаций Школ. Существенно данный факт выражен на графе Школы региональных и международных исследований, где основным коммуникационным центром выступает студенческая организация «Модель ООН на Дальнем Востоке».
  2. В большинстве случаев магистры слабо включены в коммуникационную сеть Школ.
  3. На графах по лайкам ЮШ, ШЕН, ШЭМ более выражены вершины красного цвета, чем на графах по друзьям. Данный оптический эффект можно объяснить тем, что количество ребер, а соответственно и социальных связей, у красных вершин на графе по лайкам больше. Можно предположить, что троечники больше ориентированы на реакцию на контент.

Комментарий от Студенческого центра анализа данных:

Мы сначала решили, что на графах по лайкам просто больше троечников. Но когда мы проанализировали процентное соотношение по группам успеваемости оказалось, что во всех школах их относительно одинаковое количество. За исключением Инженерной школы, где обнаружен заметный перевес (10-15%) в сторону троечников на графе по лайкам

4. Для сравнения сети коммуникаций школ мы ввели понятие «Плотность связей». Плотность связей — это отношение количества ребер (друзья и реакция на контент) к количеству узлов (студентов). Чем выше плотность связей, тем выше уровень развития коммуникаций в школе.

По вертикали отложена плотность связи, а по горизонтали отмечены школы. Например, для ИШ плотность связи по друзьям 4.7, а по лайкам 3.7. Общая закономерность по плотности связей сохраняется, за исключением Школы экономики и менеджмента. В следующих публикациях мы попробуем выяснить почему.

Как итог, самая высокая плотность связей в Юридической школе и Школе экономики и менеджмента. Самая низкая – в Школе естественных наук.

5. В данном пункте мы попробуем сравнить количество «отличников», «хорошистов» и «троечников» в школах и попробуем подкинуть материала в древнейший спор: «кому сложнее учиться гуманитариям или технарям?»

На графике заметно, что практически все школы имеют общие тренды по успеваемости, за исключением Юридической школы, которая лидер по количеству троечников и практически не имеет отличников и Школы биомедицины, которая имеет обратную картину по успеваемости.

Самый низкий процент отличников в Юридической школе (8%), самый высокий в Школе биомедицины (43%), а в Школе экономики и менеджмента самый высокий процент хорошистов (51%).

 

Редакция The Шаттл благодарит за помощь в работе над статьей:

  • Александр Коломиец, Школа цифровой экономики
  • Артём Батраков, Школа цифровой экономики
  • Александра Жихарева, Школа цифровой экономики
  • Артур Хачуян, SocialDataHub
  • Дмитрий Перегон, Школа искусств и гуманитарных наук

theshuttle.ru logo https://theshuttle.ru/big-data-leaders/ 2019-04-17

Читайте также:

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: