§ 3.2. СПЕЦИАЛЬНОЕ ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ СЕТЕВЫХ ИССЛЕДОВАНИЙ

В этом параграфе представлен краткий обзор и сравнительный анализ нескольких программных продуктов, специализирующихся на автоматизации исследовательских процедур, описанных в предыдущей главе. Начиная с 1970 года, когда увидела свет первая специализированная программа такого рода, было создано около сотни программ (Всего по данным Википедии, где ведется специальный список программ для сетевого анализа, насчитывается около 70 программных продуктов [Social network analysis software]. Они отличаются между собой довольно значительно по самым разным параметрам: функциональным возможностям, рабочей среде, удобству пользовательского интерфейса и т. п. Считается, что первая программа автоматического построения социограмм была создана в 1970 г., и она называлась SOCK [Прохоров, Ларичев]. С ее помощью была построена первая созданная автоматическим образом социограмма американских интеллектуальных кругов. В качестве исходных данных использовались тексты научно-публицистической периодики.

Далее, в 1978 г. увидела свет программа NEGOPY, которая использовалась для поиска связей в социальных группах. Она могла обрабатывать данные не более чем о тысяче членов и не более чем 20 тысяч связей. В 80-е годы программа использовалась в 100 ведущих университетах мира для научных исследований. Основными областями применения данной программы были поиск социальных связей в коллективах, выявление внутренних группировок (клик), а также сортировка узлов в ограниченный набор ролевых категорий [Там же]. В 1991 г. появилась известная программа STRUCTURE, которая получила широкое признание в эти годы. Она работала в среде DOS, не имела графического интерфейса и управлялась при помощи командной строки [Huisman, van Duijn].

На сегодняшний день существует большое разнообразие специальных программ для социального сетевого анализа. И это разнообразие продолжает усиливаться быстрыми темпами. Если 10 лет назад насчитывалось около 30 программных продуктов, то сегодня, как уже упоминалось, около 70 [Huisman, van Duijn, p. 270]. При этом, необходимо отметить, что на рынке современного программного обеспечения для традиционных социологических исследований уже сформировались лидеры, которые получили широкую известность. Мы имеем ввиду программы SPSS и STATISTICA [Боровиков, Ивченко; Бююль, Цефель; Наследов]. Вероятно, со временем и в результате конкурентной борьбы разнообразие рынка программного обеспечения для сетевых исследований также сократится. Однако сейчас мы имеем огромный выбор, где наряду с платными продуктами существуют вполне работоспособные бесплатные программы.

Именно поэтому мы посчитали важным представить сравнительный анализ некоторых, наиболее подходящих для политического прогнозирования программ в области сетевых исследований. В отечественной литературе практически отсутствуют издания, описывающая как пользоваться конкретными программами для сетевого анализа. В то время как за рубежом этой теме уделяется большое внимание [Computational Social Network Analysis; Handbook of Social Network Technologies and Applications; Knoke, Yang; Memon, Alhajj; Nooy, Mrvar, Batagelj]. Фактически существует всего две работы, проливающие свет на эту проблему [Нейронные сети; Прохоров, Ларичев]. Однако одна из них, «Нейронные сети. STATISTICA Neural Networks» посвящена исключительно одной программе и освещает тему исследований и прогнозов с использованием одного метода — метода нейронных сетей. Вторая работа, «Компьютерная визуализация социальных сетей» с одной стороны, весьма компактна, а с другой стороны, довольно сильно устарела. Так, например, сильно устарела классификация программ для сетевого анализа, предложенная авторами этой статьи. В частности, они предлагают делить все программы на две большие категории: для ручного рисования социограмм и для автоматической обработки и визуализации данных. На наш взгляд, такая классификация совершенно устарела, во-первых, в связи с повсеместным распространением офисных пакетов, в которые автоматически входят инструменты рисования алгоритмов и разного рода схем, а, во-вторых, в связи с тем, что программы для ручного рисования социограмм, собственно, не являются специализированным программным обеспечением для социального сетевого анализа. Они созданы в первую очередь для рисования организационных диаграмм и схем.

Очевидно, что требуется новая классификация, построенная на использовании комплексного подхода и учитывающая современные реалии. На наш взгляд, более правильной классификацей выступает деление программ, в первую очередь, по функциональным возможностям. В результате этого деления можно говорить о трех группах специализированных программ для социального сетевого анализа:

1. «Полного цикла» (включают обработку данных, элементы дескриптивной статистики, модуль визуализации и т. п.).

2. «Неполного цикла» (отсутствует 1-2 модуля от программ «полного цикла»).

3. «Узкой специализации» (созданные для решения специальной задачи).

Кроме того, можно с высокой степенью вероятности предсказывать внедрение модулей сетевого анализа в традиционные статистические пакеты. Собственно, уже сегодня программа STATISTICA включает модуль анализа нейронных сетей. Скорее всего, через некоторое время крупные компании, занимающиеся разработкой программного обеспечения, обратят внимание на эту нишу и разработают соответствующие приложения.

Для сравнительного анализа программного обеспечения в области сетевого анализа нами были выбраны несколько программ. Наш выбор был ограничен несколькими параметрами. Во-первых, наш обзор должен быть достаточно компактным. Во-вторых, мы предпочли сконцентрироваться на тех программах, которые созданы для работы под управлением операционной системы Windows, так как именно эта операционная система наиболее привычна российским пользователям. В-третьих, мы постарались выделить наиболее популярные программы, ориентируясь при этом на упоминания в специальной литературе. Также, к большому сожалению, из нашего обзора автоматически выпало несколько программ, распространяемых на условии платной лицензии и не имеющих демонстрационной версии. В результате отбора для сравнительного анализа было выбрано шесть программ (табл. 6).

 

Т а б л и ц а 6. Список программ социального сетевого анализа, выбранных для сравнения

Название

Краткая

характеристика

Условия распространения

CFinder

Выявление и анализ клик

Бесплатно для некоммерческого использования

NetMiner

Общий сетевой анализ с использованием графического интерфейса

Платно, 30-дневная демо-версия

Pajek

Визуализация больших сетей

Бесплатно для некоммерческого использования

STATISTICA

Статистический пакет с модулем нейронных сетей

Платно, 30-дневная демо-версия

StOCNET

Статистический анализ

Бесплатно для некоммерческого использования

UCINET и NetDraw

Продвинутый сетевой анализ

Платно, 60-дневная демо-версия

 

Среди множества критериев сравнительного анализа программного обеспечения для сетевого анализа, как мы уже упоминали выше во время описания проблемы классификации, следует в первую очередь выделить функциональные возможности этих программ. Однако, сами эти функциональные возможности в свою очередь также различаются. Так, самый первый функционал относится к введению и редактированию исходных данных. Во-вторых, надо рассмотреть аналитические возможности программ, которые базируются на осуществлении различных методов вычисления данных. Среди них выделяют три типа методов:

- Дескриптивные методы вычисления простых статистических данных сети (например, индекса плотности сети);

- Стандартные процедуры вычисления более сложных аналитических техник (кластерный анализ);

- Статистическое моделирование, основанное на стохастических моделях (к примеру — экспоненциальные модели случайных графов).

Далее, следует остановиться на возможностях визуализации результатов исследования. В последнее время большой интерес вызывают возможности трехмерной или 3D-визуализации сетей. И наконец немаловажное значение имеют дружественность интерфейса программы, наличие разного рода руководств, справочников, а также возможности получения технической поддержки.

Таким образом, дальнейшее сравнение будет базироваться на семи критериях:

    1. Данные;

    2. Дескриптивные методики;

    3. Стандартные процедуры;

    4. Статистическое моделирование;

    5. Визуализация;

    6. Интерфейс;

    7. Поддержка.

Мы решили начать наш обзор с программ UCINET и NetDraw, так как авторы этих программ - С. Боргатти, М. Эверетт и Л. Фриман - были одними из первых исследователей, кто начал разрабатывать специально программное обеспечение для сетевого анализа. Данное направление исследований получило широкую поддержку в Гарвардском университете, США. Программа была создана при поддержке данного университета. Они создали программный продукт, который до сих пор широко используется в научных исследованиях. При этом, Л. Фриман считается первооткрывателем ведущим специалистом в области промежуточной центральности [Freeman]. Мы также решили объединить эти две программы, так как они дополняют друг друга, а работа в NetDraw базируется на данных, полученных из UCINET. Фактически NetDraw выступает в качестве бесплатного и не требующего регистрации модуля к программе UCINET, которая в свою очередь бесплатна, но требует регистрации.

Минималистский дизайн программы UCINET вызван как достаточным количеством времени, прошедшим после ее появлением, так и задачей, которую ставили ее создатели — добиться большой производительности. И по сей день, на наш взгляд, этот модуль является одним из лучших среди имеющихся в наличии. В программе UCINET реализованы основные функции дескриптивной статистики, стандартных процедур, кластеризации и т. п. Визуализация сетей в программе UCINET отсутствует, однако она реализована при помощи специальной программы NetDraw. Такая особенность вызвана во многом тем, что UCINET обладает разнообразными возможностями импортирования и экспортирования данных. Что позволяет использовать ее с другими программами.

Надо отметить, что UCINET является одной из самых, если так можно выразиться, авторитетных программ в научных кругах. С ее помощью выполнено большое количество исследований. В частности - работа М. Лонкила «Интернет и антивоенный активизм в России» [Lonkila].

Программа Pajek (паук - на словенском языке) по уверению создателей создана для анализа очень больших сетей, количество вершин в которых насчитывает сотни тысяч и даже миллионы. Создатели программы начали свою работу в ноябре 1996 г. На сегодняшний день программа Pajek стала одной из самых упоминаемых среди ученых, практикующих сетевые методы исследований [Nooy, Mrvar, Batagelj]. Причина данного положения вещей заключается в том, что до появления этой программы большинство исследований вынужденно ограничивались несколькими десятками вершин. Так, например, программа UCINET может работать с сетью, состоящей максимум из 32767 вершин (фактически комфортная работа возможна не более чем с 5000. Однако сегодня наиболее важные социальные сети являются большими, то есть содержат более 100 тысяч вершин. Так, например, в социальной сети Facebook зарегистрировано несколько сотен миллионов участников. Для анализа больших сетей Pajek использует различные методики декомпозиции, которые позволяют упростить огромные массивы данных, выделяя в них наиболее крупные узлы и связи. При весьма простом интерфейсе, Pajek справляется с выполнением весьма сложных вычислений, которые требуют очень серьезной математической подготовки. При этом программа поддерживает импорт различных форматов данных. Интерфейс программы едва ли можно отнести к дружеским.

Программа NetMiner является одной из немногих платных программ, созданных специально для сетевого анализа. Возможно, именно поэтому ее отличают прекрасный пользовательский интерфейс. Большинство функций реализованы в этой программе на уровне интуитивно понятной последовательности действий. Редактор исходных данных, на наш взгляд, является наиболее приятным и удобным для использования. Визуализация в программе NetMinet реализована на самом высоком уровне, включая самые новейшие приемы 3D-моделирования. Особенно следует отметить возможность навигации по картам больших сетей. Большинство дескриптивных статистик и вычислительных процедур выполнены на отличном уровне, отличаются удобством и широкими возможностями формирования разнообразных отчетов, включающих в том числе графики и диаграммы. Также следует отметить, что в программе NetMiner на высоком уровне реализована задача поиска клик в социальных сетях.

STATISTICA Neural Networks являются «единственным в мире программным продуктом для проведения нейросетевых исследований, полностью переведенным на русский язык» [Нейронные сети, с. 3]. Несомненно, это два обстоятельство ставят данный программный продукт в особое положение. Поскольку статистический пакет STATISTICA достаточно известен, а его интерфейс однообразен для всех модулей, постольку мы остановимся на том, каковы особенности анализа данных и прогнозирования результатов с использованием модуля Neural Networks. Сам модуль следует установить отдельно, если он не поставляется в комплекте. И тут надо отметить, что данный продукт слабо подходит для анализа реальных социальных сетей. Речь идет об искусственных нейронных сетях, которые можно использовать для прогнозирования. При этом, сети могут носить, как линейный, так и вероятностный характер.

В отличие от всех остальных программ, представленных в обзоре, StOCNET не имеет модуля ввода и редактирования данных, а также визуализации. Ее основное предназначение связано с дополнительным статистическим обеспечением сетевого анализа в области. StOCNET предоставляет возможности статистического моделирования, основанного на стохастических моделях. Она содержит шесть разных статистических модулей. В частности, первая модель BLOCKS используется для построения стохастических алгоритмических моделей [Nowicki, Snijders]. Это делает программу StOCNET на сегодняшний день уникальной.

Программа CFinder является бесплатным программным продуктом для нахождения и визуализации пересекающихся плотных групп (клик) вершин в сетях. Данная программа работает на основе метода перколяции клик, разработанного венгерскими исследователями [Palla, Derényi, Farkas, Vicsek]. CFinder имеет настолько узкую специализацию, что не предлагает пользователям никаких способов редактирования матриц смежностей, дескриптивной статистики всей сети или статистического моделирование. Все в этой программе подчинено задаче нахождения и визуализации клик. Исследователю, имеющему в своем распоряжении матрицу смежностей, остается только импортировать данные и изучать полученные результаты. Визуализация результатов выполнена на приемлемом уровне.

Как справедливо замечают авторы главы о программном обеспечении для сетевого анализа в книге «Модели и методы в социальном сетевом анализе», «невозможно сделать полностью справедливого сравнения между программными продуктами потому, что их цели разные, что ведет к разной функциональности» [Huisman, van Duijn, p. 311]. Поэтому, видимо, нужно осуществлять выбор конкретной программы, ориентируясь на конкретные задачи исследования. Однако, на наш взгляд, можно выделить несколько очень важных моментов (табл. 7). Большая часть современных программ предлагают очень интересные средства визуализации данных, которые несомненно не только «украсят» исследование, но и сделают анализ данных более доступным для понимания.

 

Т а б л и ц а 7. Оценка программ, выбранных для анализа

Программа

Данные

Описательная статистика

Процедуры

Моделирование

Визуализация

Поддержка

Дружественность интерфейса

CFinder

+

+

+

+

+

+

+

NetMiner

++

++

++

++

+-

++

+-

Pajek

+

++

+

++

+

+

+-

STATISTICA

++

+-

+-

+-

+-

++

++

StOCINET

+-

0

+-

0

++

+

+

UCINET и NetDraw

++

+

++

++

+

+

+

Экспликация: «0» - функция отсутствует, «+» - функция присутствует минимально, «+ –» функция присутствует, но реализованной с некоторыми недостатками, «+ +» хорошо реализованная функция.

 

Во-вторых, большинство программ предлагают набор описательной статистики.

В-третьих, для большинства случаев, не требующих сверхсложных методов исследования, наиболее удобным вариантом выглядит программа NetMiner, самым большим недостатком которой является ее платность. Вместе с тем, данная программа может быть заменена 2-3 бесплатными, используя которые можно добиться хороших результатов.

В заключении следует особенно подчеркнуть, что к большому сожалению все программы (за исключением статистического пакета STATISTICA), представленные в обзоре, не имеют русскоязычного интерфейса. Это значит, что для того чтобы использовать предлагаемую технику исследования необходимо не только разбираться в теории и методологии сетевого анализа, но и иметь представление о том, как основные термины и процедуры переводятся на английский язык.