Мое меню

Анализ матрицы информационного графа

Как было показано выше объемы данных, вводимые в систему довольно велики, поэтому эффективная их организация на машинном уровне является актуальной. Анализ информации для получения исходных данных с целью построения или реконструкции созданного информационного фонда удобно проводить на рассмотренной графовой модели в рамках единого алгоритма анализа. Рекомендуется проанализировать следующие взаимосвязи:

- выявить число задач, в которых используется данный показатель. По этой информации рассчитывается коэффициент дублирования данных в случае организации отдельных массивов с исходными данными для каждой задачи;

- рассчитать матрицу совместной встречаемости пар показателей в задачах, элементы которой показывают число задач, в которых соответствующие показатели используются совместно. Такие показатели можно объединить и использовать в общем для них информационном массиве единого информационного фонда;

- определить число и перечень задач, в которых данный показатель встречается совместно с другими показателями, а также число и перечень показателей. Это позволит выявить группы показателей, которые используются только совместно и не используются порознь ни в одной задаче.

Процесс группировки показателей по задачам можно формализовать, вводя в рассмотрение коэффициент связи между группами. Коэффициент связи вычисляют по следующей формуле:

где: - число общих показателей для задачи с индексами и ; - число показателей, используемых в задаче с индексом ; - число показателей, используемых в задаче с индексом .

Группировка показателей заключается в следующем. Рассчитывают и заполняют матрицу связи групп исходных показателей задачи. Выбирают максимальный коэффициент связи и группы соответствующих ему показателей объединяют в единую группу P. Определяют коэффициент связи новой группы со всеми другими группами и объединяют с группой Р группу показателей, у которой коэффициент связи с ней максимален.

Группировкой можно управлять, задавая предельное значение коэффициента связи. Это приводит к изменению коэффициента дублирования показателей.

Окончательный выбор той или иной степени группировки определяют при разработке логической структуры единого информационного фонда системы.

В далее следующем примере приведены закодированные задачи и закодированные показатели на основе которых продемонстрирована методика расчета коэффициента связи между группами показателей.

Коэффициент связи групп показателей для задач и

К==0,67;

коэффициент связи групп показателей для задач и

К==1;

коэффициент связи групп показателей для задач и

К==0,67.

Схема матрицы, показывающей число задач, в которых используются соответствующие показатели

Задача

Задача

Задача

показатель

-

3

5

показатель

2

5

3

показатель

4

1

1

Перейти на страницу: 1 2 3