Как было показано выше объемы данных, вводимые в систему довольно велики, поэтому эффективная их организация на машинном уровне является актуальной. Анализ информации для получения исходных данных с целью построения или реконструкции созданного информационного фонда удобно проводить на рассмотренной графовой модели в рамках единого алгоритма анализа. Рекомендуется проанализировать следующие взаимосвязи:
- выявить число задач, в которых используется данный показатель. По этой информации рассчитывается коэффициент дублирования данных в случае организации отдельных массивов с исходными данными для каждой задачи;
- рассчитать матрицу совместной встречаемости пар показателей в задачах, элементы которой показывают число задач, в которых соответствующие показатели используются совместно. Такие показатели можно объединить и использовать в общем для них информационном массиве единого информационного фонда;
- определить число и перечень задач, в которых данный показатель встречается совместно с другими показателями, а также число и перечень показателей. Это позволит выявить группы показателей, которые используются только совместно и не используются порознь ни в одной задаче.
Процесс группировки показателей по задачам можно формализовать, вводя в рассмотрение коэффициент связи между группами. Коэффициент связи вычисляют по следующей формуле:
где: - число общих показателей для задачи с индексами и ; - число показателей, используемых в задаче с индексом ; - число показателей, используемых в задаче с индексом .
Группировка показателей заключается в следующем. Рассчитывают и заполняют матрицу связи групп исходных показателей задачи. Выбирают максимальный коэффициент связи и группы соответствующих ему показателей объединяют в единую группу P. Определяют коэффициент связи новой группы со всеми другими группами и объединяют с группой Р группу показателей, у которой коэффициент связи с ней максимален.
Группировкой можно управлять, задавая предельное значение коэффициента связи. Это приводит к изменению коэффициента дублирования показателей.
Окончательный выбор той или иной степени группировки определяют при разработке логической структуры единого информационного фонда системы.
В далее следующем примере приведены закодированные задачи и закодированные показатели на основе которых продемонстрирована методика расчета коэффициента связи между группами показателей.
Коэффициент связи групп показателей для задач и
К==0,67;
коэффициент связи групп показателей для задач и
К==1;
коэффициент связи групп показателей для задач и
К==0,67.
Схема матрицы, показывающей число задач, в которых используются соответствующие показатели
Задача
|
Задача
|
Задача
| |
показатель |
- |
3 |
5 |
показатель |
2 |
5 |
3 |
показатель |
4 |
1 |
1 |