Иерархическая система классификации
Иерархическая система классификации (рис. 2.3) строится следующим образом: § исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень; § каждый класс 1-го уровня в соответствии со своим, характерным для него классификационным признаком делится на подклассы, которые образуют 2-й уровень; § каждый класс 2-го уровня аналогично делится на группы, которые образуют 3-й уровень, и т.д.
Учитывая достаточно жесткую процедуру построения структуры классификации, необходимо перед началом работы определить ее цель, т.е. какими свойствами должны обладать объединяемые в классы объекты. Эти свойства принимаются в дальнейшем за признаки классификации. Запомните! В иерархической системе классификации из-за жесткой структуры особое внимание следует уделить выбору классификационных признаков.
В иерархической системе классификации каждый объект на любом уровне должен быть отнесен к одному классу, который характеризуется конкретным значением выбранного классификационного признака. Для последующей группировки в каждом новом классе необходимо задать свои классификационные признаки и их значения. Таким образом, выбор классификационных признаков будет зависеть от семантического содержания того класса, для которого необходима группировка на последующем уровне иерархии. Количество уровней классификации, соответствующее числу признаков, выбранных в качестве основания деления, характеризует глубину классификации. Достоинства иерархической системы классификации: § простота построения; § использование независимых классификационных признаков в различных ветвях иерархической структуры. Недостатки иерархической системы классификации: § жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки; § невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков. Пример 2.10. Поставлена задача – создать иерархическую систему классификации для информационного объекта " Факультет", которая позволит классифицировать информацию обо всех студентах по следующим классификационным признакам: факультет, на котором он учится, возрастной состав студентов, пол студента, для женщин – наличие детей. Система классификации представлена на рис.2.4 и будет иметь следующие уровни: 0-й уровень. Информационный объект " Факультет"; 1-й уровень. Выбирается классификационный признак – название факультета, что позволяет выделить несколько классов с разными названиями факультетов, в которых хранится информация обо всех студентах. 2-й уровень. Выбирается классификационный признак – возраст, который имеет три градации: до 20 лет, от 20 до 30 лет, свыше 30 лет. По каждому факультету выделяются три возрастных подкласса студентов. 3-й уровень. Выбирается классификационный признак – пол. Каждый подкласс 2-го уровня разбивается на две группы. Таким образом, информация о студентах каждого факультета в каждом возрастном подклассе разделяется на две группы – мужчин и женщин. 4-й уровень. Выбирается классификационный признак – наличие детей у женщин: есть, нет. Созданная иерархическая система классификации имеет глубину классификации, равную четырем.
Рис. 2.4. Пример иерархической системы классификации для информационного объекта " Факультет"
Фасетная система классификации Фасетная система классификации в отличие от иерархической позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами (facet – рамка). Каждый фасет (Фi) содержит совокупность однородных значений данного классификационного признака. Причем значения в фасете могут располагаться в произвольном порядке, хотя предпочтительнее их упорядочение. Пример 2.11. Фасет цвет содержит значения: красный, белый, зеленый, черный, желтый. Фасет специальность содержит названия специальностей. Фасет образование содержит значения: среднее, среднее специальное, высшее.
Схема построения фасетной системы классификации в виде таблицы отображена на рис. 2.5. Названия столбцов соответствуют выделенным классификационным признакам (фасетам), обозначенным Ф1, Ф2,..., Фi,..., Фn. Например, цвет, размер одежды, вес и т.д. Произведена нумерация строк таблицы. В каждой клетке таблицы хранится конкретное значение фасета. Например, фасет цвет, обозначенный Ф2, содержит значения: красный, белый, зеленый, черный, желтый.
Рис. 2.5. Фасетная система классификации
Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты. Для каждого объекта задается конкретная группировка фасетов структурной формулой, в которой отражается их порядок следования:
где Фi – i -й фасет; п – количество фасетов.
При построении фасетной системы классификации необходимо, чтобы значения, используемые в различных фасетах, не повторялись. Фасетную систему легко можно модифицировать, внося изменения в конкретные значения любого фасета. Достоинства фасетной системы классификации: § возможность создания большой емкости классификации, т.е. использования большого числа признаков классификации и их значений для создания группировок; § возможность простой модификации всей системы классификации без изменения структуры существующих группировок. Недостатком фасетной системы классификации является сложность ее построения, так как необходимо учитывать все многообразие классификационных признаков. Пример 2.12. Обратитесь к содержанию примера 2.10, где показано построение иерархической системы классификации. Для сопоставления разработаем фасетную систему классификации. Сгруппируем и представим в виде таблицы (рис. 2.6) все классификационные признаки по фасетам: § фасет название факультета с пятью названиями факультетов; § фасет возраст с тремя возрастными группами; § фасет пол с двумя градациями; § фасет дети с двумя градациями. Структурную формулу любого класса можно представить в виде: Ks = (Факультет, Возраст, Пол, Дети) Присваивая конкретные значения каждому фасету, получим следующие классы: § К1 = (Радиотехнический факультет, возраст до 20 лет, мужчина, есть дети); § К2 = (Коммерческий факультет, возраст от 20 до 30 лет, мужчина, детей нет); § К3 = (Математический факультет, возраст до 20 лет, женщина, детей нет) и т.д.
Рис. 2.6. Пример фасетной системы классификации для информационного объекта " Факультет"
|