Всё для Учёбы — студенческий файлообменник
1 монета
ppt

Студенческий документ № 000108 из ДГТУ (бывш. РИСХМ)

Информатика и информационно-коммуникационные

технологии

Сафарьян Ольга Александровна

Лекция 5 ОСНОВЫ КЛАССИФИКАЦИИ, СТРУКТУРИРОВАНИЯ

И КОДИРОВАНИЯ ИНФОРМАЦИИ

* Структура информации в информационных системах

* Основы классификации информации

* Контрольные вопросы

Структура информации в информационных системах

* Информационные совокупности состоят из элементарных логически неделимых элементов информации - реквизитов. Каждый реквизит описывает определённое свойство отображаемой сущности (объекта, процесса, явления). Реквизиты по своему содержанию подразделяются на реквизиты-основания и реквизиты-признаки.

* Реквизиты-основания дают количественное описание сущности, выраженное в определённых единицах измерения и представленное числовыми данными (например, вес, стоимость, количество экземпляров). Их значениями могут быть только числа. При обработке над ними выполняются арифметические операции.

* Реквизиты-признаки характеризуют качественные свойства сущности. К ним относятся фамилии, наименования изделий, материалов и т.д. Реквизиты-признаки выражаются буквенно-цифровыми значениями, они служат для логической обработки информации, т.е. для поиска, сортировки, группировки, выборки.

Структура информации в информационных системах

Каждый реквизит имеет конечное множество

конкретных значений на конкретном отрезке

времени. Перечень возможных значений реквизита

составляет его номенклатуру.

Показатель - логическое высказывание,

содержащее качественную и количественную

характеристику отображаемой сущности.

Эта элементарная информационная совокупность

уже имеет определённый смысл и состоит, как

правило, из одного реквизита-основания и

нескольких реквизитов-признаков.

Структура информации в информационных системах

Группы взаимосвязанных показателей образуют следующую

информационную совокупность - документ.

В этом случае показатель может рассматриваться с точек

зрения формы и содержания. Под формой элементов

показателя понимается структура граф и строк табличного

документа, а под содержанием - конкретные значения,

проставляемые в этих строках и графах. В свою очередь,

совокупность однородных документов, объединённых по

определённому признаку, образует информационную

совокупность - массив. Несколько массивов (они могут быть

разнородными), относящихся к определённому объекту,

образуют информационную систему. Структура исходных

данных определяющим образом влияет на организацию

информационных массивов и скорость их обработки.

Основы классификации информации

Классификация - особый вид логической операции,

заключающейся в распределении элементов

рассматриваемого множества по подмножествам (делении на

классы) в соответствии с определённым признаком (группой

признаков). Совокупность правил на основе взаимосвязанных

признаков, в соответствии с которыми производится

упорядоченное расположение классифицируемых элементов,

составляет систему классификации.

Признаком классификации называется реквизит (свойство

объекта, характеристика, значение), позволяющий установить

сходство или различие с другими объектами классификации.

Классификатор - систематизированный свод наименований

и кодов классификационных группировок.

Основы классификации информации

Системы классификации характеризуются гибкостью,

ёмкостью и степенью заполненности.

Гибкостью системы классификации называют свойство

системы классификации допускать включение новых

классификационных группировок без разрушения

существующей структуры классификатора.

Ёмкостью системы классификации называют наибольшее

возможное количество группировок в данной системе

классификации.

Степень заполненности (коэффициент заполненности)

системы классификации определяется отношением

фактического количества используемых классификационных

группировок к ёмкости.

Основы классификации информации

Логическим продолжением классификации является

кластеризация, которую можно рассматривать как

автоматическую классификацию

К системам классификации предъявляются следующие

требования:

* полнота охвата объектов рассматриваемой области;

* однозначность реквизитов;

* возможность включения новых объектов.

На основе различных методов применения

классификационных признаков строятся иерархическая,

фасетная и дескрипторная системы классификации.

Иерархическая система классификации

Под иерархией понимается расположение элементов

множества или частей целого в порядке подчинённости от

высшего уровня к низшему. В иерархической системе

классификации устанавливается такое отношение

соподчинения между классификационными признаками, при

котором каждое множество высшего порядка содержит

непересекающиеся между собой подмножества низшего

порядка.

Иерархическая система классификации строится путём

последовательного деления исходного множества

элементов, составляющего нулевой уровень, на классы

(подмножества первого уровня), каждый из которых может

делиться на подклассы (подмножества второго уровня),

подклассы - на группы (подмножества третьего уровня),

группы - на подгруппы (подмножества четвёртого уровня) и

т.д. Иерархическая система классификации

Достоинства иерархической системы

классификации:

* наглядность, простота и логичность построения;

* использование независимых классификационных признаков в различных ветвях иерархической структуры.

Недостатки иерархической системы классификации:

* сложность внесения в структуру изменений, связанная с перераспределением объектов по классификационным группировкам;

* невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.

Фасетная классификация

Фасетная система классификации, в отличие от

иерархической, позволяет выбирать признаки

классификации независимо как друг от друга (без

соподчинения), так и от семантического содержания

классифицируемого объекта. Признаки классификации

называются фасетами (facet - рамка). Каждый фасет

содержит совокупность однородных значений данного

классификационного признака. Причём значения в фасете

могут перечисляться произвольно, хотя предпочтительнее

их упорядочение.

Общая схема построения фасетной системы классификации в

виде таблицы отображена на рисунке 1. Названия столбцов

соответствуют выделенным классификационным признакам

(фасетам), обозначенным Ф1, Ф2, ..., Фi, ..., Фn. В каждой

клетке таблицы хранится конкретное значение фасета.

Количество значений (строк таблицы) для разных фасетов

может отличаться.

Фасетная классификация

Рисунок 1 - Фасетная система классификации

Фасетная классификация

При построении фасетной системы классификации

необходимо, чтобы значения, используемые в различных

фасетах, не повторялись. Фасетную систему легко

можно модифицировать, добавляя новые фасеты, удаляя

существующие или изменяя конкретные значения любого

фасета. Достоинства фасетной системы классификации:

* возможность создания большой ёмкости классификации,

т.е. использования большого числа признаков классификации и

их значений для создания группировок;

* возможность простой модификации всей системы

классификации без изменения структуры существующих

группировок.

Недостатком фасетной системы классификации является

сложность её построения, так как необходимо учитывать всё

многообразие классификационных признаков, а также низкая

наглядность.

Дескрипторная система классификации

Дескрипторная система классификации

Современные микропроцессоры

Показать полностью… https://vk.com/doc-128337234_439023228
Рекомендуемые документы в приложении