Компьютеры
и программирование

Реляционная модель данных: теоретические основы

Реляционная модель данных: кем, когда и для чего создана

Реляционная модель данных - созданная Эдгаром Коддом логическая модель данных, описывающая:

  • структуры данных в виде (изменяющихся во времени) наборов отношений;
  • теоретико-множественные операции над данными: объединение, пересечение разность и декартово произведение;
  • специальные реляционные операции: селекция, проекция, соединение и деление;
  • специальные правила, обеспечивающие целостность данных.

Эдгар Франк «Тед» Кодд - (23 августа 1923 —18 апреля 2003) — британский учёный, работы которого заложили основы теории реляционных баз данных. Работая в компании IBM, он создал реляционную модель данных. В 1970 издал работу «A Relational Model of Data for Large Shared Data Banks», которая считается первой работой по реляционной модели данных.

Реляционная модель данных - это способ рассмотрения данных, то есть предписание для способа представления данных (посредством таблиц) и для способа работы с таким представлением (посредством операторов). Она связана с тремя аспектами данных: структурой (объекты), целостностью и обработкой данных (операторы).

В 2002 журнал Forbes поместил реляционную модель данных в список важнейших инноваций последних 85 лет.

Цели создания реляционной модели данных:

  • обеспечение более высокой степени независимости от данных;
  • создание прочного фундамента для решения семантических вопросов и проблем непротиворечивости и избыточности данных;
  • засширение языков управления данными за счёт включения операций над множествами.

Структура данных в реляционной модели данных

Реляционная модель данных предусматривает структуру данных, обязательными объектами которой являются:

  • отношение;
  • атрибут;
  • домен;
  • кортеж;
  • степень;
  • кардинальность;
  • первичный ключ.
  • Отношение - это плоская (двумерная) таблица, состоящая из столбцов и строк:

    IDФамилияИмяДолжностьг.р.
    1ПетровИгорьДиректор1968
    2ИвановОлегЮрист1973
    3КимЕленаБухгалтер1980
    4СенинИльяМенеджер1981
    5ВасинСергейМенеджер1978

    Атрибут - это поименованный столбец отношения.

    Домен - это набор допустимых значений для одного или нескольких атрибутов.

    Кортеж - это строка отношения.

    Степень определяется количеством атрибутов, которое оно содержит

    Кардинальность - это количество кортежей, которое содержит отношение.

    Первичный ключ - это уникальный идентификатор для таблицы.

    Соответствие между формальными терминами реляционной модели данных и неформальными:

    • отношение (формальный термин) - таблица (неформальный термин);
    • атрибут - столбец;
    • кортеж - строка или запись;
    • степень - количество столбцов;
    • кардинальное число - количество строк;
    • первичный ключ - уникальный идентификатор;
    • домен - общая совокупность допустимых значений.

    Отношения и их реализация в реляционной модели данных

    Отношение R на множестве доменов D1, D2, …, Dn - это подмножество декартова произведения этих доменов:

    R ⊆ D1 × D2 × … × Dn

    Пример 1. Определены домены: D1 - множество фамилий преподавателей, D2 - множество аудиторий, D3 - множество учебных групп, D4 - множество учебных дисциплин. Записать отношения: 1) закрепление преподавателей за учебными курсами; 2) расписание занятий в группах.

    Решение.

    1) закрепление преподавателей за учебными курсами:

    R ⊆ D1 × D4.

    Это отношение определяет множество преподавателей, ведущих множество учебных дисциплин.

    2) расписание занятий в группах:

    R ⊆ D2 × D3 × D4.

    Это отношение определяет множество аудиторий, в которых проводятся занятия по множеству учебных дисциплин для множества учебных групп.

    Свойства отношений:

    • уникальное имя отношения;
    • уникальное имя атрибута;
    • нет одинаковых кортежей;
    • кортежи не упорядочены сверху вниз;
    • атрибуты не упорядочены слева направо;
    • все значения атрибутов атомарные (нормализованное отношение).

    Таким образом, реляционная база данных - это набор нормализованных отношений. Для того, чтобы перейти к видам отношений, введём понятие переменной отношения. Переменная отношения - это именованный объект, значение которого может изменяться с течением времени. Переменная отношения в разное время - это различные таблицы базы данных, у которых разные строки, но одинаковые столбцы.

    Виды отношений:

    • именованное отношение;
    • базовое отношение;
    • производное отношение;
    • выражаемое отношение;
    • представление (view);
    • снимки (snapshot);
    • результат запроса;
    • промежуточный результат.

    Именованное отношение - это переменная отношения, определённая в СУБД (системе управления базами данных) посредством оператора CREATE (CREATE TABLE, CREATE BASE RELATION, CREATE VIEW, CREATE SNAPSHOT).

    Базовое отношение - это именованное отношение, которое не является производным. Существование базового отношения не зависит от существования других отношений.

    Производное отношение - это отношение, которое определено через другие именованные отношения. Производное отношение зависит от существования других - базовых - отношений.

    Выражаемое отношение - это отношение, которое можно получить из набора именованных отношений посредством некоторого реляционного выражения. Каждое именованное отношение является выражаемым отношений, но не наоборот. Примеры выражаемых отношений - базовые отношения, представления, снимки, промежуточные и окончательные результаты. Множество всех выражаемых отношений - это множество всех базовых и всех производных отношений.

    Представление - это именованное производное отношение. Представлены в базе данных в виде определения. Представление не хранится в физической памяти системы управления базой данных (СУБД), а формируется с использованием других именованных отношений.

    Снимки (snapshot) - это то же, что и представление, но с физическим сохранением и с периодическим обновлением.

    Результат запроса - это неименованное производное отношение. СУБД не обеспечивает постоянного существования результатов запросов. Для сохранения результата запроса его можно присвоить какому-либо именованному отношению.

    Промежуточный результат - это неименованное производное отношение, являющееся результатом подзапроса, вложенного в бОльшее выражение.

    Ключи отношения в реляционной модели данных

    Ключи отношения могут быть следующми:

    • суперключ;
    • потенциальный ключ;
    • первичный ключ;
    • внешний ключ;
    • суррогатный ключ.

    Ключ отношения - это подсхема исходной схемы отношения, состоящая из одного или нескольких атрибутов, для которых декларируется условие уникальности значений в кортежах отношений. При объявлении схемы базового отношения могут быть заданы объявления нескольких ключей.

    Ключ отношения может быть простым или составным. Простой ключ – это ключ, состоящий из одного и не более атрибута. Составной ключ -ключ, состоящий из двух и более атрибутов.

    Суперключ - это атрибут или множество атрибутов, которое единственным образом идентифицирует кортеж данного отношения. Он может включать дополнительные атрибуты. Суперключ не обладает свойством неизбыточности.

    Потенциальный ключ - это подмножество атрибутов отношения, удовлетворяющее требованиям уникальности и неизбыточности. Он обладает следующими свойствами. Уникальность: в таблице нет двух разных строк с одинаковыми значениями в нашем потенциальном ключе. Неизбыточность: нельзя убрать один из столбцов из ключа, так, чтобы он не потерял уникальности. В отношении может быть больше одного потенциального ключа.

    Первичный ключ (primary key, PK) - это один из потенциальных ключей отношения, выбранный в качестве основного ключа. Допустимо объявление одного и только одного первичного ключа. Атрибуты первичного ключа не могут принимать значения Null.

    Внешний ключ (foreign key, FK) - это ключ, объявленный в базовом отношении, который при этом ссылается на первичный того же самого или какого-то другого базового отношения.

    Суррогатный ключ - это служебный атрибут, добавленный к уже имеющимся информационным атрибутам отношения. Предназначение суррогатного ключа - служить первичным ключом отношения. Значение этого атрибута генерируется искусственно.

    Пример 2. Есть база данных сети аптек. В ней есть таблица "Аптеки", в которую занесены все аптеки сети, и есть таблица "Препараты". Кроме того, есть таблица "Наличие", в которую заносятся данные о наличии препаратов в каждой аптеке. В таблице наличие есть поля: "Аптека" (в ней - идентификаторы аптек), "Препарат" (в ней - идентификаторы препаратов), "Количество". Возникает проблема: в случае поступления в аптеку некоторого количества препарата можно не заметить, что в той же аптеке тот же препарат уже содержится в некотором количестве и сделать новую записись в таблице, в которой аптека и препарат будут повторяться. Как на уровне ключей избежать этой проблемы?

    Решение. Можно объявить первичным ключём таблицы "Наличие" составной ключ, состоящий из идентификатора аптеки и идентификатора препарата. Тогда в таблице невозможно повторение в разных записях сочетания аптеки и прапарата. Первичный ключ может быть не только простым, но и составным.

    Целостность данных в реляционной модели данных

    Понятия реляционной целостности:

    • определитель NULL;
    • целостность сущностей;
    • ссылочная целостность;
    • корпоративные ограничения целостности.

    Определитель NULL. Значение Null обозначает тот факт, что значение не определено. Null не принадлежит никакому типу данных и может присутствовать среди значений любого атрибута, определенного на любом типе данных. Двуместная «арифметическая» операция с Null даёт Null. Операция сравнения с Null даёт UNKNOWN.

    Целостность сущностей. Требование целостности сущности означает, что первичный ключ должен полностью идентифицировать каждую сущность, а поэтому в составе любого значения первичного ключа не допускается наличие неопределенных значений. Значение атрибута должно быть атомарным.

    Ссылочная целостность. Требование целостности по ссылкам состоит в том, что для каждого значения внешнего ключа, появляющегося в кортеже значения-отношения ссылающейся переменной отношения, либо в значении-отношении переменной отношения, на которую указывает ссылка, должен найтись кортеж с таким же значением первичного ключа, либо значение внешнего ключа должно быть полностью неопределенным. Существуют правила удаления кортежа из отношения, на которое ведет ссылка.

    Ссылочная целостность: удаление кортежа. Существует три подхода удаления кортежа из отношения, на которое ведет ссылка.

    1. Ограничение удаления–Delete: Restrict.
    2. Каскадное удаление–Delete: Cascade.
    3. Установка значения NULL, перевод значения внешнего ключа в неопределённое состояние – Delete: Set NULL.

    Ограничение удаления. Запрещается производить удаление кортежа, для которого существуют ссылки. Сначала нужно либо удалить ссылающиеся кортежи, либо соответствующим образом изменить значения их внешнего ключа.

    Каскадное удаление. При удалении кортежа из отношения, на которое ведет ссылка, из ссылающегося отношения автоматически удаляются все ссылающиеся кортежи.

    Установка значения NULL. При удалении кортежа, на который имеются ссылки, во всех ссылающихся кортежах значение внешнего ключа автоматически становится полностью неопределенным.

    Пример 3. Есть база данных портала новостей. В ней есть таблица "Рубрики" (политика, экономика, спорт и т.д), есть таблица "Автора" (фамилии и имена авторов). Есть таблица "Тексты", в которой в каждой записи о тексте новости есть поля "Рубрика" (с идентификаторами рубрик из соответствующей таблицы) и "Автор" (с идентификаторами рубрик из соответствующей таблицы). Какими способами можно добиться, чтобы при удалении рубрики и автора была соблюдена ссылочная целостоность данных?

    Решение. Первый способ: установить запрет на удаление рубрики или автора из соответствующих таблиц, в случае, если в таблицы "Тексты" есть ссылки на эту рубрику или на этого автора. Второй способ: задать автоматическое удаление из таблицы "Тексты" записей, в которой фигурируют эта рубрика или этот автор. Третий способ: в случае удаления рубрики или автора из соответствующих таблиц в ссылающихся кортежах таблицы "Тексты" значения идентификатора этой рубрики или этого автора становятся неопределёнными (NULL).

    Как это делается на уровне языка запросов SQL - в материале SQL ALTER TABLE - изменение таблицы базы данных.

    Корпоративные ограничения целостности - это дополнительные правила поддержки целостности данных, определяемые пользователями или администраторами базы данных.

    Поделиться с друзьями

    Другие темы в блоке "Реляционные базы данных"