Шпаргалка

Ответы к экзамену (2004г.) / шпоры_2004(мп-4х).doc

 

1. Основные понятия: база данных (БД), банк данных (БнД), СУБД. 1

2. Компоненты БнД.. 1

3-4. Этапы проектирования БД и модели, создаваемые в процессе проектирования: инфологическая, даталогическая, физическая, внешняя. 2

5. Инфологическое моделирование предметной области. Состав инфологической модели (ИЛМ). 3

6. Описание объектов и их свойств. Разновидности свойств объектов. 3

7. Описание связи между объектами. Типы (степени) связи, классы принадлежности. 5

8. ER-диаграммы и их разновидности. Понятия сущности, связи, атрибуты. 6

9.Описание сложных объектов. Составные, обобщенные, агрегированные объекты.. 8

10. Даталогическое проектирование БД: цель и этапы даталогического проектирования. Определение состава БД. 10

11. Разновидности даталогических моделей (ДЛМ). 11

12.Основные понятия реляционных БД (РБД): кортеж, домен, отношение, степень отношения, мощность отношения, первичный и внешний ключи. 12

13. Индексация файлов (таблиц) в БД. Индексные файлы и индексные ключи. 13

14. Метод проектирования РБД на основе ИЛМ (правила 1-12). 13

15. Пример проектирования РБД: создание ИЛМ и переход к ДЛМ. 17

16 Сравнение однотабличной и многотабличной баз данных. 20

17 Операции Реляционной Алгебры. 20

18 Structured Query Language. 22

19 Правила записи оператора SELECT. 23

20 Предложение Select 24

21, 22 Предложение WHERE.. 24

23 Составные условия поиска. Таблицы истинности. 24

24 ORDER BY.. 25

25 UNION.. 25

26 Многотабличные запросы на чтение. 25

27 Псевдонимы таблиц, самосоединение таблиц. 25

28 Агрегатные функции языка SQL. 26

29. Запросы с группировкой и ограничения на них. 27

30. Условия поиска групп и ограничения на эти условия. 28

31. Вложенный запрос и его особенности. 28

32. Внешние ссылки и связанные подзапросы. 29

33. Условия поиска с вложенным запросом. 30

34. Внесение изменений в БД: добавление, удаление и обновление данных. 31

35. Задание и изменение структуры БД: операторы CREATE TABLE, DROP TABLE, ALTER TABLE. 33

36. Создание и удаление индексов операторами CREATE/DROP INDEX. 35

37. Создание представлений оператором CREATE VIEW. 35


1. Основные понятия: база данных (БД), банк данных (БнД), СУБД.

База данных — поименованная совокупность взаимосвязанных данных, управляемых специальной системой, называемой системой управления базой данных (СУБД).

СУБД — совокупность специальных языковых и программных средств, облегчающих пользователям выполнение всех операций, связанных с организацией хранения данных, их корректировкой и доступом к ним.

БД и СУБД являются компонентами более сложной системы — банка данных (БнД)

Банк данных (БнД) — система, состоящая из БД, программных, технических, языковых, организационно-методических средств, предназначенных для обеспечения централизованного накопления и коллективного многоцелевого пользования базой данных.

2. Компоненты БнД

Словарь данных — «хранилище» метаинформации.

Метаинформация — информация об информации, которая хранится в БнД.

Метаинформация включает в себя описание БД, информацию о предметной области, представленной в БД, сведения о пользователях.

Языковые средства предназначены для пользователей различных категорий (конечный пользователь: финансовый менеджер, системный аналитик, профессиональный программист).

Программные средства — компиляторы, машины БД, интерпретаторы.

BDE — Borland Data Base — Engine (машина).

Технические средства, используемые в БнД — это компьютеры (mainframe, ПК), периферийные устройства (монитор, клавиатура), коммутационная аппаратура.

Организационно—методические средства представляют собой различные инструкции, методические и регламентирующие материалы, предназначенные для пользователей разных категорий, взаимодействующих с БД.

Администратор БнД — специалист или группа специалистов, обеспечивающая создание, развитие, функционирование БнД.


3-4. Этапы проектирования БД и модели, создаваемые в процессе проектирования: инфологическая, даталогическая, физическая, внешняя.

I Инфологическое моделирование как результат разработки модели ПО

Предметная область — это часть реального мира, которая представляет интерес.

Инфологическая модель предметной (ИЛМ) области — описание предметной области, выполненное без ориентации на использованные в дальнейшем СУБД и технологические средства, и отражающие информационные аспекты ПО.

II Даталогическое проектирование

Даталогическая модель (ДЛМ) строится на основе ИЛМ. ДЛМ БД является концептуальной моделью БД и отражает логические связи между информационными элементами ДЛМ. В ДЛМ фиксируются данные и связи данных между ними.

ДЛМ строится в терминах информационных единиц, допустимых в той конкретной СУБД, в среде которой проектируется БД. ДЛМ зависит от выбора СУБД для разработки БнД или информационной модели.

Схема БД - описание ДЛМ на языке выбранной СУБД.

III Физическое проектирование

Для привязки ДЛМ к среде хранения используется модель данных физического уровня (физическая модель, внутренняя модель). Эта модель БД определяется используемыми ЗУ, способами физической организации данных в среде хранения.

Физическая модель, также как и ДЛМ, строится с учетом особенностей выбранной СУБД.

Физическое проектирование — описание физической структуры БД.

IV Этап определения подсхем

В некоторых СУБД имеется возможность описать логическую структуру БД с точки зрения конкретной группы пользователей. Такая модель называется внешней, а ее описание — подсхемой. Если СУБД поддерживает уровень подсхем, то перед проектировщиком может встать задача определения подсхем. Тогда это будет еще одним этапом.

Этап определения подсхем — этап разработки внешней модели. Использование подсхем облегчает работу пользователя, т.к. он должен знать структуру не всей базы, а только той ее части, которая представляет интерес. Подсхема приспособлена под потребности конкретного пользователя.


5. Инфологическое моделирование предметной области. Состав инфологической модели (ИЛМ)

1-2. Описание предметной области представляется с помощью какой-либо знаковой системы, поэтому в ИЛМ отражаются не только отношения, присущие данной предметной области (ПО), но и лингвистические отношения, обусловленные особенностями предметной области в языковой среде.

Учитываются понятия: синонимы, омонимы и т.д.

3. Алгоритмические связи показателей — для фиксирования алгоритмических зависимостей между показателями.

В третьем компоненте отражаются алгоритмические зависимости между показателями.

Пример графа с показателями:

Для вычисления показателя P5 требуется значение P2.

В алгоритмических связях фиксируются расчетные файлы.

4. Четвертый компонент содержит информацию о типах запросов, поступающих от пользователей, информацию о режимах использования данных и другую информацию.

5. Ограничение целостности — это условия при которых имеют смысл значения, хранящиеся в базе данных или условия, при которых значения могут быть записанными в базу данных (например, частота процессора больше нуля, или объем памяти больше нуля и т.д.)

6. Описание объектов и их свойств. Разновидности свойств объектов

Класс объектов — совокупность объектов, обладающих одинаковым набором свойств.

Классы объектов могут быть как материальными, так и абстрактными (например, предметы, по которым абитуриенты сдают экзамен).

Каждый объект представляется своим уникальным идентификатором, по которому можно отличить один объект от другого.

Каждый объект обладает определенным набором свойств (то же самое, атрибутами, показателями). Для объектов одного класса набор свойств одинаков, а значения свойств могут различаться (например, объекты класса «абитуриенты» имеют такие свойства, как регистрационный номер, дата рождения, пол).

При описании предметной области нужно изобразить каждый существующий класс объекта, набор свойств, которым объект характеризуется.

Класс объектов обозначается следующим образом:

— В качестве имени существительного в единственном числе.

Свойство:

— Грамматический оборот (существительное + поясняющие слова). Например, «Товар потребляемый».

Если в предметной области традиционно используются разные имена для обозначения какого-либо класса объекта или различные названия одного и того же свойства, то все эти названия и наименования должны быть зафиксированы в виде лингвистических отношений. Затем одно из имен или названий выбирается за основное, которое должно использоваться в дальнейшем в инфологической модели.

Лингвистические отношения — словесная формулировка, термины.

При построении инфологической модели желательно дать словесную интерпретацию каждому понятию, особенно если возможно его неоднозначное толкование.

При описании предметной области необходимо отразить связи объекта с его свойствами, которые будут отображаться в виде линии, которая соединяет обозначение объекта с его свойствами. Изображение связи объекта с его свойством должно учитывать специфику свойства.

Разновидности свойств:

1.      Единичные свойства — свойства, в каждый времени имеющие одно значение.

2.      Множественные свойства — свойства, которые в каждый момент времени могут иметь несколько значений.

3.      Статические свойства — свойства, которые не изменяют своих значений в течение всего времени существования объекта (S).

4.      Динамические свойства — свойства, которые могут изменять свои значения в течение времени существования объекта (D).

Свойства, которыми обладают не все объекты данного класса, называются условными.

«Грант» - условное свойство.


7. Описание связи между объектами. Типы (степени) связи, классы принадлежности.

Помимо описания объекта с его свойствами фиксируются связи между объектами разных классов в инфологической модели.

Различают 4 типа связи:

1.      1:1

2.      1:N (один ко многим).

3.      N:1 (многие к одному).

4.      N:N (многие ко многим).

Помимо «тип связи» используется понятие «степень связи». В инфологической модели помимо степени связи надо указывать принадлежность связи.

Класс принадлежности — показывает должен или не должен объект одного класса участвовать в связях с объектами другого класса. Класс принадлежности объекта может быть обязательным или необязательным.

Обязательный класс принадлежности.

Если все объекты первого класса должны участвовать в связи с объектами второго класса, то класс принадлежности объектов 1-го класса называется обязательным.

Необязательный класс принадлежности.

Если некоторые объекты 1-го класса могут не участвовать в связях с объектами 2-го класса, то класс принадлежности объектов 1-го класса называются необязательными.


8. ER-диаграммы и их разновидности. Понятия сущности, связи, атрибуты.

Преподаватель читает курс.

Связь именуется глаголом «читает».

Связь между объектами может быть выражена 2 способами представления с помощью ER-диаграмм.

1.      Диаграмма ER-экземпляра.

По номеру курса можно однозначно идентифицировать курс.

2.      Диаграмма ER-типа

Тип связи 1 к 1.

Класс принадлежности объектов и для П и для К необязательный.

Сущность — определяется как некоторый объект, представляющий интерес в данной предметной области. Этот объект должен иметь экземпляры, отличающиеся друг от друга и допускающие однозначную идентификацию.

Как правило в описании предметной области сущность обозначается как существительное.

Связь — представляет собой соединение между двумя или более сущностями.

При поиске связей в описании предметной области следует полагаться в основном на то, что связь отражается глаголом.

Атрибут — свойство сущности.

Атрибутами сущности «Преподаватель» является номер, ФИО, дата рождения, должность.

<П1, К2>

Ключ сущности — это атрибут или набор атрибутов, используемый для идентификации экземпляра сущности.

Ключ связи — набор ключей сущностей, которые соединяются этой связью.

Ключом связи «Читает» является набор сущностей П и К <НП, НК>.

Каждый преподаватель читает 1 курс, каждый курс читается одним преподавателем.

Каждый преподаватель читает 1 курс, каждый курс читается не более, чем одним преподавателем.

Каждый курс читается одним преподавателем. Каждый преподаватель читает не более одного курса.

Каждый преподаватель читает одновременно несколько курсов, но каждый курс читается не более, чем одним преподавателем.

Каждый преподаватель читает не более одного курса, каждый курс может читаться несколькими преподавателями.

Каждый преподаватель может читать несколько курсов, и каждый курс может читаться несколькими преподавателями.


9.Описание сложных объектов. Составные, обобщенные, агрегированные объекты

По степени сложности различают простые и сложные объекты.

Простой объект — объект, который рассматривается как неделимый.

Сложный объект — объект, который представляет собой объединение других объектов, также выделяемых в предметной области.

Разновидности сложных объектов

1.      Составной объект.

2.      Обобщенный объект.

3.      Агрегированный объект.

Составной объект соответствует отображению связей между целым и его частями. Для представления составных объектов в ИЛМ используется диаграмма ER-типа.

Имеется сущность УЗЕЛ

Обобщенный объект — отражает наличие связи род-вид между объектами предметной области. Объекты СТУДЕНТ-ШКОЛЬНИК-АСПИРАНТ образуют обобщенный объект УЧАЩИЙСЯ — родовой объект из видовых объектов. Как родовой объект, так и видовые объекты, обладают определенным набором свойств, причем имеет место наследование. Видовой объект обладает всеми свойствами, которые есть у родового объекта, а также свойствами, которые присущи объектам только этого вида.

Определение родовидовых связей — означает классификацию объектов по определенным признакам.

Виды или подклассы объектом могут быть представлены в ИЛМ в явной форме. При графическом изображении объекта можно обозначить треугольником каждый вид; с ним связаны свойства, характерные для данного вида.

Агрегированный объект — обычно соответствует некоторому процессу, в который вовлечены другие объекты, присутствующие в предметной области. Принято именовать существительным, который происходит от глагола, который описывает соответствующий объект. Изображается ромбом, внутри которого записывается название объекта. Ромб соединяется отрезками прямых с условными обозначениями объектов, входящими в агрегированный объект.

Свойства, которые имеются у агрегированного объекта.

 

Один и тот же вид продукции может быть в разных поставках.


10. Даталогическое проектирование БД: цель и этапы даталогического проектирования. Определение состава БД.

Цель: Создание даталогической модели, которая отображает логические связи между элементами данных безотносительной к их смысловому содержанию и среде хранения.

Даталогическая модель строится в терминах информационных единиц, предусмотренных СУБД.

Этапы ДЛП:

Д1 — документация по выбранной СУБД.

На 4-м этапе используется созданная ИЛМ. Определить состав базы данных.

П — набор показателей, перечень атрибутов или состав базы данных.

С — средства.

ФП — физический проект.

Определение состава БД.

Один из подходов к определению состава БД — принцип синтезирования.

Суть: В БД должны храниться только исходные показатели. Все производные показатели должны вычисляться в момент поступления запроса.

Достоинства:

1.      Простота и однозначность при решении вопроса в том, что хранить в БД.

2.      Отсутствие явного дублирования информации.

3.      Имеется потенциальная возможность получить любой рассчетный показатель, а не только хранимые в базе показатели.

Несмотря на все достоинства, в каждом конкретном случае надо оценивать целесообразность хранения вычисляемых показателей в БД с учетом частоты и трудоемкости вычисления этих показателей.

В некоторых случаях приходится в состав показателей, хранимых в БД, включать дополнительные атрибуты.

При отображении объекта в БД естественный идентификатор объекта будет атрибутом или свойством, который используется для однозначной идентификации объектов. Однако может появиться необходимость ввести искусственные идентификаторы или коды для обозначения объектов. Это может потребоваться:

1.      когда в предметной области наблюдается омонимия;

2.      если объект участвует во многих связях, то для идентификации связи удобнее использовать короткий код объекта вместо естественного длинного идентификатора;

3.      если естественный идентификатор может измениться со временем (например, меняется название региона (атрибут используется в явном виде, т.е. код не используется)).


11. Разновидности даталогических моделей (ДЛМ)

По способу установления связей между данными различают следующие модели:

Реляционная модель, Иерархическая модель, Сетевая модель, Объектно-ориентированная модель.

Реляционная модель является простейшей и наиболее привычной формой представления данных в виде таблицы. В теории множеств понятию таблицы соответствует понятие отношений (Relation).

Преподаватель Курс

 

Достоинство реляционной модели — сравнительная простота информационной поддержки

Недостатки: жесткость структуры данных; зависимость скорости выполнения операции от размера таблиц.

Иерархическая и сетевая модели: Предполагают наличие связи между данными, имеющими какой-либо общий признак. В иерархической модели эти связи могут быть ограничены в виде дерева, где возможны только односторонние связи от старших вершин к младшим. Информация о курсах дублируется, легко размножается. Если используется иерархическая модель, то ускоряется доступ к информации, но только для тех запросов, которые учитывают структуру дерева.