Тема: Данные, базы данных
3. Система управления базами данных
6. Уровни представления данных БД
База данных (БД) – это специальным образом организованное хранение информационных ресурсов в виде интегрированной совокупности файлов, обеспечивающей удобное взаимодействие между ними и быстрый доступ к данным.
База данных – это динамичный объект, меняющий значения при изменении состояния отражаемой предметной области (внешних условий по отношению к базе). Под предметной областью понимается часть реального мира (объектов, процессов), которая должна быть адекватно, в полном информационном объеме представлена в базе данных. Данные в базе организуются в единую целостную систему что обеспечивает более производительную работу пользователей с большими объемами данных.
По организации и технологии обработки данных базы данных подразделяются на централизованные и распределенные.
Централизованную базу данных отличает традиционная архитектура баз данных.
Распределенная база данных состоит из нескольких, возможно пересекающихся или даже дублирующих друг друга частей, хранимых в различных компьютерах вычислительной сети. Работа с такой БД осуществляется с помощью системы управления распределенной базой данных (СУРБД).
Банк данных (БнД) – это автоматизированная система, представляющая совокупность информационных, программных, технических средств и персонала, обеспечивающих хранение, накопление, обновление, поиск и выдачу данных. Главными составляющими банка данных являются база данных и программный продукт, называемый системой управления базой данных (СУБД).
Банк данных – это система специальным образом организованных данных (баз данных), программных, технических, языковых, организационно-методических средств, предназначенных для обеспечения централизованного накопления и коллективного многоцелевого использования данных.
Система управления базами данных (СУБД) – это система, обеспечивающая поиск, хранение, корректировку данных, формирование ответов на запросы. Система обеспечивает сохранность данных, их конфиденциальность, перемещение и связь с другими программными средствами.
Системы управления базами данных – это программные средства, с помощью которых можно создавать базы данных, наполнять их и работать с ними.
Основные функции СУБД:
Обычно СУБД работает с несколькими видами объектов:
Иерархическую модель БД изображают в виде дерева. Элементы дерева вершины представляют совокупность данных, например логические записи.
Сетевые модели БД соответствуют более широкому классу объектов управления, хотя требуют для своей организации и дополнительных затрат.
Реляционная модель БД представляет объекты и взаимосвязи между ними в виде таблиц, а все операции над данными сводятся к операциям над этими таблицами. На этой модели базируются практически все современные СУБД. Эта модель более понятна, "прозрачна" для конечного пользователя организации данных.
В последние годы все большее признание и развитие получают объектно-ориентированные базы данных (ООБД), толчок к появлению которых дали объектно-ориентированное программирование и использование персональных компьютеров для обработки и представления практически всех форм информации, воспринимаемых человеком. В ООБД модель данных более близка сущностям реального мира. Объекты можно сохранить и использовать непосредственно, не раскладывая их по таблицам.
Большинство баз данных имеют табличную структуру. В табличной структуре адрес данных определяется пересечение строк и столбцов. В базах данных столбцы называются полями, а строки – записями. Поля образуют структуру базы данных, а записи составляют информацию, которая в ней содержится.
Поля – это основные элементы структуры базы данных. Они обладают свойствами. От свойств полей зависит, какие типы данных можно вносить в поле, а также то, что можно делать с данными, содержащимися в поле. Поля обладают разными свойствами и относятся к разным типам.
1) Основным свойством любого поля является его длина. Длина поля выражается в символах (или знаках). От длины поля зависит, сколько знаков в нем может поместиться.
2) Уникальным свойством любого поля является имя. В таблице не может быть двух полей с одинаковым именем. Кроме имени у поля есть еще свойство подпись. Подпись – это та информация, которая отображается в заголовке столбца. Если подпись не задана, то в заголовке столбца отображается имя поля.
Разные типы полей имеют разное назначение и разные свойства:
1) Основное свойство текстового поля – размер.
2) Числовое поле служит для ввода числовых данных. Оно тоже имеет размер, но числовые поля бывают разными, например, для ввода целых чисел и для ввода действительных чисел. В последнем случае кроме размера поля задается также размер десятичной части числа.
3) Поля для ввода дат или времени имеют тип Дата/Время.
4) Для ввода логических данных, имеющих только два значения (Да или Нет; 0 или 1; Истина или Ложь), служит специальный тип – логическое поле. Длина такого поля всегда равно 1 байту.
5) Особый тип поля – денежный. Денежные суммы можно хранить в числовом поле, но в денежном формате с ними удобнее работать. В этом случае компьютер отображает числа вместе с денежными единицами (рубли-копейки, доллары-центы, фунты-пенсы).
6) В современных базах данных можно хранить не только числа и буквы, но и картинки, музыкальные клипы и видеозаписи. Поле для таких объектов называется полем OLE.
7) У текстового поля есть недостаток, связанный с тем, что оно имеет ограниченный размер (не более 256 символов). Если нужно вставить в поле длинный текст, то для этого можно использовать поле типа MEMO. В нем можно хранить до 65 535 символов. Особенность MEMO-поля состоит в том, что реально эти данные хранятся не в поле, а в другом месте, а в поле хранится только указатель на то место, где расположен текст.
8) Поле счетчик. На первый взгляд это обычное числовое поле, но оно имеет свойство автоматического наращивания. Если в базе есть такое поле, то при вводе новой записи в него автоматически вводится число, на единицу большее, чем значение того же поля в предыдущей записи.
Принять любое управленческое решение невозможно, не обладая
необходимой для этого информацией, обычно количественной. Для этого необходимо
создание хранилищ данных. Процесс создания хранилищ данных – это процесс
сбора, отсеивания и предварительной обработки данных с целью предоставления
результирующей информации пользователям для статистического анализа (а нередко
и создания аналитических отчетов).
Хранилище данных (Data Warehouse) – это автоматизированная информационно-технологическая система, которая собирает данные из существующих баз и внешних источников, формирует, хранит и эксплуатирует информацию как единую. Хранилище информации предназначено для хранения, оперативного получения и анализа интегрированной информации по всем видам деятельности организации.
Ральф Кимбалл (Ralph Kimball), один из авторов концепции
хранилищ данных, описывал хранилище данных как "место, где люди могут
получить доступ к своим данным" (см., например, Ralph Kimball, "The
Data Warehouse Toolkit: Practical Techniques for Building Dimensional Data
Warehouses", John Wiley & Sons, 1996 и "The Data Webhouse
Toolkit: Building the Web-Enabled Data Warehouse", John Wiley & Sons,
2000). Он же сформулировал и основные требования к хранилищам данных:
Удовлетворять всем перечисленным требованиям в рамках
одного и того же продукта зачастую не удается. Поэтому для реализации хранилищ
данных обычно используется несколько продуктов, одни их которых представляют
собой собственно средства хранения данных, другие – средства их извлечения и
просмотра, третьи – средства их пополнения и т.д.
Типичное хранилище данных, как правило, отличается от
обычной реляционной базы данных.
Во-первых, обычные базы данных предназначены для того,
чтобы помочь пользователям выполнять повседневную работу, тогда как хранилища
данных предназначены для принятия решений. Например, продажа товара и выписка
счета производятся с использованием базы данных, предназначенной для обработки
транзакций, а анализ динамики продаж за несколько лет, позволяющий спланировать
работу с поставщиками, – с помощью хранилища данных.
Во-вторых, обычные базы данных подвержены постоянным
изменениям в процессе работы пользователей, а хранилище данных относительно
стабильно: данные в нем обычно обновляются согласно расписанию (например,
еженедельно, ежедневно или ежечасно – в зависимости от потребностей). В идеале
процесс пополнения представляет собой просто добавление новых данных за
определенный период времени без изменения прежней информации, уже находящейся в
хранилище.
И, в-третьих, обычные базы данных чаще всего являются источником данных, попадающих в хранилище. Кроме того, хранилище может пополняться за счет внешних источников, например статистических отчетов.