На правах рекламы:
ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Авторитетность издания

ВАК - К1
RSCI, ядро РИНЦ

Добавить в закладки

Следующий номер на сайте

2
Ожидается:
16 Июня 2024

Оптимизация хранения корпоративных данных

Статья опубликована в выпуске журнала № 4 за 2007 год.
Аннотация:
Abstract:
Авторы: Ефимов И.Н. (chti@chti.ru) - Чайковский технологический институт Ижевского государственного технического университета им. М.Т. Калашникова, г. Чайковский, доктор технических наук, Жукова С.А. (chti@chti.ru) - Чайковский технологический институт Ижевского государственного технического университета им. М.Т. Калашникова, г. Чайковский, кандидат технических наук
Количество просмотров: 9402
Версия для печати
Выпуск в формате PDF (2.00Мб)

Размер шрифта:       Шрифт:

В настоящее время наблюдается серьезное увеличение объема корпоративной информации. В соответствии с отчетами IDC, рост объемов хранимых и обрабатываемых данных составляет более 70 % в год. В некоторых специфичных отраслях, например в медицине, наблюдается экспоненциальный рост информационных объемов. Ситуация осложняется требованиями нормативных актов и внутрикорпоративных стандартов, предписывающих длительное хранение некоторых видов информации, иногда в течение 5-10 лет. А это значит, что компания, имеющая корпоративные данные скромного объема в 1 Тбайт и показывающая рост этих объемов на 60 % в год, через 10 лет будет хранить уже 110 Тбайт информации. Проблема взрывного роста объемов данных тесно связана с другой проблемой – постоянно усложняющимися процессами управления хранением данных.

Управление информацией включает решение задач, связанных с организацией хранения, доступа, защищенности, производительности, то есть с обеспечением гарантированного уровня обслуживания. Размещение информации должно осуществляться, с одной стороны, на тех носителях, характеристики которых удовлетворяют заданным параметрам уровня обслуживания. С другой стороны, необходимо добиваться снижения затрат на их хранение. При организации хранения информации выбор носителя является определяющим (Жесткие диски вчера, сегодня, завтра //Системы хранения данных. 2005, №3).

Как правило, специалисты выбирают либо дорогостоящие средства хранения, максимально удовлетворяющие требования к уровню сервиса, либо недорогие запоминающие устройства. В этом случае возникают риски, связанные с потерей качества обслуживания информации (снижение надежности, потеря производительности и т.д.). Добиться оптимального распределения ресурсов хранения при снижении затрат на хранение и сопровождение информации можно, формируя информационные ресурсы в виде многоуровневой блочной среды.

С этой целью необходимо классифицировать корпоративную информацию по степени ее значимости для бизнес-процессов компании и применять инструменты управления размещением данных на устройствах хранения в соответствии с этой классификацией. В этом случае среда хранения формируется как совокупность дисковых массивов различных типов для каждого класса информационных ресурсов (ИР.)

Таким образом, можно сформулировать задачу, заключающуюся в оптимизации параметров многоуровневой среды хранения ИР с заданными локальными характеристиками каждого уровня и в то же время объединенными совокупностью ограничений на всю среду хранения. Оптимальным планом является номенклатура дисковых массивов и количество внешних запоминающих устройств (ВЗУ), составляющих дисковый массив, при минимальной суммарной стоимости хранения. В такой постановке задачу можно рассматривать как задачу математического программирования с блочной (многоуровневой) структурой. Одна система ограничений содержит все переменные и образует блок-связку, другая – лишь часть переменных и формирует блочную структуру (Глухов В.В., Медников М.Д., Коробко С.Б. Математические методы и модели для менеджмента. СПб., 2000).

С учетом вышесказанного дадим формализованное описание задачи. Пусть имеем P уровней и mp, p=1..P параметров, характеризующих ресурс, наличие каждого i-го параметра составляет наименьшее bpi и наибольшее Bpi, i=1… mp (значения в соответствующих единицах измерений). Эти параметры предназначены для формирования np типов дисковых массивов. Каждая единица j-го типа дискового массива содержит aij единиц i-го параметра ресурса. Требуется определить, какие типы дисковых массивов и какое количество дисков необходимо для формирования многоуровневой среды хранения с наилучшими показателями для принятого критерия оптимальности.

Обозначим через xpj количество единиц j-го типа дисковых массивов на p-м уровне, тогда математическую постановку задачи можно записать в виде:

                           (1)

при ограничениях

,                                      (2)

,                                       (3)

,                                                        (4)

, i=1…mp, p=1...P,                        (5)

, i=1..mp, p=1..P,                             (6)

, j=1..np, p=1..P,                                     (7)

где P – общее количество локальных блоков; m0 – число ограничений в блоке-связке; np – число переменных в p-м локальном блоке; mp – число ограничений в p-м локальном блоке; vpj – объем диска j-типа в p-м локальном блоке; cpj – стоимость хранения информации на диске j-типа в p-м локальном блоке; b0 – общее количество дисков  для хранения ИР; bpi, Bpi – наименьшее и наибольшее значения параметра ИР;  – множество целых, положительных чисел.

Условия (2)–(4) описывают блок-связку, (5), (6) – отдельные блоки (уровни), (7) – условие целочисленного значения переменной xpj.

Организация среды хранения ИР по заданной классификации может характеризоваться следующими основными параметрами: V – максимальный объем, Мб; Ps – пропускная способность, Мб/с; С – стоимость хранения, руб/Мб.

В ходе исследования проведены расчеты для случая трехуровневой среды хранения при следующих значениях параметров модели: P=3, m0=2, m1=2, m2=2, m3=2, n1=3, n2=2, n3=3, b0=100 с учетом изменяющихся параметров ИР. На рисунке приведены графики, отражающие зависимость объема и стоимости хранения при организации одноуровневой и многоуровневой среде хранения. Как показывают сравнительные результаты расчета, использование многоуровневой среды хранения снижает затраты на хранение ИР. При этом обеспечивается гарантированный уровень обслуживания информации. Однако использование многоуровневой среды хранения эффективно при достижении объема ресурса сотен Гбайт.

Подпись:  
Изменение стоимости хранения с ростом ИР
Проведенные исследования показывают, что использование многоуровневой структуры среды хранения позволяет сократить затраты за счет оптимального использования дисковых устройств. Если учитывать полную стоимость обслуживания информации, включающую затраты на поддержку информации на всех стадиях ее жизненного цикла, то эффект от внедрения многоуровневой среды будет расти. Введение такой структуры ИР позволяет обеспечить уровни сервиса в соответствии с потребностями бизнеса. В частности, в модели рассмотрены показатели производительности и объема. Данную модель можно расширить, добавив в качестве ограничений такие показатели сервиса, как требования к надежности и восстанавливаемости.


Постоянный адрес статьи:
http://swsys.ru/index.php?page=article&id=294
Версия для печати
Выпуск в формате PDF (2.00Мб)
Статья опубликована в выпуске журнала № 4 за 2007 год.

Назад, к списку статей