Статьи

Оптимізація продуктивності баз даних за допомогою СГД All-Flash

Оптимізація продуктивності баз даних
за допомогою СГД All-Flash

При роботі з базами даних в різних сферах - від високочастотного трейдингу до управління ризиком в реальному часі - частки мілісекунд часто вирішують все.

Продуктивність баз даних в значній мірі залежить від швидкості виконання операцій введення-виведення, тому підприємства все частіше віддають перевагу системам зберігання даних на базі флеш-технологій, які дозволяють знизити латентність введення-виведення і підвищити швидкість обробки транзакцій.

Вибір правильної СГД all-flash безпосередньо впливає на результати діяльності компанії: значне прискорення обробки, зменшення необхідного серверного обладнання, зниження витрат на ліцензування баз даних і істотна економія простору і електроенергії (докладніше в статті Флеш-технологія на службі продуктивності СГД в умовах стрімкого прогресу даного випуску).

Максимальна продуктивність баз даних

Багато років адміністраторам баз даних доводилося вирішувати проблему планування і управління в системах зберігання даних, щоб домогтися максимальної продуктивності при використанні щодо повільних дисків. Одним з найбільш ефективних методів був запуск часто використовуваних лог-файлів на швидких, дзеркальних дисках. Адміністратори воліли виділяти під завдання надлишкові ресурси, щоб навіть у випадку великої кількості конкуруючих запитів зберегти стабільне час відгуку.

На зміну повільним дискам з механічним приводом приходять масиви all-flash на базі твердотільних накопичувачів (SSD). Результати говорять самі за себе у всіх аспектах продуктивності. Кількість операцій вводу-виводу в секунду у SSD в сотні разів більше, ніж у жорсткого диска (HDD), а час доступу від мілісекунд до мікросекунд.

Однак для досягнення максимальної ефективності слід враховувати важливі особливості архітектури масивів all-flash для виконання робочих навантажень високопродуктивних баз даних. Щоб скористатися всіма перевагами низької латентності флеш-систем, яка становить всього частки мілісекунди, необхідна наявність чистого, оптимізованого каналу передачі даних. Взагалі важливо, щоб інші сервіси, запущені на СГД, які не погіршували швидкість доступу і продуктивність роботи системи.

СГД NetApp EF560

СГД NetApp EF560

новий масив all-flash NetApp® EF560® - ідеальне рішення для забезпечення максимальної продуктивності рішень на базі флеш-технологій при роботі з критично важливими базами даних. Нова платформа гарантує повну і стійку продуктивність, відповідну сучасним стандартам. Масив EF560 забезпечує 650 тис. Операцій введення-виведення в секунду (IOPS) в малому форм-факторі 2U, а його середній час відгуку не перевищує 800 мікросекунд - все це демонструє, наскільки важлива архітектура системи зберігання данних.Кроме того, масив EF560 втілив в собі кращі досягнення надійності та готовності, удосконалювані протягом восьми поколінь операційної системи SANtricity.

Масив EF560 розрахований на найпередовіші технології, реалізовані в високопродуктивних базах даних. Центральні процесори СГД використовуються для швидкого виконання операцій читання і запису, а ресурси хоста - для компресії даних. В процесі обробки даних ніщо не заважає операціями вводу-виводу, завдяки чому масив при навантаженні забезпечує стійку латентність, що становить всього частки мілісекунди. І на 1001-й день роботи вона залишається такою ж, як і в 1-й день.

Продуктивність БД співвідноситься з показниками диска, що дозволяє домогтися стійких, передбачуваних результатів. Оцінивши продуктивність і співвідношення «ціна-продуктивність» масиву EF560 по ряду внутрішніх показників, таких як кількість операцій введення-виведення в секунду (IOPS) і пропускна здатність, а також еталонним показниками SPC-1, ми отримали чудові результати.

Продуктивність за операціями введення-виведення

В першу чергу слід розглянути показники EF560 при робочих навантаженнях читання - найбільш часто виконувані операції з масивами all-flash. EF560 забезпечує виконання 650 тис. Безперервних операцій введення-виведення в секунду при латентності в 800 мікросекунд, займаючи в стійці всього 2 юніта (2U). У порівнянні з попередньою моделлю EF550 цей показник вдосконалений на 62,5%. Навіть при пороговому значенні продуктивності 500 мікросекунд EF560 може забезпечити 628 тис. Операцій введення-виведення в секунду.

Щоб спрогнозувати показники продуктивності планованих навантажень, ми провели більш ретельний аналіз показників продуктивності за операціями введення-виведення в секунду для масиву EF560 (тестована система: EF560 з 48 дисками SSD, пам'яттю RAID 5 і блоками даних по 8 КБ).

Таблиця 1. Продуктивність операцій введення-виведення в секунду масиву EF560 при різних робочих навантаженнях читання і запису.

Продуктивність операцій введення-виведення в секунду масиву EF560 при різних робочих навантаженнях читання і запису

Джерело: NetApp, 2015 р

Оцінка продуктивності по тесту SPC-1

Для більш ретельного аналізу пропонуємо ознайомитися з результатами тестування масиву EF560 за стандартами SPC-1 Комітету з тестування систем зберігання даних (Storage Performance Council, SPC), які моделюють умови експлуатації високопродуктивної бази даних з інтенсивними навантаженнями читання і запису (докладніше див. У розділі про тесті SPC-1 на бічній панелі). В ході тесту масиву показник EF560 склав 245 011,76 IOPS ™ (SPC-1) із середнім часом відгуку (ART) при навантаженні 100%, що дорівнює 0,93 мілісекунд, або 930 мікросекунд. При пороговому значенні продуктивності 500 мікросекунд показник EF560 склав 196 008,41 операцій введення-виведення в секунду (IOPS) SPC-1 при часу відгуку 0,53 мілісекунд (530 мікросекунд). Як правило, стандартна кількість операцій введення-виведення в секунду, необхідну замовником, становить 80-120 тис., Що відповідає характеристикам масиву EF560.

Малюнок 1. Крива часу відгуку EF560 по тесту SPC-1.

джерело: Короткий огляд EF560 за результатами тесту SPC-1

Рішення EF560 демонструє мінімальний час відгуку, передбачене тестом SPC-1 (вимірюється при навантаженні 10%) для будь-якої конфігурації згідно списками кращих результатів SPC-1 «Top Ten» при часу відгуку 0,18 мілісекунд (180 мікросекунд). Значення LRT по тесту SPC-1 передбачає мінімально можливий час відгуку для СГД. Детальніше див. У короткому огляді або повному звіті тесту SPC-1 масиву EF560.

Зменшення латентності в 20 разів і економія місця в стійці на 70%
Наскільки важливі показники швидкості операцій введення-виведення і латентності, складові частки мілісекунди? Для підвищення швидкості платіжних транзакцій і підвищення якості обслуговування клієнтів великий інтернет-магазин прийняв рішення про необхідність впровадження системи з низькою латентністю і дуже високим показником надійності системи, оскільки кожна хвилина простою значила для компанії втрату значних сум доходу. Впровадження масиву EF-Series дозволило компанії збільшити продуктивність баз даних Oracle, керуючих профілями продажів, і швидкість обробки транзакцій в 20 разів у порівнянні з попередніми показниками. Детальніше див. У історії успіху .

Співвідношення «ціна-продуктивність» по тесту SPC-1

Головною рисою тесту SPC-1 є те, що він показує вартість на операції введення-виведення в секунду ($ / SPC-1 IOPS) для кожної тестованої конфігурації. Для масиву EF560 цей показник склав 0,54 дол. США, що відповідає позиції №2 в списку кращих результатів SPC-1 по співвідношенню «ціна-продуктивність» (SPC-1 Price-Performance ™). Якщо оцінювати результати масивів із середнім часом відгуку менше мілісекунди, EF560 займає перше місце в списку.

Докладні відомості про тестування EF560 по тесту SPC-1 см. В статті блогу Dimitris Krekoukias на сайті RecoveryMonkey.org .

Пропускна спроможність

Ще одним важливим аспектом продуктивності флеш-масиву є пропускна здатність або смуга пропускання. Хоча цей показник згадується рідше, ніж кількість операцій введення-виведення в секунду, він визначає, наскільки ефективно масив виконує послідовні, а не випадкові операції читання або запису. Для всіх баз даних важливо виконання послідовних операцій (наприклад log-файли). Ефективна потокова передача при зборі даних забезпечує значні переваги для задач аналітики і вбудованих в пам'ять баз даних.

Це ще одна область, в якій масиви EF560 відрізняються від інших систем. Якщо у конкурентів пропускна здатність за операціями читання становить близько 4 ГБ / с або 8 ГБ / с, то флеш-масив EF560 здатний забезпечити значення 12 ГБ / с для читання і 6 ГБ / с для запису.

Пропускна здатність як фактор переваги для бізнесу

Щосекундний збір даних. Керівник ІТ-відділу бурового підрядника звернувся до фахівців NetApp для пошуку рішення, яке забезпечить збір даних з бурової вишки кожну секунду. Раніше дані надходили кожну хвилину, а значить, частота збору даних повинна була зрости в 60 разів. Масив EF-Series дозволив компанії вирішити цю задачу, надаючи компанії більш докладні дані для аналізу кожну секунду і полегшуючи прийняття важливих рішень.

Підвищення частоти створення звітів в 4 рази. Агентству нерухомості знадобилося підвищити продуктивність бази даних, щоб удосконалити додаток для аналітики національного ринку нерухомості, що дозволяє збирати і перекомпоновувати дані для банківської, фінансової галузі і сфери нерухомості. З впровадженням масиву EF-Series компанія має можливість отримувати актуальні дані 4 рази на день, а не один раз, як раніше, що дозволяє прискорити розгляд заявок на житлове кредитування і значно підвищити рівень обслуговування кліентов.Подробнее см. В історії успіху .

Поліпшення продуктивності EF560

Флеш-масив EF560 поєднує в собі чотири переваги, що забезпечують оптимізацію продуктивності.

  1. Підвищена швидкість центральних процесорів. EF560 пропонує нові 6-ядерні процесори Intel Xeon з частотою 2,2 ГГц, які дозволяють підвищити швидкість операцій введення-виведення майже вдвічі.
  2. Підтримка многоядерной архітектури SANtricity. Нове програмне забезпечення SANtricity 8.20 розподіляє робочі навантаження між ядрами, що, за результатами останніх тестів, сприяє підвищенню часу відгуку на 50%.
  3. Накопичувачі SSD з низькою латентністю. Ми продовжуємо застосовувати вражаючі поліпшення технології SSD, щоб за рахунок розширення дискового простору і зниження латентності домогтися мінімальної в галузі вартості операції введення-виведення в секунду.
  4. Підтримка найшвидших каналів зв'язку з мережами передачі даних. Флеш-масиви EF560 відрізняються розширеним набором додаткових коштів підключення до хосту для 8 портів SAS 12 Гбіт / с і 4 портів InfiniBand 56 Гбіт / с, на додаток до стандартних 8 портів Fibre Channel 16 Гбіт / с і 8 портів iSCSI 10 Гбіт / с.

Удосконалення керованості і готовності EF560

Покращення керованості і готовності нових флеш-масивів EF560:

  • Можливість онлайн оновлення прошивки накопичувача;
  • перенесення даних з несправного диска (drive evacuator);
  • відновлення найважливіших сегментів пулів DDP (розглянемо цю функцію детальніше).

Масиви EF560 оснащуються здвоєними контролерами dual-active, розміщеними в 2U полку з можливістю масштабування до 120 SSD-накопичувачів (в даний момент доступні конфігурації ємністю 400 ГБ, 800 ГБ і 1,6 ТБ). Кожен масив забезпечує сире дисковий простір до 192 ТБ. Накопичувачі SSD об'єднані в томи за технологією динамічних дискових пулів (Dynamic Disk Pools, DDP) або RAID рівнів 0, 1, 5, 6, і 10.

Малюнок 2. Технічні характеристики EF560.

Технічні характеристики EF560

Джерело: NetApp, 2015 р

Вибір способу захисту даних

При розробці флеш-масивів EF560 ми прагнули якнайповніше описати можливості продуктивності і робочі характеристики, щоб полегшити вибір оптимальної конфігурації з урахуванням потреб замовників. Конфігурація DDP стрімко набирає обертів, і зараз вона становить 35% від загального обсягу розгорнутих систем EF-Series, при установці яких клієнти отримують рекомендації про переваги використання DDP в порівнянні з іншими рівнями RAID для тих чи інших умов експлуатації.

Щоб вибрати оптимальний спосіб захисту даних, скористайтеся малюнком 2, на якому представлені рівні продуктивності. Оцініть вимоги вашої системи і зіставте їх з кожної схемою захисту даних. Потім виберіть рівень захисту з необхідними показниками продуктивності і дискового простору.

Малюнок 3. Продуктивність EF560 в конфігураціях з RAID5, DDP і RAID 10.

Продуктивність EF560 в конфігураціях з RAID5, DDP і RAID 10

Джерело: NetApp, 2015 р

Зверніть увагу, що цей малюнок складений з урахуванням робочого навантаження з використанням блоків даних розмірів 8 КБ, співвідношення операцій читання і запису 75% до 25%, а також порогового значення латентності 0,6 мілісекунд (600 мікросекунд). Якщо збільшити відсоток операцій записи, розділові лінії будуть переміщені вниз для кожної конфігурації.

Рішення для підвищення продуктивності баз даних - вибір адміністраторів

Висока швидкість і стійка продуктивність масиву all-flash залежить від його архітектури. Масиви EF560 відрізняються архітектурою, створеної для підвищення продуктивності, що робить їх ідеальним рішенням для роботи з критично важливими високопродуктивними базами даних. Кількість систем EF560, встановлених по всьому світу, становить близько мільйона, а рівень їх надійності можна назвати практично абсолютним (99,999%) - завдяки цьому адміністратори довіряють продуктивність своїх СГД саме цим рішенням.

ресурси

Пол Ферестен (Paul Feresten), провідний менеджер з маркетингу продуктів, і Майк Фелан (Mike Phelan), провідний менеджер по продуктах

Пол працює в компанії NetApp з 2005 р і в даний час відповідає за маркетинг продуктів, створених на базі твердотільної технології. Раніше він спеціалізувався на базовому програмному забезпеченні NetApp, включаючи Data ONTAP, безпеки в багатокористувацьких середовищах і ефективності зберігання даних. Пол має більше 30 років досвіду роботи в сфері управління, продажу та маркетингу продуктів, а також в області адміністративного управління. До приходу в NetApp Пол працював в компаніях Data General, Digital Equipment Corporation, MSI Consulting і SEPATON. Він отримав ступінь бакалавра наук в Бостонському університеті та MBA в коледжі Бабсон.

Майк прийшов у компанію NetApp в квітні 2012 р і в даний момент є менеджером по продуктам EF-Series. На попередній посаді інженера з технічного маркетингу Майк відповідав за тестування, створення матеріалів, навчання та проведення презентацій по продуктам E-Series і EF-Series. Він спеціалізувався на SSD Cashe, динамічних дискових пулах і асинхронному віддаленому створення дзеркал томів.

Tech OnTap
Підписатися
Tech OnTap - це щомісячні огляди новітніх інформаційних технологій, поради та практичні рекомендації, знайомство з інструментарієм, неформальні інтерв'ю з розробниками, демонстраційні ролики, рецензії та багато іншого.

відвідайте Tech OnTap в співтоваристві NetApp Щоб підписатись на розсилку.

Новости