Статьи

Тестування MPEG Layer 3 (MP3) кодеров

  1. Передмова
  2. Опис методу тестування
  3. опис термінів
  4. Що використовувалися формули
  5. Що використовувалися кодери
  6. AudioCatalyst by Xing Technology Corporation - version 2.1
  7. BladeEnc: Blade's MP3 Encoder - version 0.82
  8. LAME: LAME Is not an Mp3 Encoder, version 3.24
  9. MP3 Compressor v. 0.9f by MP3hC
  10. MP3 Encoder: MPEG Layer-3 Encoder V3.1 Demo by Fraunhofer IIS-A
  11. MP3 Producer: .mp3 Producer v. 2.1 (Build 47) by Fraunhofer-Gesellschaft - IIS
  12. mpegEnc: mpeg Encoder v. 0.07 by SoloH
  13. Xing: XingMP3 Encoder 1.02 by Xing Technology Corporation
  14. Xing: XingMP3 Encoder 1.5 by Xing Technology Corporation
  15. Результати тестування
  16. швидкість кодування
  17. аналіз АЧХ
  18. Посилання на всі файли в одному місці
  19. Інші коментарі
  20. Висновки
  21. AudioCatalyst
  22. Blade Encoder
  23. LAME
  24. MP3 Compressor
  25. MP3 Encoder
  26. MP3 Producer
  27. mpeg Encoder
  28. XingMP3 Encoder 1.02
  29. XingMP3 Encoder 1.5
  30. інші кодери
  31. 128 кб / с (11: 1)
  32. 160 кб / с (8: 1)
  33. 192 кб / с (7: 1)
  34. 224 кб / с (6: 1)
  35. 256 кб / с (5: 1)
  36. 320 кб / с (4: 1)
  37. ВІДПОВІДІ на запитання
  38. ПОСИЛАННЯ

Передмова

Пару слів про стиль викладу. Я хотів зробити матеріал, викладений тут, доступним для максимально великого кола читачів. Тому інформації дуже багато, і, майже напевно, її більше, ніж будь-кому потрібно. Так, наприклад, людині не досвідченому в технологіях звукозапису НЕ буде цікаво дивитися на графіки з чисто технічними характеристиками звуку; а фахівця немає потреби читати, що таке децибел. Таким чином, прошу вас, якщо вам якийсь розділ вам не цікавий, просто пропустіть його. Можливо, він буде цікавий комусь іншому.

Перш за все я хочу окреслити коло питань, які я хотів з'ясувати для себе, провівши це тестування. Я вирішив зібрати собі фонотеку і зберегти записи в форматі MP3. У зв'язку з цим у мене виникло 2 питання:

  1. Який ступеня стиснення файлів досить для збереження прийнятного рівня якості звуку?
  2. Чи можливо стиснути хоч трохи аудіо-інформацію при повному збереженні якості або з незначним погіршенням якості?

Тобто спочатку я планував зберігати аудіо-інформацію в двох копіях: одна із стисненням побільше (п. 1) - для щоденного використання, інша з претензією на максимальне збереження якості (п. 2) - для використання в будещем, скажімо, для запису вибраних пісень на CD або для переведення фонотеки на новий, більш прогресивний і якісний формат.

Таким чином відразу можна виділити мої уподобання до кодерам: швидкість роботи мене не цікавила взагалі, ступінь стиснення (а, значить, і розмір результуючого файлу) мене цікавили по стільки по скільки. Головним критерієм була якість.

Прошу вас, ще раз уважно перечитайте передмову і не задавайте мені питання типу "А чому ти не любиш Xing (як варіант: формат vqf, або ще що-небудь)? Адже він швидкий, і якість стерпне." Мене не влаштовує стерпне якість при високій швидкості, компактності та інше. Мені потрібно максимально можливу якість передачі звуку, навіть ціною розміру і швидкості кодування.

Опис методу тестування

За допомогою програми Digital Audio Copy for Win32 (WinDAC) 1.49 були створені копії 2-х записів з CD в WAV-файлах. Записи були обрані за наступними критеріями: помітне на слух наявність високочастотної складової, наявність нетривіальних стереоефектів, наявність пісень в моїй небагатій фонотеці на CD. У підсумку я вибрав Dog New Tricks від Garbage (з альбому Garbage) і Gone Away від Offpring (з альбому Americana).

Я відмінно знаю, що куди як більший динамічний діапазон звуку не у рок-музики, а у, скажімо, симфонічної музики. На жаль, її немає на CD у мене вдома. Як тільки у мене з'явиться можливість взяти десь CD з класикою у виконанні органу або симфонічного оркестру, я проведу новий етап тестів.

Потім я створював файли формату MP3 за допомогою декількох кодеров. За допомогою кожного кодера було створено кілька файлів - з усіма ступенями стиснення менше, ніж 11: 1 (128 kbps) включно, які підтримує даний кодер.

Після цього файли формату MP3 були декодовані в файли формату WAV і подальша робота велася вже з цими WAV-файлами. Це зроблено для того, щоб ліквідувати спотворення, що вносяться програвачами MP3-файлів. Для декодування MP3 використовувався декодер l3dec V2.71 ISO / MPEG Audio Layer III Software Only Decoder від Fraunhofer-IIS - організації, яка перша розробила і почала поширювати комерційний програмний кодер і декодер MP3. Популярність, яку придбав даний кодер, а також те, що Fraunhofer-IIS продає свої продукти для найсерйозніших додатків, залишає надію, що декодування файлів відбувається в суворій відповідності зі стандартом ISO MPEG (багато програвачі MP3 намагаються якось поліпшити якість звучання і єдине що у них виходить напевно - це внести додаткові спотворення). У разі, якщо файл неможливо декодувати за допомогою l3dec (деякі файли зі стисненням 4: 1, 320 kbps), використовувався WinAmp 2.24, декодер якого побудований також на основі коду від Fraunhofer-IIS.

Далі за допомогою програми CoolEdit Pro 1.1 (останнім часом - версії 1.2) аналізувалися перші 30.000 секунд кожного файлу і строілсіь амплітудно-частотні характеристики (АЧХ) окремо для лівого, правого каналів і умовного центру (суміш лівого і правого каналів в пропорції 1: 1 ). Так вже цей CoolEdit влаштований, але нормально ці АЧХ виглядають тільки в діапазоні від 350 Гц до 21.7 кГц. Для подальшого аналізу АЧХ я написав програму на мові Object Pascal в середовищі Borland Delphi 3 - програма дуже сильно прив'язана до локальної структурі каталогів і імен файлів у мене на вінчестері, тому вам напевно не вдасться запустити її відразу. Проте - ось її вихідні тексти (20.5 Kb). Програма має на вході набір копій екрану (screenshot'ов) з CoolEdit'а з АЧХ, а на виході створює набір більш-менш оформлених малюнків з цими АЧХ і графіки порівняння АЧХ оригінального запису з CD з АЧХ файлу MP3. Саме ці графіки найбільш наочно представляють інформацію про якість кодування, саме вони і представлені на цій сторінці. Втім, за допомогою посилань ви зможете отримати доступ до всіх графіків і АЧХ.

Програма використовує нескладні формули, які описані в відповідному розділі .

опис термінів

Термін Опис Кодер (англ. Coder, encoder) Програма і / або пристрій, що використовуються для перетворення інформації з одного виду в інший (кодування). Ми розглядаємо програми, які перетворять аудіо-дані з формату PCM WAV в ISO MPEG Audio Layer III (MP3). Декодер (англ. Decoder) По суті те саме, що і кодер, але здійснює перетворення в зворотному напрямку. Кодек (англ. Codec) Кодер і декодер в одному блоці. Ступінь стиснення Ставлення розміру вхідного (некодованого) файлу до розміру вихідного (кодованого) файлу. Наприклад, ступінь стиснення 11: 1 означає, що закодований файл в 12 разів менше оригіналу. Бітрейт (англ. Bitrate) Кількість біт, відведений для запису одиниці часу аудіо-інформації. Вимірюють зазвичай в кб / с, тобто кілобіт в секунду (англ. Kb / s або kbps). Децибел (англ. Decibell, позначу. ДБ, dB) Одиниця виміру будь-яких величин. Дуже часто використовується в звукотехніці через особливості сприйняття звуків людиною. За опреленного значення величини в децибеллах одно двадцяти логарифмам відносини величини в звичайних одиницях до якоїсь опорної величиною в звичайних одиницях. У звукотехніці часто в якості опроно величини береться максимальний рівень звуку, таким чином якщо позначити нашу величину як Ux, формула для визначення цієї ж величини в децибеллах запишеться як Значення величини в децибеллах виходить негативним. Особливість людського слуху в тому, що звук в -40 дБ здається в 2 рази тихіше, ніж звук в -20 дБ, хоча очевидно (див. Формулу), що величина U40, яка описувала цей звук (напр. Потужність звукового потоку), в 100 раз менше величини U20. Виходить що "вухо чує в децибеллах". Логарифмічна шкала Шкала, в якій величини, відповідні сусіднім позначок, розрізняються не на однакову величину (як це робиться зазвичай - лінійна шкала), а в однакове число раз. Зрозуміло, що при цьому логарифми ці величин будуть відрізнятися на однакові величини - звідки і пішла назва. Особливість людського слуху добре демонструється музичним рядом: частота зауков, що відповідають одній і тій же ноті з двох сусідніх октав, розрізняються в 2 рази. Таким чином для того, щоб позначки, відповідні октавах, відстояли на одному і тому ж відстані один від одного на графіку, шкала по частоті повинна бути логарифмічною і частоти, відповідні позначок, повинні відрізнятися в 2 рази. Якщо нанести ще позначки - посередині між уже наявними - то частота, відповідна двом сусіднім позначок буде відрізнятися в раз - саме так і зроблено на наведених нижче на цій сторінці графіках з логарифмічною шкалою. (В графіках, доданих при оновленні сторінки, використовується шкала вдвічі дрібніше - значення сусідніх відміток розрізняються в 21/4 рази.) АЧХ (амплітудно-частотна характеристика, англ. AFG, amptitude to frequency graph) Залежність рівня сигналу від частоти сигналу. Через те, що рівень може вимірюватися і в одиницях потужності звукового потоку, і в одиницях електричної напруги (по відношенню до електричного поданням цього ж сигналу в схемах, скажімо, підсилювача), і багато чого ще; а також з огляду на особливості людського слуху (див. децибел), рівень сигналу часто вимірюють в дБ і не конкретизують, про рівень чого (гучності, напруги) йдеться. АЧХ можна побудувати у вигляді графіка.

Нагадаю, що стандарт ISO MPEG Audio Layer III передбачає стиснення з втратами якості, причому втрати тим більше, чим більше ступінь стиснення. Між ступенями стиснення і бітрейтами існує регламентована стандартом однозначна залежність:

Ступінь стиснення Бітрейт 11: 1 128 кб / с 8: 1 160 кб / с 7: 1 192 кб / с 6: 1 224 кб / с 5: 1 256 кб / с 4: 1 до 320 Кб / с

(Таблиця неповна, тут перераховані тільки бітрейти, які я використовував в тестуванні. Таблицю складено в припущенні, що на вхід подаються звукові дані в форматі PCM 16 біт, стерео, з частотою дискретизації 44 кГц.)

Що використовувалися формули

Як уже згадувалося, найбільш наочно інформація про якість кодування показана на графіках, де порівнюються АЧХ оригінального і закодованого файлів. З огляду на те, що CoolEdit будує АЧХ в дБ, нетривіально як порівнювати величини з АЧХ. Тим більше, що результуючі графіки я хотів теж побудувати в дБ: відношення рівня сигналу закодованого файлу до рівня сигналу оригіналу.

Позначимо рівень сигналу як Ux. Нас интерисует величина

Ця ж величина в дБ дорівнює

Виконаємо прості математичні перетворення в (2):

Вважаючи, що

отримаємо

Строго кажучи, у нас немає ніяких підстав вважати, що (4) вірно. Але, з огляду на те, що в обидві частини рівності відносяться до однієї і тієї ж записи (оригінальний варіант і закодований), будемо вважати що при кодуванні максимальний рівень сигналу не змінюється або майже не змінюється.

Таким чином ми отримали зручну формулу (5) для аналізу АЧХ і побудови цікавлять нас залежностей. Формула (5) використовується в програмі для аналізу АЧХ, яка згадана вище.

Що використовувалися кодери

На сьогоднішній день існує 3 основних джерела, які створили програми для кодування музики в MP3. Це вже згадуваний Fraunhofer-IIS, Xing Technologies і власне ISO, яка доклала до стандарту ISO MPEG демонстраційний вільно розповсюджуваний (але вельми повільний) код. Левова частка створених на сьогодні кодеров використовує код однієї з цих організацій. Кодери на основі коду від Fraunhofer-IIS працюють досить швидко, досить якісно, ​​але не забезпечують ступінь стиснення 4: 1 (320 кб / с). Кодери на основі коду від Xing швидкі але некачственни. Кодери на основі коду від ISO дуже повільні (демонстраційний код зовсім оптимізований), забезпечують високу якість і ступеня стиснення аж до 4: 1. Отже:

AudioCatalyst by Xing Technology Corporation - version 2.1

Комерційний кодер від Xing Technology Corp. Вельми оригінальна програма: являє собою оригінальний код від Xing Tech в режимі "без високих частот" і код від Fraunhofer'а оптимізований по швидкості (якість, відповідно впало, але все ж краще чистого Xing'а) в режимі "збереження високих частот". Все це - в одному блоці з програмою для копіювання музики з CD - AudioGrabber. Працює дуже швидко, але якість залишає бажати кращого, хоча знову ж таки: при "збереженні високих частот" якість краще оригінального Xing'а, хоча і до Fraunhofer'а не дотягує. Домашня сторінка - www.xingtech.com . Інтерфейс програми повністю запозичений у AudioGrabber'а.

BladeEnc: Blade's MP3 Encoder - version 0.82

Вільно розповсюджуваний кодер, написаний Торд Янсоном (Tord Jansson). Являє собою оптимізований код від ISO. Працює швидше, ніж "чистий" ISO-код, але в інтернеті є повідомлення про некоректну роботу на ступеня стиснення 11: 1 (128 кб / с). Домашня сторінка - bladeenc.cjb.net . Інтерфейс програми тільки з командного рядка, але в інтернеті є повно програм-оболонок до Blade. Я використовував Bladebatch 2.97 SE Євгена Логінова, теж вільно-розповсюджувана програма, домашня сторінка на eal.da.ru .

LAME: LAME Is not an Mp3 Encoder, version 3.24

Вільно розповсюджуваний патч для вихідного коду ISO, що розробляється групою ентузіастів. Являє собою оптимізований код від ISO. Поширюється у вигляді набору вихідних файлів, які є доповненнями і виправленнями вихідного коду ISO (Це зроблено для обходу законів про ліцензування програм кодування MP3 фірмою Fraunhofer. Адже LAME це не програма, це набір початкових кодів, значить її не можна заборонити до вільному поширенню :) Тим не Проте в інтернеті легко знайти вже компіляція варіанти LAME під будь-яку ОС.). Працює швидше і якісніше, ніж "чистий" ISO-код. Домашня сторінка - www.sulaco.org/mp3 . Інтерфейс програми тільки з командного рядка.

Примітка: цей кодер тестувався в двох режимах: з включеною і з виключеною псіхоаккустіческой моделлю (LAME -f). Це не 2 різних кодера, а всього лише 2 режиму роботи одного кодера, хоча вони і відрізняються по результату.

MP3 Compressor v. 0.9f by MP3hC

Вільно розповсюджуваний кодер на основі коду від Fraunhofer IIS, написаний якимось MP3hC. Є подальшим розвитком l3enc - а саме переписана версія того ж алгоритму. За рахунок оптимізації програма працює в 3 рази швидше (зі слів автора). Підтримує тільки ступінь стиснення 11: 1 (128 кб / с). Веб сторінка - www.chez.com/mp3hc/ . Інтерфейс програми дуже зручний і має унікальну в своєму роді можливість зміни пріоритету виконання програми кодування безпосередньо під час кодування файлів.

MP3 Encoder: MPEG Layer-3 Encoder V3.1 Demo by Fraunhofer IIS-A

Вільно розповсюджувана демо-версія комерційного кодера від Fraunhofer IIS. Є подальшим розвитком l3enc, який згадувався вище. Не підтримує ступінь стиснення 4: 1 (320 кб / с). Веб сторінка - www.iis.fhg.de/audio/ . Інтерфейс програми тільки з командного рядка, але в інтернеті є повно програм-оболонок. Я створював звичайні пакетні (batch, * .bat) файли. Ця демо-версія кодує тільки перші 30 секунд файлу.

MP3 Producer: .mp3 Producer v. 2.1 (Build 47) by Fraunhofer-Gesellschaft - IIS

Комерційний кодер від Fraunhofer IIS. Є подальшим розвитком l3enc, який згадувався вище, але пішов від нього дуже і дуже далеко. Не підтримує ступінь стиснення 4: 1 (320 кб / с). Веб сторінка - www.iis.fhg.de/audio/ . Інтерфейс програми не найкращий, але все ж краще, ніж командний рядок.

mpegEnc: mpeg Encoder v. 0.07 by SoloH

Вільно розповсюджуваний кодер, написаний якимось SoloH. Являє собою оригінальний код від ISO. Працює повільно, але точно якісно. Домашня сторінка - www.isafeelin.org/soloh/mpegEnc.html . Інтерфейс програми дуже і дуже хороший.

Xing: XingMP3 Encoder 1.02 by Xing Technology Corporation

Комерційний кодер від Xing Technology Corp. Являє собою оригінальний код від Xing Tech. Працює дуже швидко, але якість залишає бажати кращого. Домашня сторінка - www.xingtech.com . Інтерфейс програми досить оригінальний але не дуже зручний.

Xing: XingMP3 Encoder 1.5 by Xing Technology Corporation

Нова версія комерційного кодера від Xing Technology Corp. Оригінальний код від Xing Tech. Працює дуже швидко, але якість залишає бажати кращого - за час з виходу Попереднє версії був введений режим "збереження високих частот", але і він не рятує положення, хоч все-таки високих частот трохи додає. Домашня сторінка - www.xingtech.com . Інтерфейс програми зовсім Изме.

Результати тестування

підтримка бітрейтів

Ступінь стиснення і бітрейт 11: 1 8: 1 7: 1 6: 1 5: 1 4: 1 128 кб / с 160 кб / с 192 кб / с 224 кб / с 256 кб / с 320 кб / с AudioCatalyst да да да да да да Blade Enc. да да да да да да LAME так так так так так так MP3 Compr. так ні ні ні ні ні MP3 Enc. да да да да да немає MP3 Producer так так так ні так ні mpeg Enc. да да да да да да XingMP3 Enc. 1.02 так ні так ні ні так XingMP3 Enc. 1.5 так так так так так так

Підтримка стерео режимів

За стандартом ISO MPEG існує кілька способів кодування стерео сигналів:

Dual chanel або
dual mono або
dual stereo Лівий і правий канали кодуються роздільно як 2 різних записи, на кожен з каналів відводиться рівно половина місця в результуючому файлі. Stereo Лівий і правий канали кодуються роздільно як 2 різних записи, але кодер може виділити одному з каналів в даний момент часу більше місця - це робиться для того, щоб уникнути кодування тиші в одному каналі, якщо в другому є сигнал. Оптимальний варіант. Joint stereo Лівий і правий канали кодуються разом, а в результуючий файл записується інформація про двох каналах в нетривіальною формі, наприклад: лівий канал і відміну правого каналу від лівого (на 2-у частину віддається менше місця). Є кілька стандартів подання інформації joint stereo, але всіх їх об'єднує істотний недолік: погана передача стерео ефектів, зокрема псується фазова інформація.

Деякі кодери дозволяють в явному вигляді вибирати режим кодування стерео сигналу, інші вибирають автоматично. Следуюший таблиця ілюструє це:

Ступінь стиснення і бітрейт 11: 1 8: 1 7: 1 6: 1 5: 1 4: 1 128 кб / с 160 кб / с 192 кб / с 224 кб / с 256 кб / с 320 кб / с AudioCatalyst JS S JS S JS S JS S JS S JS Blade Enc. S S S S S S LAME S JS S JS S JS S JS S JS S JS MP3 Compr. JS - - - - - MP3 Enc. JS S S S S - MP3 Producer JS JS JS - S - mpeg Enc. S DC S DC S DC S DC S DC S DC XingMP3 Enc. 1.02 S - S - - S XingMP3 Enc. 1.5 S JS S JS S JS S JS S JS S JS

Позначення: JS - joint stereo, S - stereo, DC - dual chanel; якщо вказано кілька значень, значить програма допускає вибір режиму. Першим вказано режим використовувався при тестуванні.

швидкість кодування

Як я вже говорив, для мене цей параметр не критичний: якщо програма працює якісно, ​​то я згоден почекати. Проте, для того, щоб тестування було більш повним, я протестував і продуктивність кодеров.

Для тестування швидкості кодування я відрізав по 30.000 секунд від WAV-файлів із записом пісень з CD. У таблиці наведено час кодування 30 секунд пісні Garbage, нижче - Offspring'а. Всі тести проведені на моєму домашньому комп'ютері (Pentium 60 МГц, ОЗУ 24 МБ, ОС Windows 98). Під час тестування запущені тільки 2 програми - "Властивості: Дата і час" з "Панелі управління" (там годинник з секундоміром) і кодер (на передньому плані). Якщо програма поддержавает вибір пріоритету виконання операції кодування, то вибирався пріоритет Normal.

Ступінь стиснення і бітрейт 11: 1 8: 1 7: 1 6: 1 5: 1 4: 1 128 кб / с 160 кб / с 192 кб / с 224 кб / с 256 кб / с 320 кб / с AudioCatalyst 0:36
0:36 0:37
0:37 0:37
0:37 0:37
0:37 0:39
0:38 0:40
0:38 Blade Enc. 4:35
4:35 4:04
4:12 3:59
4:01 3:53
3:56 3:49
3:51 3:49
3:54 LAME 3:21
3:21 2:58
3:01 2:41
2:48 2:32
2:32 2:29
2:27 2:28
2:26 LAME -f 1:22
1:20 1:25
1:24 1:27
1:25 1:28
1:27 1:29
1:28 1:31
1:30 MP3 Compr. 2:09
2:01 - - - - - MP3 Enc. 19:14
18:38 22:25
22:17 13:55
14:27 19:09
18:08 10:32
9:52 - MP3 Producer 5:23
4:07 6:05
4:44 5:48
5:14 - 4:58
4:18 - mpeg Enc. 24:16
23:58 19:43
20:42 17:18
17:32 15:36
15:33 14:59
14:54 14:14
14:39 XingMP3 Enc. 1.02 0:40
0:41 - 0:40
0:41 - - 0:44
0:44 XingMP3 Enc. 1.5 0:36
0:37 0:37
0:37 0:37
0:37 0:37
0:37 0:39
0:37 0:40
0:38

Нижче ці ж дані наведені в більш наочній формі - на гістрограмме відкладені середні по двом уривків пісень часів кодування.

Швидкість роботи AudioCatalyst 2.1 і XingMP3 Encoder 1.5 повністю збігається.

аналіз АЧХ

Це, власне, основний розділ, заради якого я і почав проводити тестування. Він вийшов великим, тому я виніс його на окрему сторінку . Якщо вас цікавлять тільки результати тестування і вам не цікаво, звідки вони взялися - ви можете пропустити розділ з аналізом і читати відразу висновки.

Посилання на всі файли в одному місці

З огляду на величезний обсяг інформації на цій сторінці мені здалося, що такий розділ не буде зайвим. Навіть сам розділ зі посиланнях виявився настільки великим, що я виніс його на окрему сторінку .

Інші коментарі

Крім якості відтворення АЧХ на якість звучання впливає ще багато факторів, наприклад, відтворення дрібних деталей, передача фазової інформації (що Xing зробив з голосу з луною в Gone Away - це треба чути !!), так що я від коментарів утримаюся. Розповідати, що "звучання того-то і того-то більш соковито" я не буду, бо вважаю це спробою описати невимовне. Тільки в висновках я буду посилатися на свої враження. А вам раджу послухати самим і для себе вирішити самостійно.

Висновки

Ще раз зауважу: я не претендую на істину в останній інстанції. Все, що написано в цьому розділі - лише моя думка. Правда, думка це базується на аргументах, в даному випадку - результати тестування. Проте, на цій сторінці я представляю все результати тестування для того, щоб ви могли на підставі тих же даних скласти свою думку.

Як показала практика, навіть такий грубий методу як порівняння АЧХ дає непогані результати - все що явно чутно на слух (напр. Мало високих, дзвін ISO-кодерів) відмінно відображено на графіках. Так що можна вважати, що за допомогою графіків можна порівнювати якість кодування навіть там, де на слух різниці не чути. Проти аргументу "це ж кодування з втратами - яка до біса точна передача сигналу!" Я можу заперечити наступне - в ході вимірювань робилося усереднення по досить великому уривку (30 сек), який містив і тишу (початок пісні) і гучну музику з заповненням всього частотного діапазону. По-моєму таке усереднення за часом і визначило дуже добре узгоджуються з оцінкою "на слух" результати.

AudioCatalyst

Швидкість понад усе. Страждає, природно, якість. Проте якщо порівнювати з XingMP3 Encoder'ом - то якість помітно краще (в режимі "збереження високих частот", коли працює код Fraunhofer'а). На високих бітрейтах високі частоти не так однозначно вирізаються - і зрозуміло чому. Якість при всіх бітрейтах на слух відчутно гірше всіх інших кодерів (навіть від того ж Fraunhofer'а - адже код явно був оптимізований по швидкості з втратами якості), крім, природно, XingMP3 Encoder'а. Так, якість при 320 кб / с порівняно з 192 кб / с ISO-кодерів. До речі, за рахунок використання стороннього коду немає старих помилок Xing'а - страшних спотворень фазового інформації. До речі, навіть новий XingMP3 грішить цим. Швидкість стала ще більше в порівнянні, знову ж таки, з XingMP3 Encoder'ом 1.02 і дорівнює швидкості XingMP3 Encoder'а 1.5. Кодер явно розрахований на тих, хто хоче швидко отримати результат, нехай навіть не найкращий.

Blade Encoder

Швидкий кодер. Заснований на коді від ISO, звідси його властивості: високу якість на високих бітрейтах і характерний дзвін на низьких (128 кб / с). Крім того Blade містить помилку, яка дає себе знати добре чутними спотвореннями на 128 кб / с. Усунений основний недолік коду ISO - повільність. Blade працює в 3 - 6 разів швидше, ніж mpeg Encoder, який побудований на оригінальному неоптимізованими ISO-коді. Якість кодування поступається mpeg Encoder'у, однак різниця мізерна (на слух не воспринемается) і якщо врахувати різницю в швидкості роботи, то Blade стає дуже привабливим вибором для бітрейтів вище 192 кб / с.

LAME

Дуже швидкий кодер. Заснований на коді від ISO, відповідно його властивості: високу якість на високих бітрейтах і характерний дзвін на низьких (128 кб / с). Природно, немає помилки Blade, яка дає себе знати на 128 кб / с. Усунений основний недолік коду ISO - повільність. Працює в 1,5 рази швидше Blade (а в режимі -f - в 2.5 рази!), А якість вища, ніж у mpeg Encoder'а, який побудований на оригінальному неоптимізованими ISO-коді. (Режимі -f відключає псіхоаккустіческіе фільтри, що робить звук чистішим на високих бітрейтах, але істотно погіршує на низьких.) Перший кодер, який при відмінній якості звуку порівняємо з Xing'ом по швидкості. Однозначно кращий вибір для високих бітрейтів - 224 кб / с і вище.

MP3 Compressor

Швидкий кодер. Заснований на коді від Fraunhofer-IIS, звідси його властивості: високу якість на 128 кб / с. Кодер працює в 9 разів швидше, ніж старенький MP3 Encoder і в 2 рази швидше нового MP3 Producer'а. Приблизно на стільки ж MP3 Compressor швидше, ніж Blade. Якість кодування дещо поступається MP3 Producer'у, іноді проявляється добре чутні огріхи, яких у Producer'а немає. Якщо врахувати його швидкість кодування - хороший вибір для 128 кб / с.

MP3 Encoder

Продовження старої лінії кодеров від Fraunhofer-IIS l3enc. Працює повільно (в 2-4 рази повільніше, ніж новий MP3 Producer того ж Fraunhofer'а), кодує не надто якісно, ​​інтерфейс незручний. Динозавр, вимираючий вид. До використання вкрай не рекомендується.

MP3 Producer

Нова лінія кодеров від Fraunhofer-IIS. Працює швидко (в 2-4 рази швидше, ніж старий MP3 Encoder того ж Fraunhofer'а; порівняємо по швидкості з Blade), кодує дуже якісно на низьких бітрейтах (128 кб / с і, ймовірно, нижче). Ось вона, відома псіхоаккустіческая модель Fraunhofer'а! На високих бітрейтах (від 160 кб / с і вище) явно поступається кодерам на основі ISO-коду. Рекомендується для низьких бітрейтів (160 кб / с і нижче).

mpeg Encoder

Заснований на оригінальному неоптимізованими коді від ISO, звідси його властивості: високу якість на високих бітрейтах і мало високих частот на низьких (128 кб / с). Працює в 3 - 6 разів повільніше, ніж Blade, який побудований на оптимизирования ISO-коді. Якість кодування відмінне на високих бітрейтах. Для тих, кому потрібна якість без компромісів не дивлячись на швидкість роботи.

XingMP3 Encoder 1.02

Швидкість понад усе. Страждає, природно, якість. Всі високі частоти нещадно ріжуться. Звичайно, якість при 320 кб / с краще ніж при 128 кб / с, але навіть тоді воно ледве дотягує до 192 кб / с ISO-кодерів. Порівнювати швидкість з іншими кодерами марно - тут Xing поза конкуренцією. Хоча ... Швидкість LAME в режимі -f всього вдвічі менше. Кодер явно розрахований на тих, хто хоче швидко отримати результат, нехай навіть поганий.

XingMP3 Encoder 1.5

Нічого сказати. За весь час з моменту виходу попередньої версії практично ніяких змін. Ось тільки швидкість роботи ще більше, так доданий режим "збереження високих частот", який зберігає високих частот більше, але зовсім не на багато. До рівня якості будь-якого іншого кодера Xing'у як до неба рачки (українське прислів'я :).

інші кодери

З відомих кодеров я можу назвати ще Audioactive. Поширена також так звана Radium-optimized версія MP3 Producer'а. Audioactive містить незмінений блок кодування то Fraunhofer-IIS, тому від нього нерозумно очікувати характеристики, відмінні від MP3 Producer'а. Більш того, я сам це перевірив і переконався в ідентичності результатів. Правда, у Audioactive є швидкий режим, коли він працює майже вдвічі швидше, але якість, природно, погіршується. Саме тому я не тестував цей кодер. Механізм VBR я теж не тестував з ідеологічних міркувань - змінний бітрейт покликаний зменшити розмір файлу при збереженні майже такої ж якості. Очевидно, що якщо бітрейт не зменшується, то якість буде вищою, ніж з VBR. Radium-optimized MP3 Producer працює трохи швидше (десь на 20%), ніж оригінальний MP3 Producer, але в інтернеті є повідомлення про помилки, які призводять до зниження якості кодування. Так що я б заради цих 20% швидкості не ризикував якістю.

Взагалі, на сьогодні практично всі кодери засновані на коді або від ISO, або від Fraunhofer'а, або від Xing'а. Відповідно і властивості цих програм успадковуються разом з кодом.

128 кб / с (11: 1)

Найпопулярніший на сьогодні бітрейт. Ступінь стиснення 11: 1 - це, звичайно, аргумент, особливо для Інтернету, де кожен кілобайт на рахунку. Використовуючи цей бітрейт можете забути, що таке "високі частоти". Це не означає, що їх немає зовсім. Вони залишені в такому обсязі, що музика звучить як в дешевому магнітофоні - "штоб свистіло і бумкает". До речі, той, хто сказав що при цьому бітрейте зберігається якість звучання CD очевидно мав на увазі, що на вашому комп'ютері з маленькими-благенькими Колоночки (а то і взагалі вбудованими колонками, наприклад в клавіатуру) ви не відчуєте різниці в якості звучання CD і файлу MP3 з 128 кб / с. (Думка це не моя, то, по-моєму, абсолютно точно описує стан речей.)

На 128 кб / с краще поводяться кодери від Fraunhofer-IIS - вони залишають більше високих частот, ніж кодери ISO і, тим більше, Xing. Але дива не буде: більше це не означає "відтворює ідеально". Якість все одно залишає бажати багато кращого. Все ISO кодери як один додають характерний дзвін, наявність якого пов'язане з обобенностью псіхоаккустіческіх фільтрів ISO - якщо фільтр відключити (LAME -f), то дзвін зникне (хоча якість залишиться істотно гірше кодеров від Fraunhofer). На цьому бітрейте просто відмінно себе показав MP3 Producer, спеціально оптимізований під низькі бітрейти.

160 кб / с (8: 1)

Краще, ніж 128 кб / с. Але все одно чути істотний недолік високих частот. На цьому бітрейте себе краще проявили кодери від Fraunhofer - ISO кодери продовжують "дзвеніти", хоча і менше. Вибирати доводиться між кодерами від Fraunhofer, тому вибір - більш новий MP3 Producer.

192 кб / с (7: 1)

Все ще відчувається брак високих частот. Кодери від від Fraunhofer прибирають високих більше, ніж кодери ISO, які все ще злегка "дзвенять". На цьому бітрейте кодери від ISO і від Fraunhofer практично на рівних - і у тих гріхи, і у тих. Вибір за вами.

224 кб / с (6: 1)

Високі частоти передаються в майже повному обсязі, але дрібні деталі, як то: стерео ефекти або невеликі перепади гучності, на високих частотах губляться. MP3 Producer 224 кб / с не вміє, а старий MP3 Encoder істотно гірше за якістю, ніж кодери ISO. А серед кодеров від ISO, якість яких майже однаково, є явний лідер - LAME (особливо в режимі -f, коли якість його звучання, судячи з графіками - на слух цього не чути, - трохи краще за інших кодерів).

256 кб / с (5: 1)

Ось тут я зовсім перестаю відчувати різницю між записом з CD і MP3-файлами. Крім MP3 Producer'а - він з'їдає більше високих частот і його MP3 все таки відрізняється від CD. Все ISO-кодери забезпечують на слух однакову якість, за графіками місця розподілилися так: LAME -f, LAME, mpeg Encoder, Blade.

320 кб / с (4: 1)

Ось цього я вже не розумію. Це що, спроба бути святішим за Папу Римського? Ну немає різниці на слух між ISO 256 кб / с і CD. Навіщо ж 320? У розрахунку на тих, хто цю різницю почує? Так ці напевно віддадуть перевагу все таки CD, який, як традиційно вважається, забезпечує якість Hi-Fi. Адже навіть 320 кб / с дає завал в -6 дБ на рівні в 21 кГц, а -6 дБ - це легко сприймається на слух різниця рівнів. Правда, далеко не всі чують звуки з частотою в 21 кГц (ваш покірний слуга вже ледве-ледве розрізняє тон в 19 кГц). Але по-перше, прийнято вважати, що навіть якщо людина настільки високочастотний звук і не чує, він його все одно якось вопрінімать. А по-друге, той, кому необхідно якість Hi-Fi, або чує ці 21 кГц, або з принципу не погодиться на -6 дБ. До речі, Fraunhofer, очевидно, зі мною солідарна і тому 320 кб / с не підтримує. Так що якщо ви вибрали 320 кб / с - ви хотіти якості за всяку ціну. І тут ISO-кодери забезпечують на слух однакову якість, судячи з графіками місця розподілилися так: LAME -f, LAME, mpeg Encoder, Blade.

ВІДПОВІДІ на запитання

На початку цієї статті я сформулював 2 питання, які я поставив перед собою перед початком тестування. Тепер, після закінчення тестів, брешемо на них відповісти.

Питання: Який ступеня стиснення файлів досить для збереження прийнятного рівня якості звуку? Відповідь: Залежить, звичайно, від того, що називати прийнятним рівнем. Якщо мати на увазі під цим відсутність чутних на слух спотворень - то 256 кб / с, ISO кодер. Якщо досить якості середньої руки магнітофона, то досить 224 кб / с, може навіть 192 кб / с. Ну а якщо колонки вашого комп'ютера відтворюють CD як MP3 файл з 128 кб / с, то 128 кб / с - якраз для вас. Мій особистий вибір - 256 кб / с, LAME -f. (Спеціальна подяка Михайлу Федотову, який звернув мою увагу на цей дійсно відмінний кодер.) Питання: Чи можливо стиснути хоч трохи аудіо-інформацію при повному збереженні якості або з незначним погіршенням якості? Відповідь: Чуть-чуть стиснути завжди можна. Взяти WAV-файл і стиснути, скажімо, ZIP-ом або RAR-ом. Як показує практика при такому стискуванні обсяг аудіо-даних можна скоротити на 30 - 40%. Тепер про стиснення з втратами, а саме - MP3. Коли мова йде про збереження якості, навіть я проти втрати 6 дБ на 21 кГц. Ідеологія Hi-Fi не дозволяє (кіт не знає: це скорочення від High Fidelity - висока точність). Є CD, який теоретично може давати сигнал / шум в 96 дБ. Є стиснення MP3, яке запис з CD однозначно зіпсує. Так що на сучасному етапі для високоякісного зберігання аудіо інформації MP3 використовувати не можна. Як мінімум CD з його форматом PCM, 16 біт, стерео, частота дискретизації - 44100 Гц. Як максимум - ... Тут максимуму по-моєму немає :) Кому потрібна висока якість, той буде використовувати PCM і з 32 біт на відлік (більше, в загальному, сенсу немає), і більше двох каналів, і більші частоти дісретізаціі (новий стандарт DVD -audio передбачає не те 96, не те 128 кГц).

ПОСИЛАННЯ

bladeenc.cjb.net Сторінка автора Blade Encoder'а. eal.da.ru Сторінка автора BladeBatch'а. www.sulaco.org/mp3 Сторінка проекту LAME. hwww.chez.com/mp3hc/ Сторінка автора MP3 Compressor'а. www.iis.fhg.de/audio/ Сторінка Fraunhofer-Gesellschaft - IIS. www.xingtech.com Сторінка Xing Technology Corporation. move.to/mp3soft Сторінка MP3 Soft - відмінний збірник софта для роботи зі звуком - кодери, декодери, програвачі, редактори, грабери, інше. www.download.com Download.com - заходите і тисніть на посилання "MP3" - отримаєте непоганий набір посилань на софт для роботи з MP3. "Сторінка MP3" Михайла Федотова Багато інформації про MP3 взагалі, про кодерах, декодерах, програвачах, тестуваннях, багато посилань, кілька перекладів статей з англійської. Все по-російськи. Настійно рекомендую до ознайомлення. Для ентузіастів - MP3 Forum .

М-да, негусто з посиланнями. Ну нічого, менше часу витратите лазаючі по ним. А, якщо чесно, я не бачив в Мережі оглядів або тестувань, присвячений саме якості кодування. Якщо знайдете - пишіть мені: буде цікаво поглянути.

Поширення посилання на цю сторінку вітається, особливо якщо ви повідомите про неї людям, що тримає сайти по MP3.

Чи можливо стиснути хоч трохи аудіо-інформацію при повному збереженні якості або з незначним погіршенням якості?
Прошу вас, ще раз уважно перечитайте передмову і не задавайте мені питання типу "А чому ти не любиш Xing (як варіант: формат vqf, або ще що-небудь)?
Це що, спроба бути святішим за Папу Римського?
Навіщо ж 320?
У розрахунку на тих, хто цю різницю почує?
Питання: Який ступеня стиснення файлів досить для збереження прийнятного рівня якості звуку?

Новости