Всё для Учёбы — студенческий файлообменник
1 монета
doc

Студенческий документ № 091366 из МЭГУ

УДК 517:519

ВОЛЬСЬКИЙ А.В.

ДОСЛІДЖЕННЯ МЕТОДІВ ОБРОБКИ ЦИФРОВОГО ЗВУКУ.

Метою даної роботи є дослідженні цифрового звуку як явища, технологій його обробки, а також методів реалізації програмного засобу для обробки цифрового звуку.

Вступ.

Цифровий звук (англ. Digital audio) - термін, що уживається на окреслення цифрових технологій роботи зі звуком. У вузькому сенсі слова, цифровий звук являє собою цифровий сигнал, в якому закодовано звук. В більш широкому сенсі поняття цифровий звук охоплює також цифрові технології обробки, зберігання та відтворення звуку. Цифровий звук принципово відрізняється від аналогового.[1]

Як правило, цифровий сигнал отримують з аналогового шляхом його конвертації у цифровий. Цей процес називається оцифруванням (оцифровуванням) і здійснюється за допомогою аналогово-цифрового перетворювача (АЦП). В музичній практиці використовують однак і сигнали, що мають винятково цифрове походження, наприклад, згенеровані на цифрових синтезаторах, в цьому випадку аналогово-цифрове перетворення не здійснюється.

Дана стаття присвячена тематиці досліджень, проведених в рамках магістерської роботи. Мета даної магістерської роботи полягає в дослідженні цифрового звуку як явища, технологій його обробки, а також в розробці програмного засобу для обробки цифрового звуку.

Актуальність даної роботи визначена невпинним ростом популярності цифрового формату звуку, а отже, потребою в програмних засобах, які дозволяють проводити обробку цифрового звуку.

Новизна даної роботи полягає у комплексному застосуванні алгоритмів оброки цифрового звуку з використанням відповідних методів наближених обчислень разом із ергономічним інтерфейсом, орієнтованим на інтуїтивне сприйняття та когнітивне самонавчання користувача.

Технології кодування цифрового сигналу. Цифрове представлення електричних сигналів покликане внести в них надмірність, що оберігає їх від дії паразитних перешкод. Для цього на несучий електричний сигнал накладаються серйозні обмеження - його амплітуда може приймати тільки два граничні значення - 0 і 1.[2]

Вся зона можливих амплітуд в цьому випадку ділиться на три зони: нижня представляє нульові значення, верхня - одиничні, а проміжна є забороненою - всередину неї можуть потрапляти тільки перешкоди. Таким чином, будь-яка перешкода, амплітуда якої менше половини амплітуди несучого сигналу, не робить впливу на правильність передачі значень 0 і 1. Перешкоди з більшою амплітудою також не роблять впливу, якщо тривалість імпульсу перешкоди відчутно менше тривалості інформаційного імпульсу, а на вході приймача встановлений фільтр імпульсних перешкод.

Сформований таким чином цифровий сигнал може переносити будь-яку корисну інформацію, яка закодована у вигляді послідовності бітів - нулів і одиниць; окремим випадком такої інформації є електричні і звукові сигнали. Тут кількість інформації в несучому цифровому сигналі значно більше, ніж в кодованому початковому, так що несучий сигнал має певну надмірність щодо початкового, і будь-які спотворення форми кривої несучого сигналу, при яких ще зберігається здатність приймача правильно розрізняти нулі і одиниці, не впливають на достовірність передаваної цим сигналом інформації. Проте у разі дії значних перешкод форма сигналу може спотворюватися настільки, що точна передача переносимої інформації стає неможливою - в ній з'являються помилки, які при простому способі кодування приймач не зможе не тільки виправити, але і знайти.

Згідно теореми Котельникова, будь-який безперервний процес з обмеженим спектром може бути повністю описаний дискретною послідовністю його миттєвих значень, наступних з частотою, як мінімум удвічі перевищуючої частоту щонайвищої гармоніки процесу; частота Fd вибірки миттєвих значень (відліків) називається частотою дискретизації. [3]

З теореми виходить, що сигнал з частотою Fa може бути успішно дискретизований за часом на частоті 2Fa тільки в тому випадку, якщо він є чистою синусоїдою, бо будь-яке відхилення від синусоїдальної форми приводить до виходу спектру за межі частоти Fa. Таким чином, для часової дискретизації довільного звукового сигналу (що звичайно має, як відомо, плавно спадаючий спектр), необхідний або вибір частоти дискретизації із запасом, або примусове обмеження спектру вхідного сигналу нижче за половину частоти дискретизації.

Одночасно з часовою дискретизацією виконується амплітудна - вимірювання миттєвих значень амплітуди і їх представлення у вигляді числових величин з певною точністю. Точність вимірювання визначає співвідношення сигнал/шум і динамічний діапазон сигналу (теоретично це - взаємно-зворотні величини, проте будь-який реальний тракт має також і власний рівень шумів і перешкод).

Одержаний потік чисел (серій двійкових цифр), що описує звуковий сигнал, називають імпульсно-кодовою модуляцією або ІКМ (Pulse Code Modulation, PCM), оскільки кожен імпульс дискретизованого за часом сигналу представляється власним цифровим кодом.[4]

Найчастіше застосовують лінійне квантування, коли числове значення відліку пропорційне амплітуді сигналу. Через логарифмічну природу слуху доцільнішим було б логарифмічне квантування, коли числове значення пропорційне величині сигналу в децибелах, проте це зв'язано з труднощами чисто технічного характеру.

Часова дискретизація і амплітудне квантування сигналу неминуче вносять в сигнал шумові спотворення, рівень яких прийнято оцінювати по формулі:

6N + 10lg (Fдискр/2Fмакс) + З (дБ),

де константа З варіюється для різних типів сигналів: для чистої синусоїди це 1.7 дБ, для звукових сигналів - від -15 до 2 дБ.

Звідси видно, що до зниження шумів в робочій смузі частот 0..Fмакс приводить не тільки збільшення розрядності відліку, але і підвищення частоти дискретизації щодо 2Fмакс, оскільки шуми квантування "розмазуються" по всій смузі аж до частоти дискретизації, а звукова інформація займає тільки нижню частину цієї смуги.

Аналіз ринку програмного забезпечення для обробки звуку.

Першою програмою, яку слід розглянути є Adobe Audition.

Adobe Audition (Cool Edit Pro) - професійний інструмент для роботи з аудіо-файлами, призначений для фахівців у області обробки аудіо і відеопродукції. Adobe Audition пропонує необмежені можливості мікшування, редагування, створення майстер-копій і обробки звукових спецефектів. Продукт суміщає гнучкість технологічного процесу з граничною простотою у використанні і дозволяє створювати різноманітну аудіо-продукцию високої якості. Adobe Audition - це повноцінна студія звукозапису, оснащена гнучкими і простими у використовуванні інструментами.

Основною перевагою даного програмного засобу є його надзвичайно висока функціональність. Основний недолік - користувач повинен мати знання із принципів будови і процесінгу цифрового звуку. Таким чином вхідний поріг використання обмежується рівнем професійних знань.

Наступною програмою, яку ми розглянемо, є звуковий редактор Audicity. Даний програмний продукт поширюється за ліцензією open-source, тобто на відміну від свого попередника є безкоштовним.

Програма має досить широкий функціонал, що є її основною перевагою.

Основним недоліком даного програмного продукту є те, що він має не дружній до користувача інтерфейс, через що користуватись даною програмою для нового користувача є досить складно.

Наступною програмою, яку ми розглянемо, є Audio Editor Pro. Даний аудіоредактор дозволяє записувати і редагувати mp3, wma, wav файли із застосуванням різноманітних цифрових спецефектів і фільтрів (20 аудіоефектів і 6 фільтрів), а також конвертувати файли з одного формату в іншій і переписувати CD на жорсткий диск. Підтримуються mp3 VBR кодек, Windows Media 9, ID3-тэги, а також завантаження даних з CDDB.

Дана програма є відносно простою у використанні, і разом з тим дружньою до користувача, однак має суттєвий недолік - для використання необхідно придбати ліцензію, що робить дану програму не зовсім доступною для пересічного користувача.

Реалізація методів обробки цифрового звуку.

Обробку цифрового звуку зазвичай проводять за допомогою спеціалізованих програмних засобів. В рамках виконання магістерської роботи було розроблено програмний засіб, який дозволяє виконувати базові операції по обробці цифрового звуку. Програма побудована у вигляді двохвіконного візуального додатку для операційної системи Microsoft Windows. Загальний вигляд програми подано на рис. 1.

При завантаженні готового треку відбувається виклик стандартного діалогу відкриття файлу, після чого шлях до файлу передається на відповідний обробник, і далі наступний код опрацьовує файл треку.

Для стандарту МР3 (найбільш поширений стандарт цифрового аудіо) є можливість задати пропускну здатність, або бітрейт. Програма дозволяє працювати як із статичним бітрейтом, так і з динамічним, коли його розмір змінюється під час відтворення аудіо потоку. З базових ефектів обробки звуку доступними є два типи ефектів: луна та реверберація. Налаштування кожного з них є абсолютно однаковими. Для того чи іншого ефекту необхідно задати кількість віддзеркалювань, затримку сигналу, та гучність віддзеркалювання.

Функціонал програми дозволяє виділяти необхідні фрагменти оригінального звукового ряду, і далі, в залежності від режиму вставки, заміняти, вставляти, або змішувати семпли. Крім того є можливість користуватись маркерами, та проводити експорт семплів в окремі файли з подальшою можливість провести зворотну операцію - експорт семпла з файла в трек.

Рис. 1. Загальний вигляд програми.

Накладання фільтрів дозволяє надати треку закінченості, а також створити оптимальні звукові переходи між окремими семплами. У випадку створення підкастів використання фільтрів дозволяє створити правильно оформлені початок і закінчення підкаста.

Всього доступно два основних ефекти (темп та звучання), кожен з яких може бути застосований як дискретно, так і з плавним авто-регулюванням. Доступний також режим авто-регулювання гучності, та режим інверсії звучання. Також можна застосувати один із додаткових ефектів (луна, реверберація, тощо не до трека взагалі, а до окремого семпла).

Режим синтезу звуку в даній програмі реалізовано у вигляді дискретного біт-генератора, який дозволяє генерувати біт заданої частоти.

Висновки. Розроблена в рамках магістерської роботи програма дозволяє виконувати над цифровим звуком всі базові операції, потреба в яких може виникнути в пересічного користувача. Зокрема, основу для обробки може становити як готовий звуковий ряд, завантажений із файла в одному із трьох форматів кодування (wav, mp3, em1). При цьому декодування і подальше кодування із стисненням при зберіганні відбуваються автоматично. Розробку програми проведено на основі грунтовних теоретичних дослідженнях, отже дана робота має не лише практичне а й теоретичне значення при вивченні проблематики технологій обробки цифрового звуку.

До основних функціональних характеристик розробленої програми можна віднести наступні:

* модифікація параметрів звукового сигналу;

* правка фрагментів звукового потоку (семплінг);

* обробка звукового ряду з використанням фільтрації (міксування);

* синтез нових елементів звукового ряду (біт-генератор).

Завдяки функціоналу модифікації параметрів звукового сигналу можна змінювати особливості кодування (частотні характеристики, бітрейт, тощо), а також накладати деякі базові ефекти: віддзеркалення та затримку звуку, луну тощо.

Функціонал правки фрагментів звукового потоку дозволяє виділяти із загальної композиції окремі елементи (семпли), і оперувати ними, модифікуючи загальну композицію.

Функціонал звукових деформацій (накладання фільтрів) дозволяє керувати рядом різних звукових харкетеристик, зокрема контролювати тепм, гучність, а також застосовувати ефекти (плавну зміну темпу і гучності, вирівнювання гучності, інверсію сигналу, тощо).

Розроблена програма орієнтована на використання в підкастах для запису та обробки звуку, а також для навчання основам обробки цифрового звуку при створенні електронної музики.

Список використаної літератури:

1. Козюренко Ю.И. Звукозапись с микрофона. Altex, 2008.

2. Крапивенко А.В., "Методы и средства обработки аудио- и видеоданных", Москва М:. "Вузовская книга", 2010;

3. Сергиенко А.Б. Цифровая обработка сигналов. - М.: Наука, 1999. 303 с

4. Ю.А.Ковалгин Цифровое кодирование звуковых сигналов. - М.: Питер, 2004. 245 с

Вісник МЕГУ

6 5

Показать полностью… https://vk.com/doc31101914_62944580
96 Кб, 13 марта 2012 в 23:32 - Россия, Москва, МЭГУ, 2012 г., doc
Рекомендуемые документы в приложении