PROVEGAS.RU: SONY VEGAS FORUM

PROVEGAS.RU: SONY VEGAS FORUM (http://www.provegas.ru/forum/index.php)
-   Sound Forge (http://www.provegas.ru/forum/forumdisplay.php?f=8)
-   -   Боремся с шумами! (http://www.provegas.ru/forum/showthread.php?t=62)

Beast2537 21.05.2008 05:21

Боремся с шумами!
 
Шум — интересное явление.
Мы разговариваем между собой в ночном клубе при жутком шуме, звуковое давление которого превышает 90дБ, однако запиши этот разговор на самый лучший микрофон и... не разберёшь ни слова. Эффект вечеринки, так и прозвали этот феномен человеческого мозга, который эффективно отсеивает посторонние звуки и концентрируется на словах собеседника.
Наши компьютеры, производительностью в гигафлопы не в состоянии догнать человеческий мозг и обеспечить подобный эффект для записи.
Более того. В записи шум, который даже в 4 раза тише полезного сигнала, является таким раздражительным, что слушать это невозможно.
Что ж, посмотрим, что для нас может сделать компьютер в нелёгкой задаче "отрезания" шума от полезного сигнала, сможем ли мы повысить разборчивость речи и снизить назойливость записи.

Нам понадобятся:
1) Шумная запись
2) Sound Forge. Версия значения особо не имеет
3) Набор DirectX плагинов от великолепной Waves — Waves Platinum Bundle
4) от 10 до 30 минут времени, в зависимости от запущенности случая.

Пока ты, дорогой читатель, находишься в процессе онлайн-покупки Waves Platinum Bundle по цене около 2000 долларов, я углублюсь в некоторые выкладки, которые могут служить как "ограничение ответственности". Моей и Waves.
1) Невозможное невозможно в принципе. Если шум сильнее полезного сигнала (или близок к тому, чтобы быть сильнее), извлечь полезный сигнал в чистом виде невозможно. Никак. Вообще. Здесь всё зависит от спектра шума. Например, так называемый белый шум, содержащий в себе в равной громкости ВЕСЬ слышимый диапазон (от 20Гц до 20кГц по максимуму), естественно, будет заглушать все частоты, в том числе и диапазон речи человека (минимальная разборчивость — диапазон от 1 кГц до 4-6 кГц). В подобном случае мощность полезного сигнала должна быть как минимум в 3 раза выше мощности шума, а лучше в 4 (это 12 дБ разницы в громкости). Если шум находится на расстоянии 6 дБ от полезного сигнала — можно лишь сделать чуть более разборчиво, при этом звук будет очень неприятный для уха, — это уже экстремальный вариант, когда действительно необходимо спасти чьи-то слова.

2) Всем молчать! Для того, чтобы эффективно отрезать шум по технологии, которую я тебе, любознательный читатель, рекомендую, нужно иметь хотя бы одну секунду исключительно шума. Только шум и ничего кроме шума. Почему? Потому что частотно-сэмплерная технология и основана на том, что запоминает образец шума и вычитает его из входного аудио на столько децибел, на сколько мы укажем процессу. Этот процесс — близнец таких наверняка известных тебе программ, как Neat Image и Neat Video. Только работает со звуком.

3) Под одну гребёнку. Из вышесказанного вытекает, что шум должен быть постоянен на протяжении всего аудио. Если у тебя, мобильный читатель, запись то в автомобиле, а то возле водопада — придётся делить аудио на соответствующее количеству источников шума количество кусков и обрабатывать каждый кусок по отдельности. Соответственно, в каждом куске должно выполняться правило 2.

Beast2537 21.05.2008 05:21

Итак, программное обеспечение установлено, файл с шумным аудио на готове, приступим к собственно действу.

Открываем наш шумный звук в Sound Forge. Я использовал кусок шума, любезно предоставленный нам Шарлот (честно говоря, этот шум — тяжёлый случай) и наложил с помощью своего простецкого Skype-микрофона (который вовсе качеством не блещет) фразу, сделав её громче шума в 3,5 раза. (Скачать входной сигнал можно здесь).
Это очень небольшая разница в взвешенной мощности сигналов, потому как шум постоянен, а речь всё-таки с "промежутками" тишины. Вот что мы видим:

http://i037.radikal.ru/0805/14/2eea5219ecc7t.jpg

Выглядит ничего. Слышно рассказчика? Да. А послушать — так сразу хочется бежать в абсолютно заглушенную комнату. Будем бороться.
Соответствуя правилу 2, находим кусок аудио, который является только чистым шумом и ничем более. Нашли? Выделяем этот кусок и запускаем плагин X-Noise из свежекупленного Platinum Bundle:

http://i004.radikal.ru/0805/26/19e49fa95488t.jpg

Теперь перед нами открылось окно плагина, в котором два ползуна, четыре непонятные цифири и график. Сейчас будем разбираться, что к чему, пока лишь нажмём кнопку качества "High" (высокое) и кнопку "Learn" (учить):

http://i028.radikal.ru/0805/8b/c64f9d7bbbfft.jpg

Нажимаем кнопку "Preview" (предпрослушивание) враппера плагинов.
Слышим шум. А ты что ожидал, нетерпеливый читатель?

http://i010.radikal.ru/0805/43/bb6acab5f60dt.jpg

Зато кнопка Learn заморгала и переименовалась в "Learning" (учусь), а на графике рисуется кривая. Жукто интересно — это частотный спектр нашего с тобой шума! Погоняв кусок шума пару раз по кругу, насладившись в полной мере этим звуком, поскольку больше в первозданном виде мы его не услышим, нажимаем "Stop" (остановить) — кривая замерла, отключаем режим обучения, нажав на кнопку Learn.
Всё. Шум попал. Или попался. Теперь этот выученный плагином назубок кусок шума нам нужно отрезать от всего файла. Легко. Нажимаем на враппере кнопку "Selection" (Выделение):

http://i016.radikal.ru/0805/63/9c0b874189eft.jpg

и в первом ниспадающем списке выбираем опцию "All Sample Data" (все данные):

http://i017.radikal.ru/0805/53/57a1c1d50f4ct.jpg

Подтверждаем выбор кнопкой "OK" и снова запускаем воспроизведение звука нажатием на кнопку Preview.
Только на этот раз уже ты, вооружённый читатель, будешь рулить процессом.

Приступим к изучению крутилок и сопелок плагина:
1) "Threshold" (Порог). Представляет собой ничто иное, как регулирование громкости только что захваченного нами шумового примера (профиля). Чем выше сделать порог, тем более громкие звуки плагин будет захватывать в обработку. Сигнал тише профиля будет обрабатываться, сигнал громче его — считаться полезным сигналом и пропускаться. На графике отображается белой кривой, если потаскать ползун, будет видно, как она ходит вверх-вниз. Имеет диапазон от -20 дБ до +50 дБ. По умолчанию установлен в 0, обычные значения от +10 до +20 дБ.

2) "Reduction" (подавление). Собственно, количество силы, с которой плагин будет бороться с шумом путём вычитания профиля из сигнала, который тише порога. Имеет вполне предсказуемый диапазон значений от 0 до 100.

3) "Attack" (атака). Определяет количество времени в миллисекундах, проходящее от времени обнаружения шума в сигнале до времени, когда сила обработки достигнет максимума (установленного ползуном Reduction). Во время атаки подавление плавно нарастает от 0 до установленного значения, чтобы избежать неудобоваримого скачка в звуке.
Принимает значения от 0 до 1000 (1 секунда). Играет неоценимую роль в разборчивости сигнала после обработки. Более быстрые значения позволяют добиться более раннего снятия шума и подходят для резких звуков, в том числе и речи. Более медленные значения позволяют плавно снижать мощность шума.

4) "Release" (восстановление). Определяет количество времени всё в тех же миллисекундах, в течение которого плагин снижает силу обработки. Время восстановления начинается сразу же после прошествия времени атаки. Принимает значения от 0 до 10000 (10 секунд). Как и предыдущий параметр, позволяет избегать неприятных скачков громкости при обработке. Более длинные значения позволяют сохранить больше атмосферы звука, но могут привести к эху, более короткие значения лучше удаляют шум, но делают полезный сигнал менее естественным. По умолчанию установлен в 400 (0.4 сек), для голоса чаще всего подходит что-то покороче, навроде 150.

5) "High shelf" (ФНЧ, фильтр низкой частоты, "верхняя полка") — обыкновенный полупараметрический эквалайзер, как в бытовом магнитофоне крутилка "Верхи", только регулируется ещё и частота, откуда эти верхи начинаются. Как раз сопелка "Freq" (частота) отвечает за частоту начала среза или подъёма в Герцах, а "Gain" (усиление) за количество среза или подъёма в децибелах.
Внимание! Фильтр применяется не к звуку, а к шумовому профилю. То есть, "добавив" верхов, мы укажем плагину, что в шуме больше верхов, чем мы записали в профиле, и на выходе получим полезный сигнал с меньшим количеством верхов. Чтобы повысить разборчивость, нужно указывать отрицательный Gain. Freq имеет диапазон значений от 700 Гц до 20 кГц, по умолчанию установлен в 4 кГц, Gain изменяется от -30дБ до + 30дБ. Ещё раз повторюсь, уменьшая Gain, мы снижаем порог для шумового профиля, начиная с установленной Freq частоты, в результате получая меньше обработки начиная с этой частоты. Запомнил, внимательный читатель?

6) Бегун и пик-метр "NR". Собственно показывает количество применяемой обработки в дБ в текущий момент и пиковое её значение.

7) Кнопки "Resolution" (качество). Кому нужно плохое качество? Всегда ставим в "High".

8) Кнопка "Learn" (вызубрить). С ней мы уже познакомились. Служит для указания плагину, что этот кусок надо запомнить в качестве профиля.

9) Бегуны "Output" (мощность выходного сигнала). Ну что тут сказать. Это чрезвычайно сложные для понимания вещи, поэтому я не буду о них распространяться.

10) Кнопки "Output Monitor" (мониторинг сигнала). Очень интересная возможность для контроля, сколько же мы тут понарезали. Кнопка "Audio" (звук) демонстрирует нам звук, обработанный плагином. А вот более привлекательная кнопка "Difference" проигрывает ТОЛЬКО неполезный сигнал, который отрезан от нужного плагином. Необходимо мониторить звук с помощью этой кнопки, чтобы послушать, не попало ли слишком много нужного сигнала в помойку...

Теперь мы дошли до самого интригующего — спектр-анализатор, графики проще говоря.
Ось X — частота в Гц, ось Y — громкость сигнала в дБ.
Итак, белая кривая, мы уже знаем, — это спектр шумового профиля расположенный по оси Y на графике соответственно ползуну Threshold. Белая кривая не меняется, только ползает вверх-вниз по графику, если ползун мучить.
Дальше интереснее. Красная кривая представляет собой сигнал, необработанный плагином, то есть поступивший на вход. Когда полезного сигнала нет (только шум) — она и показывает громкость нашего шума.
Зелёная кривая — громкость уже обработанного сигнала, то есть на выходе. То есть как бы красная минус белая. Разница в расположении кривых по оси Y и есть количество шумоподавления на конкретной частоте (по оси X).
Хорошо выстроенный процесс шумоподавления имеет обычно подобную картину: в общем плане зелёная змеюга ползает ПОД красной (то есть выход тише чем вход), но местами, в пиках, где есть полезный сигнал, зелёная добирается до красной и даже белой, а иногда и выше красной и белой (но редко).
В нашем примере всё плохо, шуму много, к тому же скриншот сделан в не самый подходящий момент:

http://i025.radikal.ru/0805/90/156c113e8fb8t.jpg

Что мы видим: На краях частотного диапазона шумоподавление достигает 20 дБ, что есть неплохо, а в серединке поменьше. Пик-метр NR показывает нам количество обработки в 9 дБ в среднем по всему диапазону. Что ж, это позволило нам снизить шум с -12 до -33 дБ, что явно идёт на пользу нашему аудио.

Beast2537 21.05.2008 05:37

Теперь о минусах, ведь не бывает ничего идеального.

При слишком высоких значениях ползуна Reduction звук становится такой, как будто говорит робот. А ещё плагин любит "присвистывать" железным таким звуком. Это временные искажения фазы сигнала, ведь фактически X-Noise это куча notch-фильтров каждый со своей установкой громкости. И временные искажения звука неминуемы. Что делать? Снижать Reduction и поднимать Threshold. Играться с атакой и восстановлением. Вобщем, искать золотую середину.
Ещё одна хитрость — это двойная обработка. Первый проход я делаю так, чтобы максимально понизить шум при максимальном сохранении качества полезного сигнала. Применяю, и делаю... второй проход, всё по-новой, уже с новым шумовым профилем. Таким образом я в нашем примере добился снижения звука шума до - 42 дБ. Это уже не просто применимо, это отлично! Особенно, если речь будет, например, положена на музыку.

http://i003.radikal.ru/0805/fb/47791613e557t.jpg

Но у нас нет музыки! А в тихих местах, где был шум, образовались нехорошие железячные артефакты. ДАЙТЕ ТИШИНУ!

И тут на поле битвы выходит старый воин, никогда не покидающий свой пост... великий и ужасный Gate.
Почему ужасный? Да ты только погляди, умудрённый опытом читатель, на количество его крутилок и сопелок! Ни один плаг не может так напугать как Gate/Expander.
Поэтому, пока лишь полюбуйся на его физиономию, а расскажу я про него тебе, уставший читатель, в следующей серии.

http://i009.radikal.ru/0805/6a/3ff565f4bc2ct.jpg

Что в итоге получилось: здесь

vsorkin 22.01.2009 02:03

Боремся с шумами!
 
К затронутой Beast2537 полезной теме о шумоподавлении добавлю только, что у фирмы Waves есть более точный инструмент для борьбы с фоновыми шумами - Z-Noise. Функционал работы такой же, но добавлены пять полос - управляющих ключей для корректировки огибающей подавления шума и улучшены алгоритмы фильтрации. Качество подавления шума, на моё ухо, стало сравнимо с работой "Noise Readction" в CoolPro/Adobe Audition, но вариант "Z-Noise" удобнее т.к. plug-ins можно включать в любой Audio Track, Aux-шину или Master-шину в Vegas и работать с ним прямо в проекте с использованием для участков с разными спектрами и уровнями шума кривые автоматизации параметров плагина. Удачи на фронтах борьбы с шумом!

jurisviii 31.01.2009 00:27

Easy noise-nuking with Sound Forge 9

Lana21 09.02.2009 17:01

Тема "боремся с шумами" - http://cjcity.ru/content/sound-forge-denoise.php (мои пять копеек по теме ;))
Учащиеся по этим урокам пусть сами выбирают, что им больше по душе.

.

brother 25.02.2009 11:04

Афигенный урок в Аудишине http://maltaannon.com/tutorials/Audition/HissAndRumble/
Плюс там же куча всего по Афтеру. Всё качается.

jurisviii 25.02.2009 19:06

А тема то по форжу...

brother 26.02.2009 11:52

Цитата:

Сообщение от jurisviii (Сообщение 11878)
А тема то по форжу...

Зато про борьбу с шумами )))

Комдив 16.03.2009 01:17

Использую в комплексе программы Sony Vegas Pro 8.0 и Adobe Audition 3.0. работают прекрасно в паре. В настройках в Sony Vegas Pro 8.0 уазываем аудиоредактор Adobe Audition 3.0, и в последствии из меню Vegas вызывается Audition и обрабатывает звуковые файлы. В Adobe Audition 3.0 больше возможности чем в Sound Forge. Инсталлятор Audition весит больше 300 МБ, а Sound Forge около 90 .

Martin 20.03.2009 01:42

Если кому-то ещё интересно: просто и качественно (лучше Wawe-зов) работает "шумодав" Noise Reduction в Cool Edit или Adob-е. Принцип тот же - образец шума, меньше сек., - обработка файла. Wawes-плуги удобнее применять "по-месту" непосредственно в мультитреках.

vkuzin 21.03.2009 19:22

В самом форже тоже есть встроенный фильтр-шумодав Noise Reduction-принцип тотже.

Martin 21.03.2009 21:16

Может в версии старше 7, в 7-м только гейт нашелся, но если и есть - Cool месит в 32-х битах и чисто по логике. Стабильные фона (белый, розовый шум и т.п.) вынимал "акуратно, но сильно". Если шум значительный, может остаться характерный квакающий призвук, иногда хорошо слышимый в подчищенных старых фильмах.

GS1966 21.03.2009 21:23

1. Текущая версия - Sound Forge 90e, а 7 когда был... Очень давно
2. Корректно сравнивать нужно софт сходного назначения (и приблизительно одинаковой ценовой группы)

Martin 21.03.2009 21:56

Знаю, что 9-тый последний, не ставлю по причине того, что он слишком умный и навороченный - грузится долго, а в качестве звука разницы нет - закончилась на 7-м. Да и вообще заметил, что далеко не все обновления лучше. Пробовать надо... Forge и Cool конечно вещи разные, но Adob не пользую по той же причине (так, к слову).


Sony Vegas: ProVegas.ru
© 2008-2014 При полном или частичном использовании материалов ссылка на ProVegas.ru обязательна.


Часовой пояс GMT +4, время: 05:20.