Кодирование и обработка звуковой информации презентация. Кодирование и обработка звуковой информации Кодирование звука презентация

Кодирование графической информации. №. Вопросы. 1. Пространственная дискретизация это. 2. Разрешающая способность экрана в графическом режиме определяется количеством. 3. Страница видеопамяти составляет 16 000 байтов. Дисплей работает в режиме 320x400 пикселей. Сколько цветов в палитре? 4. Определить глубину цвета в графическом режиме, в котором палитра состоит из 256 цветов. 5. 256-цветный рисунок содержит 120 байт информации. Из скольких точек он состоит? 6. Определите количество цветов в палитре при глубине цвета 16 бит. 7. Черно – белое растровое изображение имеет размер 10 Х 10 точек. Какой объем памяти займет это изображение? 8. Цветное (с палитрой 256 цветов) растровое изображение имеет размер 10 Х 10 точек. Какой объем памяти займет это изображение? 9. В процессе преобразования растрового графического изображения количество цветов уменьшилось с 65536 до 16.Во сколько раз уменьшится объем занимаемой им памяти?


Что такое звук? С помощью микрофона звук преобразуется в так называемый аналоговый электрический сигнал. sound_high_low.swf sound_quiet_aloud.swf Аналоговый сигнал – это произвольное изменение некоторой величины в заданном диапазоне. Звук – это колебания среды (воздуха, воды), которые воспринимает человеческое ухо.


Оцифровка Цифровой сигнал Оцифровка – это преобразование аналогового сигнала в цифровой код.


Дискретизация 0 T 2T2T 0 T 2T2T Временная дискретизация звука – процесс, при котором, во время кодирования непрерывного звукового сигнала, звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды. Чем больше амплитуда сигнала, тем громче звук. Аналоговый сигнал Цифровой сигнал


Частота дискретизации Качество цифрового звука зави­сит от количества измерений уровня громкости звука в еди­ницу времени, т. е. частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем боль­ше частота дискретизации), тем точнее «лесенка» цифрового звукового сигнала повторяет кривую аналогового сигнала. Частота дискретизации звука это количество измерений громкости звука за одну секунду. Измеряется в ГЦ.


Частота дискретизации Для кодирования звука в компьютерах чаще всего используются частоты дискретизации 8 кГц (плохое качество, но достаточно для распознавания речи), 11 кГц, 22 кГц, 44,1 кГц (звуковые компакт диски), 48 кГц (фильмы в формате DVD), 96 кГц и 192 кГц (высококачественный звук в формате DVD audio).


Глубина кодирования звука В процессе дискретизации на хранение одного отсчета в памяти отводится ограниченное место. Представим себе, что на один отсчет выделяется 3 бита. При этом код каждого отсчета – это целое число от 0 до 7. Весь диапазон возможных значений сигнала, от 0 до максимально допустимого, делится на 8 полос, каждой из которых присваивается номер (код). Все отсчеты, попавшие в одну полосу, имеют одинаковый код. Т.о. при кодировании звука выполняется дискретизация с потерей информации


Глубина кодирования звука Если известна глубина кодирования, то количество уровней громкости цифрового звука (уровень дискретизации) можно рассчитать по формуле. N = 2 I Недорогие звуковые карты имеют разрядность бит, большинство современных – 24 бита, что позволяет использовать 2 24 = различных уровней. Глубина (разрядность) кодирования звука это количество бит, которое отводится на одно измерение звука. Преобразование измеренного значения сигнала в число называется дискретизацией по уровню. Эту операцию выполняет аналого цифровой преобразователь (АЦП) звуковой карты.


Форматы графических файлов WAV (Waveform audio format), часто без сжатия (размер!) MP3 (MPEG-1 Audio Layer 3, сжатие с потерями) WMA (Windows Media Audio, потоковый звук, сжатие) OGG (Ogg Vorbis, открытый формат, сжатие с потерями) С помощью оцифровки можно закодировать любой звук, который принимает микрофон (человеческого голоса, шум прибоя и т.п.). Однако у этого метода есть и недостатки: при оцифровке звука всегда есть потеря информации (из за дискретизации); звуковые файлы имеют, как правило, большой размер, поэтому в большинстве современных форматов используется сжатие.


Инструментальное кодирование MIDI (Musical Instrument Digital Interface) - цифровой интерфейс музыкальных инструментов (файлы *.MID) Точно воспроизводит звучание инструментов, без потери качества. В формате MIDI хранятся нота (высота, длительность) музыкальный инструмент (можно использовать 128 мелодических и 47 ударных инструментов) параметры звука (громкость, тембр) многоканальный звук (полифония) Нельзя закодировать человеческий голос MIDI-клавиатура




Задача 1 Производится одноканальная (моно) звукозапись с частотой дискретизации 16 кГц и глубиной кодирования 24 бита. Запись длится 1 минуту, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах? 1) 0,2 2) 2 3) 34) 4 Решение: 16 кГц = Гц; V = M*i*t V = * 24 *60 = бит 2,7 Мбайт Наиболее близкое значение 3 Мбайта Ответ: 3)


Задача 2 Объем звукового файла 5,25 Мбайт, разрядность звуковой платы – 16. Какова длительность звучания этого файла (примерно), записанного с частотой дискретизации 22,05 кГц? V = M * i * t t = 5,25 * 8 * 1024 *1024 / (22,05 * 1000 * 16) = 125 сек V = 5,25 Мбайт М = 22,05 кГц i = 16 бит t = V / (M * i)


Задача 3 Производится одноканальная (стерео) звукозапись с частотой дискретизации 64Гц. При записи использовались 32 уровня дискретизации. Запись длится 4 минуты 16 секунд, её результаты записываются в файл, причём каждый сигнал кодируется минимально возможным и одинаковым количеством битов. Вычислить размер полученного файла, выраженному в килобайтах? Решение: 32 = 2 5 – Глубина кодирования i=5 бит 4 мин 16 с = = 256 с V = = байт = 5 2 Кбайт = 10 Кбайт Ответ: 10 Кбайт.



Чтобы пользоваться предварительным просмотром презентаций создайте себе аккаунт (учетную запись) Google и войдите в него: https://accounts.google.com


Подписи к слайдам:

Свойства: звук - продольная волна; распространяется в упругих средах (воздух, вода, различные металлы и т.д.); имеет конечную скорость. Звуковые колебания (волны) – механические колебания, частота которых лежит в пределах от 20 до 20 000 Гц. Звуковые колебания 20 Гц 20 000 Гц

громкость звука – зависит от амплитуды колебаний. Чем больше амплитуда колебаний, тем громче звук. высота звука – определяется частотой колебаний воздуха. скорость звука – скорость распространения волн в среде. тембр звука – окраска звука, зависящая от источника звука (скрипка, рояль, гитара и т.д.). Единица громкости звука - децибел (дБ) (десятая часть бела). Названа в честь Александра Грэхема Белла, изобретателя телефона. sound_high_low.swf sound_quiet_aloud.swf

fourth.swf third.swf Зависимость громкости и высоты тона звука от интенсивности и частоты звуковой волны

Источник звука Уровень (дБ) Спокойное дыхание Не воспринимается Шёпот 10 Шелест листьев 17 Перелистывание газет 20 Обычный шум в доме 40 Прибой на берегу 40 Разговор средней громкости 50 Громкий разговор 70 Работающий пылесос 80 Поезд в метро 80 Концерт рок-музыки 100 Раскат грома 110 Реактивный двигатель 110 Выстрел из орудия 120 Болевой порог 120

Звуковая информация 2. Временная дискредитация звука 3. Частота дискредитации 4. Глубина кодирования звука 5. Качество оцифрованного звука 6. Звуковые редакторы

Аналоговый Дискретный физическая величина принимает бесконечное множество значений, причем они изменяются непрерывно. физическая величина принимает конечное множество значений, причем они изменяются скачкообразно. Виниловая пластинка (звуковая дорожка изменяет свою форму непрерывно) Аудиокомпакт-диск (звуковая дорожка содержит участки с разной отражающей способностью)

t A(t) Временная дискретизация – это разбиение непрерывной звуковой волны на отдельные маленькие временные участки, причем для каждого участка устанавливается определенная величина амплитуды.

КВАНТОВАНИЕ - процесс замены реальных значений сигнала приближенными с определенной точностью. БИТРЭЙТ (bitrate) - уровень квантования, объем информации в единицу времени (bits per second). То есть, какое количество информации о каждой секунде записи мы можем потратить. Измеряется в битах (bit).

Звуковая информация хранится в виде значений амплитуды, взятых в определенные моменты времени (т. е. измерения проводятся «импульсами»).

Для оцифровки звука используются специальные устройства: аналого-цифровой преобразователь (АЦП) и цифро-аналоговый преобразователь (ЦАП).

Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно: N = 2 I = 2 16 = 65 536 В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет соответствовать код 0000000000000000, а наибольшему - 1111111111111111. ГЛУБИНА ДИСКРЕТИЗАЦИИ ЗВУКА (I) – это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука. N – количество уровней громкости I – глубина кодирования

ЧАСТОТА ДИСКРЕТИЗАЦИИ ЗВУКА – это количество измерений громкости звука за одну секунду. 1 Гц = 1/с 1 кГц = 1000 /с Сэмплрэйт (samplerate) - частота дискретизации (или частота сэмплирования) - частота взятия отсчетов непрерывного во времени сигнала при его дискретизации (в частности, аналого-цифровым преобразователем - АЦП). sound_frequency.swf

Чем выше качество цифрового звука, тем больше информационный объем звукового файла. Параметр Глубина кодирования Частота дискретизации Телефонная связь 8 бит до 8 кГц Среднее качество 8 бит или 16 бит 8-48 кГц Звучание CD -диска 16 бит до 48 кГц

V = I * M * t * k V - объем звукового файла, I - глубина кодирования звука, M - частота дискретизации звука, t - длительность звучания файла, k - количество каналов звучания (режим моно k = 1, стерео k = 2)

Пример. Оцените информационный объем высокочественного стереоаудиофайла длительностью звучания 1 минута, если "глубина" кодирования 16 бит, а частота дискретизации 48 кГц. Информационный объем звукового файла длительностью в 1 секунду равен: 16 бит * 48 000 * 2 = 1 536 000 бит = 187,5 Кбайт Это значит, что битрейт или скорость воспроизведения должна быть равна 187,5 килобайт в секунду. Информационный объем звукового файла длительностью 1 минута равен: 187,5 Кбайт/с * 60 с = 11 Мбайт

Очистка от шумов Разделение стерео-записи на два различных файла: Микширование звука Наложение эффектов Редактирование звука - это любое это преобразование.

Звуковые редакторы позволяют изменять качество цифрового звука и объем звукового файла путем изменения частоты дискретизации и глубины кодирования. Оцифрованный звук можно сохранять без сжатия в звуковых файлах в универсальном формате WAV или в формате со сжатием МР3. При сохранении звука в форматах со сжатием отбрасываются "избыточные" для человеческого восприятия звуковые частоты с малой интенсивностью, совпадающие по времени со звуковыми частотами с большой интенсивностью. Применение такого формата позволяет сжимать звуковые файлы в десятки раз, однако приводит к необратимой потере информации (файлы не могут быть восстановлены в первоначальном виде).

WAVE (.wav) - наиболее широко распространенный формат. Используется в ОС Windows для хранения звуковых файлов. MPEG-3 (.mp3) - наиболее популярный на сегодняшний день формат звуковых файлов. MIDI (.mid) - содержат не сам звук, а только команды для воспроизведения звука. Звук синтезируется с помощью FM- или WT-синтеза. Real Audio (.ra, .ram) - разработан для воспроизведения звука в Internet в режиме реального времени. MOD (.mod) - музыкальный формат, в нем хранятся образцы оцифрованного звука, которые можно затем использовать как шаблоны для индивидуальных нот.

Область редактирования Временная шкала Главное меню Панели инструментов http://www.audacity.ru/p1aa1.html

Выучить конспект, решить задачи в тетради. Задачи «Кодирование звуковой информации» Уровень «5» Определите длительность звукового файла, который уместится на гибкой дискете 3,5”. Учтите, что для хранения данных на такой дискете выделяется 2847 секторов объемом 512 байт. а) при низком качестве звука: моно, 8 бит, 8 кГц; б) при высоком качестве звука: стерео, 16 бит, 48 кГц. Уровень «4» В распоряжении пользователя имеется память объемом 2,6 Мб. Необходимо записать цифровой аудиофайл с длительностью звучания 1 минута. Какой должна быть частота дискретизации и разрядность? Уровень «3» Определить объем памяти для хранения цифрового аудиофайла, время звучания которого составляет две минуты при частоте дискретизации 44,1 кГц и разрешении 16 бит.


1 слайд

2 слайд

С начала 90-х годов ПК получили возможность работать со звуковой информацией. Каждый ПК, имеющий звуковую плату, микрофон, наушники или колонки, может записывать, сохранять и воспроизводить звуковую информацию. * С графической информацией мы работаем посредством графических редакторов, то со звуковой информацией с помощью редакторов аудиофайлов. С графической информацией мы работаем посредством графических редакторов, то со звуковой информацией с помощью редакторов аудиофайлов.

3 слайд

Звуковая информация Звук представляет собой распространяющуюся в воздухе, воде или другой среде волну с непрерывно меняющейся интенсивностью и частотой. *

4 слайд

В процессе кодирования звуковой информации происходит временная дискретизация, когда звуковая волна разбивается на отдельные маленькие временные участки. Для каждого такого участка устанавливается определенная величина интенсивности звука. По окончании процесса дискретизации, звуковая информация хранится в памяти компьютера в виде двоичных кодов. *

5 слайд

6 слайд

С помощью микрофона звук превращается в колебания электрического тока, которые имеют определённую амплитуду. Устройство для выполнения дискретизации (АЦП) измеряет электрическое напряжение в определённом диапазоне и переводит числовое значение напряжения в многоразрядное двоичное число. Обратный процесс: ЦАП преобразует двоичные числа в электрическое напряжение. Полученный на выходе ЦАП ступенчатый сигнал преобразуется в звук с помощью усилителя и динамика. * Устройства обработки звуковой информации

7 слайд

8 слайд

На качество воспроизведения звука влияют два параметра: частота дискретизации и глубина кодирования звука. Глубина кодирования звука – это размер ячейки, отводимый под запись значения амплитуды (громкости) в двоичном коде. Современные звуковые карты могут обеспечить кодирование 65 536 различных уровней сигнала или состояний (65 536=2i, i=16 бит). Таким образом, современные звуковые карты обеспечивают 16-битное кодирование звука (глубина кодирования). При каждой выборке значению амплитуды звукового сигнала присваивается 16 битный код. * Параметры звуковой информации

9 слайд

Частота дискретизации – это количество измерений громкости звука, производимых прибором за 1 секунду. Частота измеряется в герцах (Гц). Одно измерение за одну секунду соответствует частоте 1 Гц. 1000 измерений за одну секунду – 1 килогерц (кГц). Количество выборок в секунду может быть в диапазоне от 8 000 до 48 000, т.е. частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 48 кГц. *

10 слайд

Человеческое ухо воспринимает звук с частотой от 20 колебаний в секунду (низкий звук) до 20 000 колебаний в секунду (высокий звук). Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим "моно"). *

11 слайд

Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48 000 раз в секунду, глубине кодирования 16 битов и записи двух звуковых дорожек (режим "стерео"). *

Слайд 1

КОДИРОВАНИЕ И ОБРАБОТКА ЗВУКОВОЙ ИНФОРМАЦИИ

Слайд 2

Звуковая информация

Человек воспринимает звуковые волны в форме звука различной громкости и тона. Чем больше интенсивность звуковой волны, тем громче звук, чем больше частота волны, тем выше тон звука.

Низкий звук Высокий звук громкость

Слайд 3

Человеческое ухо воспринимает звук с частотой от 20 (низкий звук) до 20 000 (высокий звук) колебаний в секунду. Для измерения громкости звука применяется специальная единица «децибел».

Слайд 4

Оцифровка (перевод в цифровую форму)

1011010110101010011

аналоговый сигнал

цифровой сигнал

Слайд 5

Временная дискретизация звука

Для того чтобы ПК мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации (непрерывная волна разбивается на отдельные маленькие участки, для каждого такого участка устанавливается величина интенсивности звука) На графике это выглядит так:

А, громкость t, время

Слайд 6

Дискретизация по времени

Слайд 7

Частота дискретизации звука – это количество измерений громкости звука за одну секунду. Частота дискретизации звука может лежать в диапазоне от 8000 до 48000 изменений громкости звука за одну секунду.

Слайд 8

Глубина кодирования звука- это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука. Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N- количество уровней громкости звука I- глубина кодирования

Слайд 9

Качество оцифрованного звука

Зависит от: частоты дискретизации; глубины дискретизации. Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Чем выше качество цифрового звука, тем больше информационный объем звукового файла.

Слайд 10

Звуковые редакторы

Звуковые редакторы позволяют не только записывать и воспроизводить звук, но и редактировать его. Они позволяют изменять качество звука и объем звукового файла. Оцифрованный звук можно сохранять без сжатия в универсальном формате wav или в формате со сжатием mp3. WAV (Waveform audio format), часто без сжатия (размер!) MP3 (MPEG-1 Audio Layer 3, сжатие с потерями) WMA (Windows Media Audio, потоковый звук, сжатие)

Слайд 11

Пример решения задачи: Оценим объем звукового стерео-файла длительностью звучания 1 секунда при среднем качестве звука (16 битов, 24000 измерений в секунду). V=16* 24000*2 (т.к. стерео- 2 дорожки)= 768000 бит= 96000 байт=94 Кбайт