Почему форматы хранения музыки mp3, aac и другие называют Lossy, т.е. с потерями данных?

Вы здесь: Дом / Почему форматы хранения музыки mp3, aac и другие называют Lossy, т.е. с потерями данных?

17.09.2018

Теги: aac, mp3, компрессия, сжатие звука

Содержание:

Почему некоторые форматы хранения музыки при сжатии теряют часть данных и их называют Lossy?
Как работают алгоритмы сжатия музыки?
Как именно ухудшается качество музыки после сжатия
Почему форматы хранения музыки с потерями до сих пор широко используются?

Почему некоторые форматы хранения музыки при сжатии теряют часть данных и их называют Lossy?

Английский термин «Lossy» используется в цифровом аудио для описания типа сжатия, используемого для хранения звуковых данных. Алгоритм, используемый при сжатии музыки, отбрасывает часть аудиоинформации для того, чтобы минимизировать размер музыкального файла. Именно потому, что алгоритм вмешивается в исходную запись и меняет её, причём всегда в худшую сторону, результирующий звук всегда будет отличаться от исходного.

Пример: вы вставили в компьютер компакт-диск, на котором музыка записана в высоком качестве и решили сконвертировать её в mp3 формат, чтобы хранить весь музыкальный альбом на компьютере или телефоне так, чтобы он занимал гораздо меньше памяти. Алгоритмы обработали звук, и в итоге вместо 700 Мб альбом в формате mp3 стал занимать 60 Мб. Конечно, при сжатии часть аудиоинформации будет утеряна.

Форматы сжатия данных существуют не только для музыки, но и для графики и для цифровых данных общего назначения. Я думаю вы знакомы с графическим форматом хранения изображений JPEG, он является аналогом mp3, но для изображений.

Но существуют и другие алгоритмы сжатия аудио, которые позволяют занимать ему меньше места, чем исходный файл, но звук при этом не теряет информации и идентичен оригиналу. Пример таких форматов: FLAC, ALAC и другие. При обработке звука в эти форматы алгоритмы тоже сжимают звук, но делают это иначе, при этом файлы в форматах FLAC или ALAC занимают довольно много памяти.

Вернуться к содержанию

Как работают Lossy алгоритмы сжатия музыки?

Учёные очень давно заметили, что человеческий слух не идеален, он не слышит много из того, что происходит вокруг. Мало того, что сам орган слуха далеко не идеален, так ещё и мозг, который занимается обработкой сигнала от уха также старается постоянно сэкономить свои ресурсы и звук обрабатывает на основе привычных ему паттернов. Именно поэтому знакомую музыку вы слушаете легко и непринуждённо, а новую музыку вы воспринимаете с трудом. Потому что мозг привыкает к определённым мелодиям и не хочет внимательно вслушиваться в новые. Замечали ли вы, что знакомая музыка, которая играет фоном, совершенно не отвлекает вас от работы или учёбы, но незнакомая музыка постоянно мешает вам сосредоточится? Это всё проделки мозга.

Алгоритмы сжатия музыки с потерями были разработаны на основе изучения поведения мозга и слуха человека, на выявлении их слабых мест.

Например, человеческий слух очень плохо различает тихий звук, если он звучит сразу после громкого звука. Или наш слух с возрастом серьёзно теряет возможность слышать высокочастотные звуки. Ещё существует эффект маскировки одного звука другим в музыкальной композиции. Маскировка хорошо работает тогда, когда один звук громче другого, тогда вы просто не слышите более тихий звук, хоть он и есть в записи.

Подобные эффекты работы нашего слухового аппарата изучает наука психоакустика.

Алгоритмы сжатия учитывают подобные особенности восприятия звука человеком и попросту выбрасывают аудиоинформацию из музыки, которую мы либо вообще не слышим, либо слышим плохо.

Первым делом алгоритмы меняют характер низкочастотного звука, переводя его из режима стерео в моно. Таким образом сразу же происходит экономия памяти в 2 раза. Дело в том, что наш слух очень тяжело справляется с определением источника низкочастотного звука, мы его слышим, но откуда он раздаётся понять не можем. Именно по этой причине в системах объёмного звука 5.1 и 7.1 только один сабвуфер.

Второй трюк происходит с высокочастотным звуком выше 16 кГц. Т.к. в природе нет музыкальных инструментов, которые бы играли на частоте 16 кГц или выше, эти частоты просто вырезаются из записи в случае сжатия в формат mp3, либо остаются, но в весьма обработанном и сжатом виде при обработке алгоритмов формата aac.

Третий трюк удаления информации связан с эффектом маскировки, так в современной музыке много ударных инструментов, алгоритмы просто вырезают звук на определённых частотах, которые звучит сразу после звучания барабана. Вырезаются несколько миллисекунд, но если посмотреть на весь удалённый материал на протяжении всей песни получается существенная экономия памяти.

Вернуться к содержанию

Как именно ухудшается качество музыки после сжатия

Проблема сжатия с потерями заключается в том, что алгоритмы не совершенны и могут вносить весьма заметные артефакты в музыку, особенно если речь идёт о кодировании с низким битрейтом. Может появится непонятный белый шум, инструменты будут звучать фальшиво и размазано, без энергии и с весьма низкой детализацией.

Если сравнивать оригинальную запись и запись получившуюся после обработки алгоритмами сжатия, можно заметить, что хоть общий характер звучания и сохранился, но звучит он иначе. В живой записи чувствуется мощь, энергия, характер, у каждого инструмента есть тембральный окрас, обертона и объём воображаемой звуковой сцены. В то время как сжатый звук звучит искусственно, плоско и безэмоционально. Прибавим к этому довольно посредственный мастеринг многих и многих современных музыкальных записей, и получим абсолютно плоскую музыку, которая совершенно не цепляет. Слушаешь, и, вроде, всё на месте, но слушать песню второй раз не хочется, да и даже дослушать до конца её в первый раз желания не возникает.

Также алгоритмы сжатия заметно влияют на голос исполнителя, из него уходит жизнь, эмоции и еле уловимые оттенки и акценты, которые делают его естественным и желанным. Голос становится просто голосом, каких миллион и ничем на их фоне он не будет выделяться. Возможно, именно по этой причине молодое поколение не так ценит музыку, оно воспринимает её, как естественный фон жизни, им почти без разницы что слушать, ведь всё звучит плоско и одинаково, потому что современная молодёж слушает музыку с помощью телефона через стриминговые сервисы, в которых качество передаваемого звука едва достигает 256 кб/сек, и в редких случаях достигает 320 кб/сек и только при ежемесячной платной подписке.

Вся хитрость алгоритмов сжатия с потерями заключается в том, что если человек слушает музыку преимущественно только с их помощью, да ещё в посредственных колонках или недорогих наушниках, он просто не знает как должна звучать музыка на самом деле, поэтому он не ищет улучшения качества звучания, ему кажется, что всё хорошо. Но это не так. Дайте такому слушателю хорошую запись и хорошие наушники, оставьте наедине с музыкой минут на 20 и потом вы будете целый час наблюдать его счастливое и обескураженное лицо, ведь он поймёт, что всю свою жизнь слушал лишь образ музыки, но не саму музыку.

Вернуться к содержанию

Почему форматы хранения музыки с потерями до сих пор широко используются?

Ответ очень простой — экономия памяти и интернет-трафика. Ведь 3 минуты звучания песни в формате mp3 занимает около 5 Мб памяти, в то время, как эта же песня в несжатом виде будет занимать около 30 Мб. В 6 раз больше. А теперь представьте, что все, кто слушает музыку онлайн будут слушать не сжатую музыку. Их счета за интернет-трафик вырастут в 6 раз, далеко не все люди готовы пойти на это. К тому же, чтобы наслаждаться прекрасным качеством звука нужно иметь хорошие наушники или колонки.

Поэтому музыка в сжатом виде ещё очень долго не покинет нас. Но всё не так плохо, ведь, например, формат сжатия aac в результате даёт весьма приемлимое качество звучания, которое вполне можно слушать в пути, когда вокруг постоянно присутствует шум города, людей и жизни.

Вернуться к содержанию