Вверх

Как работают приложения для идентификации музыки, такие как Shazam?

5 февраля 2021 |

Как работают приложения для идентификации музыки, такие как Shazam?

Shazam App iPhone Identification Shazam

Поначалу приложения для идентификации музыки кажутся волшебными, но под капотом скрывается сложный алгоритм, который может мгновенно находить песни. Вот как они работают.

Магия музыкальной идентификации

Вероятно, это случилось со всеми нами. Вы ужинаете в хорошем ресторане, гуляете в кафе или гуляете по магазину, как вдруг слышите из динамиков отличную песню. Может быть, это песня, которую вы слушали раньше, или трек, который вы никогда не слышали. Итак, вы достаете свой телефон, открываете Shazam и поднимаете устройство к потолку. Приложение мгновенно расскажет, что это за песня, кто ее исполнитель и где ее транслировать.

Они быстрые, очень точные и могут идентифицировать даже самые непонятные песни. В двух словах, они работают, изолируя песню от записи и просматривая ее в обширной базе данных треков. Но технология, лежащая в основе того, как они это делают, довольно сложна и впечатляет.

Вы можете быть шокированы, узнав, что приложение Shazam, которое мы знаем сегодня, было выпущено еще в 2002 году, и система была такой же точной и быстрой. тогда как сейчас. Это все благодаря уникальному алгоритму, который произвел революцию в музыкальном мире.

Дело не только в текстах песен

На первый взгляд приложения для идентификации музыки, такие как Shazam, могут показаться простыми. Вы можете подумать, что они просто слушают текст, как любой голосовой помощник, и ищут его в базе данных с текстами песен, чтобы сказать вам, что это за песня.

Однако большинство приложений для идентификации музыки способны сказать как называется инструментал или даже исполнитель кавер-версии. Это потому, что вместо анализа текста песни они ищут в своих обширных базах данных «отпечатки пальцев», уникальные для каждой песни.

Технология снятия отпечатков пальцев Shazam on an iPhone X Денис Приходов / Shutterstock.com

Скорее всего, у вас есть устройства, которые можно разблокировать с помощью отпечатка пальца, который представляет собой расположение небольших линий на вашем пальце, уникальных для вас. Точно так же, когда вы поднимаете микрофон, чтобы записать короткий клип песни, этот клип превращается в шаблоны данных, которые Shazam или другое приложение может искать в своей базе данных.

На первый взгляд этот метод кажется склонен к нескольким проблемам. В большинстве случаев, когда вы слышите музыку на публике, из-за динамиков слышен фоновый шум и искажения, которые могут сделать песни неидентифицируемыми или привести к неточному совпадению. Кроме того, даже в коротком звуковом клипе содержится много данных, что может замедлить поиск этих закономерностей в базе данных, содержащей миллионы песен.

В интервью журналу Scientific American в 2003 году Эйвери Ли-Чун Ван, главный специалист по данным и соучредитель Shazam, объяснил, как их алгоритм решает эти проблемы. Информация аудиоклипа может быть визуализирована с помощью трехмерной диаграммы, известной как спектрограмма, которая представляет изменение частот за период времени. Также учитывается амплитуда, т. Е. Насколько громкий звук. Это представлено на спектрограмме с использованием интенсивности цвета.

Shazam Music Spectrogram Эйвери Ли-Чун Ван / Шазам

Точно так же, как люди не могут воспринимать звук, если они не находятся на определенной частоте, вместо того, чтобы принимать во внимание всю песню при выполнении поиска , Shazam улавливает только «пики», то есть самое высокое содержание энергии в аудиоклипе. Отпечатки пальцев, которые он фиксирует, берут только точки с наивысшей частотой в заданном временном интервале, а затем — точки пиковой амплитуды на этих частотах.

В исследовательской работе для Колумбийского университета Ван заявил, что этот метод позволяет им удалить большую часть ненужных частей аудиоклипа, например фоновый шум, и устранить искажения. Это также делает размер отпечатков достаточно маленьким, чтобы идентифицировать песню в их обширной базе данных за считанные миллисекунды.

Влияние Shazam

Помимо того, что они полезны для обычных слушателей, которые слышат песню, которая им нравится, приложения для идентификации музыки также помочь сформировать музыкальный мир.

Радиостанции и потоковые сервисы часто используют данные о том, что люди чаще всего используют Shazam, чтобы выяснить, какие треки слушают публика. Это полезно, поскольку указывает на броскость песни и потенциальную популярность независимо от исполнителя. Когда вы определите песню в приложении, вы сразу увидите, сколько людей пытались ее идентифицировать.

Soundhound Music Identification Soundhound

С момента появления Shazam появилось несколько конкурентов. вверх.Soundhound утверждает, что может идентифицировать песню просто по тому, что вы ее поете или напеваете, что дает неоднозначные результаты. Также имеется идентификатор песни, интегрированный с голосовыми приложениями, такими как Google Assistant, которые работают очень аналогично системе Shazam.

Как работают приложения для идентификации музыки, такие как Shazam?


Напишите пару строк: