Google의 'Hum To Search'노래 식별 작동 방식

Google은 최근 허밍을 기반으로 노래를 빠르게 식별 할 수있는 새로운 'Hum To Search'기능을 출시했습니다. 알아야 할 사항이 있습니다.



지난 달, 구글 흥얼 거리며 노래를 검색 할 수있는 기능을 출시했습니다. 이 멜로디 스타일의 음악 검색 방법은 완전히 새로운 것은 아닙니다. Shazam과 같은 앱을 사용하면 사용자가 라디오에서 듣는 노래를 찾을 수 있기 때문입니다. 그러나 구글은 사용자가 그 단어를 기억할 수없는 노래를 단순히 흥얼 거리게함으로써 한 걸음 더 나아가고있다.

Google의 혁신가들은 수년 동안 음악 인식 기술을 연구 해 왔습니다. Google은 2017 년에 모바일 장치에 저전력 음악 인식 기능을 제공하는 기능인 Now Playing on the Pixel 2를 출시했습니다. 1 년 후 Google 앱의 SoundSearch 기능에 동일한 기술이 도입되었습니다. 2020 년으로 빨리 감기, Google은 사용자의 혀 끝으로 노래 검색을 간소화하는 방법을 찾았습니다.








관련 : Google 검색 결과를 강화하는 방법

사용자는 최신 버전의 구글 앱에서 마이크 아이콘을 탭하고 ' 이 노래가 뭐지? '또는' 노래 검색 '버튼을 누른 다음 10-15 초 동안 허밍을 시작합니다. 구글의 기계 학습 알고리즘은 허밍을 가져다가 잠재적 인 노래와 일치 시키려고합니다. 새로운 기능은 Google 어시스턴트 또한 간단히 ' Hey Google,이 노래가 뭐지? '그리고 그 곡을 흥얼 거렸다. 이 새로운 기술은 현재 Android에서 20 개 언어로 제공되지만 iOS에서는 영어로만 제공됩니다.



Google의 'Hum To Search'뒤에 숨겨진 과학

구글은 험투 서치 (Hum To Search) 기술이 노래를 직접 찾는 대신 기존 멜로디 버전의 데이터베이스와 일치 시키려고하는 멜로디 검색에 대한 다른 접근 방식과 대조적으로 작동한다고 말한다. Google의 방법 , 기술 ' 중간 표현을 생성하지 않고 노래의 스펙트로 그램에서 멜로디 임베딩 생성 . ' 기본적으로이 접근 방식은 다른 허밍 버전과 일치시킬 필요없이 허밍 멜로디를 원본 녹음에 직접 일치시킬 수 있어야합니다. Google은 이전 기술인 Now Playing 및 SoundSearch에 사용 된 음악 인식 모델을 수정하여 허밍 녹음에 사용할 수 있도록했습니다. 여기에는 동일한 멜로디를 포함하는 오디오 쌍에 대한 임베딩을 생성하도록 기계 학습 기술을 훈련시키는 것이 포함되었습니다. 그 결과, 50 만 개가 넘는 노래 데이터베이스로 높은 수준의 정확성에 도달하는 시스템이 탄생했다고 Google은 말합니다.

이 모든 것이 Google이 완전히 기억할 수없는 노래를 갖는 문제에 대처할 수있는 방법을 과학적으로 찾았다는 사실에 더해집니다. 당연히 2020 년 가장 시급한 문제는 아니지만 많은 사람들이 노래의 이름을 기억하고 하루 종일 머릿속에 갇혀있는 경험에 익숙 할 것입니다. 사용자가 가사를 기억하지 못하거나 기본적인 콧노래를 넘어서는 곡조차도 Google은 이제 해결책을 가지고 있습니다.

출처: 구글