인간의 청각 모델로 가능성을 보여주는 심층 신경망(Deep Neural Networks) - 일산 이편한보청기

 

인간 청각 시스템의 구조와 기능을 모방하는 계산 모델(Computational model)은 연구자들이 더 나은 보청기, 인공와우, 두뇌-공학 인터페이스를 설계하는 데 도움이 될 수 있습니다. 미 MIT의 새로운 연구에 따르면 머신러닝에서 파생된 최신 계산 모델이 이 목표에 더 가까워지고 있는 것을 발견했습니다.

 

청각 작업을 수행하도록 훈련된 심층 신경망에 대한 대규모 연구에서 MIT 팀은 이러한 모델의 대부분이 사람들이 동일한 소리를 들을 때 인간 두뇌에서 나타나는 표현의 속성을 공유하는 내부 표현을 생성한다는 것을 보여주었습니다.이 연구는 또한 이러한 유형의 모델을 가장 잘 훈련하는 방법에 대한 통찰력을 제공합니다. 

 

연구원들은 배경 소음을 포함한 청각 입력에 대해 훈련된 모델이 인간 청각 피질의 활성화 패턴을 더 밀접하게 모방한다는 것을 발견했습니다.

 

“이 연구가 차별화되는 점은 지금까지 이러한 종류의 모델을 청각 시스템과 가장 포괄적으로 비교했다는 것입니다. 이 연구는 머신 러닝에서 파생된 모델이 올바른 방향으로 나아가는 단계임을 시사하며, 무엇이 이 모델을 더 나은 뇌 모델로 만드는 경향이 있는지에 대한 몇 가지 단서를 제공합니다.”라고 MIT의 뇌 및 인지학 부교수인 Josh McDermott는 말합니다.

 

* 추가 연구자료 : 청각기기의 심층신경망 Deep Neural Networks in Hearing Devices

 

Deep Neural Networks in Hearing Devices

For many hearing care professionals, the term “Deep Neural Networks” (DNNs) is a relatively new term.

hearingreview.com

 

청각 모델

 

심층 신경망은 특정 작업을 수행하기 위해 엄청난 양의 데이터를 학습할 수 있는 여러 계층의 정보 처리 장치로 구성된 계산 모델입니다. 이러한 유형의 모델은 많은 응용 분야에서 널리 사용되었으며, 신경과학자들은 이러한 시스템이 인간의 뇌가 특정 작업을 수행하는 방법을 설명하는 데 사용될 수 있는 가능성을 연구하기 시작했습니다.

 

“머신러닝으로 구축된 이러한 모델은 이전 유형의 모델에서는 불가능했던 규모로 행동을 중재할 수 있으며, 이는 모델의 표현이 뇌에서 발생하는 것을 포착할 수 있는지 여부에 대한 관심으로 이어졌습니다.”라고 Tuckute는 말합니다.

 

신경망이 작업을 수행할 때 처리 장치는 단어나 기타 유형의 소리와 같이 수신하는 각 오디오 입력에 대한 응답으로 활성화 패턴을 생성합니다. 입력에 대한 이러한 모델 표현은 동일한 입력을 듣는 사람들의 fMRI 뇌 스캔에서 볼 수 있는 활성화 패턴과 비교할 수 있습니다.

 

2018년, McDermott와 당시 대학원생인 Alexander Kell은 그들이 청각 작업(오디오 신호에서 단어를 인식하는 것과 같은)을 수행하도록 신경망을 훈련시켰을 때, 모델에 의해 생성된 내부 표현은 같은 소리를 듣는 사람들의 fMRI 스캔에서 볼 수 있는 것과 유사성을 보였다고 보고했습니다.

 

그 이후로 이러한 유형의 모델이 널리 사용되었기 때문에 McDermott의 연구 그룹은 인간의 뇌에서 볼 수 있는 신경 표현을 근사화하는 능력이 이러한 모델의 일반적인 특성인지 확인하기 위해 더 큰 모델 세트를 평가하기 시작했습니다.

 

이 연구를 위해 연구원들은 청각 작업을 수행하도록 훈련된 공개적으로 이용 가능한 9개의 심층 신경망 모델을 분석했고, 또한 두 개의 다른 아키텍처를 기반으로 14개의 모델을 자체적으로 만들었습니다. 이러한 모델의 대부분은 단어 인식, 화자 식별, 환경 소리 인식, 음악 장르 식별 등 단일 작업을 수행하도록 훈련되었으며, 그 중 두 모델은 여러 작업을 수행하도록 훈련되었습니다.

 

연구원들이 이 모델들에 인간의 fMRI 실험에서 자극으로 사용되었던 자연적인 소리를 제시했을 때, 그들은 내부 모델 표현이 인간의 뇌에 의해 생성된 것과 유사성을 나타내는 경향이 있다는 것을 발견했습니다. 뇌에서 보는 것과 가장 유사한 표현을 가진 모델들은 하나 이상의 과제에 대해 훈련을 받았고 배경 소음을 포함하는 청각 입력에 대해 훈련을 받은 모델들이었습니다.

Feathe는 "소음 속에서 모델을 훈련시키면 그렇지 않은 경우보다 더 나은 뇌 예측을 제공하는데, 이는 많은 실제 청각이 소음 속에서 청각을 포함하기 때문에 직관적으로 합리적이며, 이는 청각 시스템이 적응된 것일 가능성이 높다"고 말합니다.

계층적 처리

이 새로운 연구는 또한 인간의 청각 피질이 어느 정도 계층적인 조직을 가지고 있다는 생각을 뒷받침하는데, 이 조직에서 처리는 별개의 계산 기능을 지원하는 단계들로 나누어집니다. 2018년 연구와 마찬가지로 연구진은 모델의 초기 단계에서 생성된 표현이 1차 청각 피질에서 볼 수 있는 표현과 가장 유사한 반면, 이후 모델 단계에서 생성된 표현은 1차 피질을 넘어 뇌 영역에서 생성된 표현과 더 유사하다는 것을 발견했습니다.

 

게다가, 연구원들은 다른 일들에 대해 훈련을 받은 모델들이 오디션의 다른 측면들을 더 잘 복제한다는 것을 발견했습니다. 예를 들어, 음성 관련 작업에 대해 훈련된 모델은 음성 선택 영역과 더 유사했습니다.

 

Tuckute는 "모델이 정확히 동일한 훈련 데이터를 보고 아키텍처가 동일하더라도 특정 작업에 최적화하면 뇌의 특정 튜닝 특성을 선택적으로 설명한다는 것을 알 수 있습니다."라고 말합니다.

 

McDermott의 연구실은 이제 그들의 연구 결과를 이용하여 인간의 뇌 반응을 재현하는 데 훨씬 더 성공적인 모델을 개발하려고 시도할 계획입니다. 과학자들이 뇌가 어떻게 조직될 수 있는지에 대해 더 많이 배울 수 있도록 돕는 것 외에도, 그러한 모델은 더 나은 보청기, 인공 달팽이관 이식, 그리고 뇌-기계 인터페이스를 개발하는 데 도움을 주기 위해 사용될 수 있습니다.

 

"우리 분야의 목표는 뇌의 반응과 행동을 예측할 수 있는 컴퓨터 모델로 끝나는 것입니다. 우리는 우리가 그 목표에 성공적으로 도달한다면, 그것은 많은 문을 열어줄 것이라고 생각합니다."라고 McDermott는 말합니다.

 

* 원문출처 : The Hearing Review

 

이편한보청기 청각센터 문의, 상담

(전화연결) 031-994-2544


 

 

 

[이편한보청기 일산청각센터 찾아오시는 길]

 

 


 

 방문예약을 남겨주신 분들께는 추가 할인혜택을 제공해드립니다.

댓글

Designed by JB FACTORY