다양한 피팅 및 청취 조건에서 보청기를 위한 딥러닝 기반 소음 감소 알고리즘의 객관적 평가


일상 생활에서 우리는 주변 환경을 인식하고 이를 헤쳐 나가는 데 도움이 되는 소리를 접하게 됩니다. 배경 소음과 같은 일부 소리는 음성 명료성을 저해하고, 청취 노력을 증가시키며, 전반적인 편안함을 감소시킬 수 있습니다. 청력 손실이 있는개인의 경우 이러한 문제는 더욱 악화되며, 보청기를 사용할 때에도 시끄러운 환경이 음성 이해력을 저하시키고 인지 부하를 크게 증가시킬 수 있습니다. 이러한 어려움을 완화하기 위해 보청기는 원치 않는 소음을 줄이고 원하는 음성 신호를 향상시키기 위해 설계된 신호 처리 전략을 사용합니다. 이러한 전략에는 아래에서 자세히 설명하는 마이크 배열 빔포밍 및/또는 단일 채널 노이즈 감소 기술이 포함됩니다.

 

단일 채널 잡음 감소(NR) 알고리즘은 오랫동안 보청기 신호 처리의 핵심 구성 요소로, 공간 정보 없이 배경 잡음을 감쇠시켜 신호 대 잡음비(SNR)를 개선하는 것을 목표로 하고 있습니다. 이 알고리즘들은 일반적으로 시간-주파수 영역에서 작동하며, 잡음이 지배하는 시간-주파수 영역의 이득 감소 또는 적응 필터링을 적용합니다. 일반적인 접근 방식으로는 스펙트럼 뺄셈, 위너 필터링, 최소 평균 제곱 오차(MMSE) 추정기 등이 있습니다.

 

NR 알고리즘은 청취 경험을 향상시키기 위해 보청기에 널리 구현되어 있지만, 음성 이해에 미치는 영향은 연구와 청취 조건에서 일관성이 없습니다. 이러한 방법들은 배경 소음의 성가심을 줄일 수 있으며 청취 노력을 줄이는 데 어느 정도 도움이 될 수 있지만,특히 비정상적인 소음 환경에서는 음성 가독성이 제한적이거나 전혀 향상되지 않는 경우가 많습니다. 주요 과제는 특히 둘 다 겹치는 주파수 영역을 차지하거나 시간이 지남에 따라 비슷하게 변동하는 경우 음성과 잡음을 정확하게 구별하는 것입니다. 따라서 기존의 단일 채널 NR 방법은 응답 시간이 느리고, 낮은 SNR에서의 성능 저하, 입력 신호의 특성에 대한 의존성 등 여러 가지 한계에 직면해 있습니다. 따라서 보청기의 적응형 필터링(전통적인 소음 감소) 방법은 일반적으로 음성 명료성을 크게 향상시키지 못하는 것으로 알려져 있습니다.

 

보청기 사용자의 음성 인식을 향상시키는 가장 효과적인 전략 중 하나는 빔포밍 처리를 사용하는 것입니다. 이 기술은 들어오는 소리의 공간적 특성을 활용하여 SNR을 향상시켜 복잡한 음향 장면에서 음성 신호에 더 잘 접근할 수 있도록 하는 것을 포함합니다. 보청기에서 빔포밍 처리는 마이크 배열을 활용하여 특정 방향, 일반적으로 앞쪽에서 오는 소리를 향상시키면서 다른 방향의 소음을 억제합니다. 보청기 빔포밍 처리 시스템의 주요 구성 요소에는 고정 또는 적응형 빔포밍 마이크, 배경 소음을 줄이는 이득 제어 전략, SNR 개선을 목표로 하는 보완적인 디지털 소음 감소 알고리즘이 포함됩니다.

 

 

초기 디지털 빔포밍 보청기에서 이 접근 방식은 측면 및 후면 방향의 노이즈를 완화하여 전면에 제시된 음성의 선명도를 향상시키는 것으로 나타났습니다. 빔포밍은 시끄러운 환경에서 음성 명료도를 크게 향상시킬 수 있지만, 축을 벗어난 방향에서 나오는 원하는 소리를 감쇠시키거나 특히 모노럴 빔포밍의 경우 바이노럴 신호를 변경할 수도 있습니다. 그 결과, 사용자들은 동적 또는 다중 화자 시나리오에서 대화 후 공간 인식이 감소하고 어려움을 겪을 수 있습니다. 이러한 결함을 해결하기 위한 최근의 개발로는 동적 음향 환경에서 유연성과 공간 선택성을 향상시키는 적응형, 바이노럴 연결형, 비대칭형, 멀티빔 빔포밍 시스템이 포함됩니다.

 

요약하자면, 일반적인 보청기 소음 감소 전략에는 시간에 따라 변하는 소음을 억제하기 위해 필터 매개변수를 동적으로 조정하는 이득 감소 및/또는 적응형 필터링과 빔포밍을 통한 공간 필터링이 포함됩니다, 원하는 방향에서 소리를 향상시키는 동시에 비타겟 영역에서 나오는 원치 않는 신호를 억제합니다. 이러한 프로세서는 널리 구현되며, 주로 정상 상태 배경 소음이나 음성 소스가 공간적으로 분리되어 청취자 앞에 위치하는 등 제한된 시나리오에서 효과를 입증합니다. 공간적 분리가 덜 뚜렷하거나 매우 역동적인 환경에서는 그 효과가 크게 감소합니다. 따라서 연구들은 보청기 사용자들이 직면한 실제 문제를 계속 강조하며, 다양한 음향 환경에서 음성 명료성과 청취 편안함을 향상시키기 위해 효과적인 소음 감소와 빔포밍의 필요성을 강조하고 있습니다.

 

최근 딥러닝의 발전은 여러 분야에 영향을 미쳤습니다. 보청기의 맥락에서 딥러닝의 등장은 보청기에서 멀티프로그램 사용을 자동화하는 데 도움이 되는 일반적인 특징인 음향 장면 분류로 이어졌습니다. 최근에는 음성 인식 및 향상과 같은 분야에서 DNN 기반 모델을 사용하는 애플리케이션이 도입되었습니다.

 

이전 연구들은 노이즈 제거를 위한 딥러닝 기법과 겹치는 스피커를 분리하는 기법이 인공와우 임플란트 사용자와 지속적인 SNR 하에서 심각하거나 심각한 청력 손실을 겪는 사람들의 음성 명료성을 향상시킬 수 있음을 보여주었습니다. 유사하게 컴퓨터 음성 분리에서 심층 신경망과 이상적인 비율 마스크 추정을 결합하여 초기 가능성을 보여주었습니다. 그들의 결과는 청취자들의 이해도가 크게 향상되었음을 시사하며, 딥러닝과 고전적인 마스킹 기반 접근 방식의 통합을 검증했습니다.

 

최근 연구에 따르면 딥러닝 기반 모델은 보청기 사용자의 배경 소음을 줄이고 음성 명료성을 크게 향상시킬 수 있는 상당한 가능성이 있는 것으로 나타났습니다. 최근 여러 연구에 따르면 DNN 기반 알고리즘이 인공지능 임플란트를 사용하는 청각 장애 청취자를 포함하여 다중 화자의 옹알이나 잔향 조건과 같은 매우 어려운 환경에서도 음성 명료성을 향상시킬 수 있다고 합니다.

 

 

* 원문참조 : Sage Journals
https://journals.sagepub.com/doi/10.1177/23312165251396644

 

이편한보청기 일산센터 문의,상담

(전화) 031-994-2544 (ARS) 0507-1424-2544

 

 

 


댓글

Designed by JB FACTORY