음성 명료성을 향상시키기 위한 수단, 딥 뉴럴 네트워크(DNN) 기술

 

보청기 제조의 현재 추세는 보청기 착용자의 가장 흔한 불만, 배경 소음의 난청 문제를 해결하기 위해 인공지능을 도입하는 것입니다. 배경 소음은 음성 인식을 줄이고 청취 노력을 증가시킬 수 있습니다. 최신 MarketTrak에 따르면 첨단 디지털 신호 처리에도 불구하고 보청기에 대한 전반적인 만족도(82%)가 계속해서 좋다고 보고했지만, 보청기 착용자의 70%만이 배경 소음에서 청력 대화에 만족한다고 답했습니다. 이는 '배경 소음을 최소화하는 능력'에 대한 불만률이 가장 높았던 MarkTrak 2022 보고서와 일치합니다. 배경 소음에서 더 나은 청력을 위해 신호 대 잡음비(SNR)를 개선하는 방법에는 소음 감소 및 빔포밍을 사용하는 방향성 마이크와 같은 전략이 포함되어 있습니다. 

 

인공지능(AI)이라는 포괄적인 용어 내의 한 분야인 머신러닝은 청각 보조 기기에서 20년 이상 사용되어 자동 프로그램 분류 시스템 내에서 청취 환경을 분류하고 기기의 설정을 조정하는 데 사용되어 왔습니다. 수년 동안 개선된 애플리케이션 덕분에 마이크 빔포머와 같은 구성 요소를 보다 정교한 환경 분류와 첨단 제어가 가능해졌습니다. 소음에서 청취 노력을 줄이고 음성 인식을 개선하기 위한 지속적인 노력의 일환으로, 순환 신경망(RNN)과 심층 신경망(DNN)을 포함한 AI의 사용이 연구되었으며 아래에서 논의됩니다.

 

케샤바르지 등(2019)은 헤드폰을 통해 제공되는 적용된 RNN 모델을 통해 처리된 신호가 전통적인 소음 감소 기법에 비해 음성 인식 점수가 향상되고 청취 노력이 감소했으며, 특히 불리한 음향 환경에서 신호 처리가 없었다고 보고했습니다. Fedorov 등(2020)은 청각 품질의 지각 손실 없이 실시간 배포가 가능한 장단기 메모리(LSTM)와 같은 RNN 모델을 검토하여 보청기에 사용할 수 있는 잠재력을 강조했습니다. RNN은 순차적 데이터의 시간적 종속성을 모델링하도록 설계되어 음성의 동적 특성을 포착하는 데 효과적이지만, 피드포워드 DNN은 계산 효율성, 안정성 및 실시간 처리에 대한 적합성 측면에서 장점을 제공합니다. 이러한 특성으로 인해 DNN은 낮은 지연 시간과 일관된 성능이 중요한 보청기에 특히 적합합니다. DNN은 특히 어려운 청취 환경에서 음성 향상을 위한 강력한 패러다임으로 부상했습니다. DNN은 노이즈가 있는 음성과 깨끗한 음성 간의 복잡한 매핑을 학습할 수 있는 데이터 기반 솔루션을 제공합니다.

 

청력 손실이 있는 청취자를 위한 DNN의 초기 응용 중 하나는 Gohring 등(2017)에 의해 제안되었으며, 그는 피드포워드 DNN이 인공와우 사용자의 가독성 측면에서 고전적인 소음 감소 알고리즘을 능가할 수 있음을 보여주었습니다. 최근에는 생성 및 음성 기반 알고리즘을 기반으로 개발된 DNN 모델이 깨끗한 신호와 시끄러운 신호의 WavLM 기반 자가 지도 음성 표현 사이의 거리를 지각적으로 동기 부여된 손실 함수로 사용하여 보청기용 노이즈 제거 모델을 훈련시켰습니다, 추론 복잡성을 증가시키지 않으면서도 인식 및 품질 지표를 개선할 수 있습니다. 또한, DNN 알고리즘 중 생성 기반 음성 향상 아키텍처는 음성의 지각적 품질과 명료성을 유지하면서 잡음을 효과적으로 억제할 수 있는 능력으로 인해 상당한 주목을 받고 있습니다. 이러한 방법들은 일반적으로 생성 모델과 판별 모델의 조합을 사용하여 노이즈가 있는 음성에서 깨끗한 음성으로 복잡한 매핑을 학습합니다. 이러한 프레임워크는 특히 보이지 않는 노이즈 조건에 대한 강력한 일반화가 필요한 애플리케이션에서 음성 향상의 강력한 구조로 부상했습니다. 따라서 딥러닝은 특히 어려운 음향 환경에서 청력 손실이 있는 사람과 없는 사람의 음성 가독성을 향상시킬 수 있는 잠재력을 가지고 있습니다.

 

여러 연구에 따르면 여러 마이크를 활용한 딥러닝 알고리즘이 소음이 있거나 반향이 있는 상황에서 인공와우 사용자의 음성 신호를 효과적으로 향상시키는 것으로 나타났습니다. 이 연구들은 음성 명료도에서 상당한 개선을 보고했으며, 다중 마이크 구성이 전방위 단일 마이크 설정이나 전통적인 소음 감소 전략보다 더 나은 결과를 도출했다고 합니다.

 

Diehl 등(2022, 2023)은 모바일 기기에서 작동하는 실시간 딥러닝 기반 노이즈 제거 시스템을 도입하여 향상된 오디오를 보청기로 직접 스트리밍했습니다. 이 시스템은 보청기 사용자의 음성-인-노이즈 이해도를 크게 향상시켰으며, 기존 보청기 처리에 비해 주관적인 평가가 40% 이상 증가했습니다. 이 연구는 고급 딥러닝 알고리즘을 휴대용 장치에 통합하는 것의 가능성을 강조하며, 일상적인 환경에서 음성 명료성을 향상시키기 위한 실질적인 솔루션을 제공했습니다.Diehl의 연구를 바탕으로, DNN 기반 소음 감소 알고리즘이 Phonak Audéo I90-Sphere 수신기-인 더 캐널 보청기에 직접 구현되었습니다.

 

* 출처 : Saga Journals

* 연구참조기사 :    The Effect of Deep Neural Network Implementation on Speech Recognition, Listening Effort, and Sound Quality in Older Adults With Mild to Moderately Severe Hearing Loss

 

 

이편한보청기 일산센터 문의,상담

(전화) 031-994-2544 (ARS) 0507-1424-2544

 

이편한보청기 일산센터 경기 고양시 일산서구 중앙로 1576

 

 

[이전 발행 글]

[청력리포트 (Hearing Report)] - 전반적인 청각 관리 관점 : 새로운 기술과 모든 사람들의 포괄적 이점 - 2부

 

전반적인 청각 관리 관점 : 새로운 기술과 모든 사람들의 포괄적 이점 - 2부

전체적인 관점에서 청각 기술 이해하기인공지능(AI)을 활용한 새로운 접근 방식은 청력 연구와 청력 관리를 점점 더 구체화하고 있습니다. 듣기 상황을 자동으로 분류하고 설정을 조정하는 것

easyhearing.tistory.com

[청력리포트 (Hearing Report)] - 전반적인 청각 관리 관점 : 새로운 기술과 모든 사람들의 포괄적 이점 - 1부

 

전반적인 청각 관리 관점 : 새로운 기술과 모든 사람들의 포괄적 이점 - 1부

새로운 AI 기반의 보청기를 포함한 첨단 기기 기능은 청각 뿐만 아니라 전반적인 월빙에도 영향을 미칠 수 있습니다.- 저자 : By Maren Stropahl, PhD; Kevin Seitz-Paquette, AuD건강한 노화를 위해서는 청력을

easyhearing.tistory.com

댓글

Designed by JB FACTORY