난청인들을 위한 음성-문자 변환 기술

 

세계 청각연구원들은 끊임없이 변화하는 보청기 기술 환경에 최신 상태를 유지하는 것을 포함하여 건강 관리 제공자로서 여러 역할을 수행합니다. 소비자 기술 또한 끊임없이 변화하고 있으며 이러한 변화를 보청기 기술과 연결하는 것은 청각 전문가들의 추가적인 책임입니다. 새로운 소비자 기술을 통합하면 환자가 활동 제한을 줄이고 삶의 다양한 영역에 대한 참여를 촉진할 수 있습니다. 그러한 기술 중 하나는 음성을 문자로 변환하는 음성-문자 변환입니다. 음성-문자 변환 기술의 이점, 역사적 맥락, 민감도 및 개인 정보 보호 문제를 포함하여 사용에 대한 중요한 임상적 의미를 살펴보겠습니다.

 

음성-문자 변환 기술은 1952년에 등장했으며 계속 발전하고 있습니다. 처음에는 전화 통화 및 받아쓰기 서비스에 대한 구두 응답과 같은 단순하고 일상적인 작업에 사용되었습니다. 초기 시스템은 제한된 단어와 일반적으로 제한된 목소리로 말하는 단어만 인식했습니다. 시스템이 개발됨에 따라 음성 예측 모델은 시스템의 정확도와 속도를 향상시켰습니다. 그러나 시스템은 자연스러운 속도로 말하는 음성을 이해하지 못했으며 많은 오류가 지속되었습니다.

 

2020년에 이 기술은 메모나 아이디어를 구술하고자 하는 기존 데스크탑에서 벗어나 작업하는 개인에게 널리 사용되고있습니다. 책상에서 일하는 사람들도 쓰는 것보다 생각하거나 말하는 것이 더 빠르다면 이 기술이 도움이 될 수 있습니다.

 

가장 최근에 Apple과 Google은 클라우드 기반 데이터를 활용하여 정확성과 속도를 개선하고 사용자 효율성을 높였습니다. 앱은 여러 플랫폼을 통해 쉽게 액세스할 수 있도록 변환본을 클라우드 기반 스토리지에 저장하는 경우가 많습니다. 일부 기능 고려 사항에는 정확성, 단축키, 사용 가능한 언어 및 기술 전문 용어 기능이 포함됩니다. 이용이 가능한 많은 프로그램 중에서 Dragon은 문자 변환에 대한 정확도가 뛰어나고 전문적인 응용 프로그램으로 자주 선택됩니다.

 

Google은 어시스턴트를 통해 Google 사용자는 음성 명령을 사용하고 음성을 텍스트로 변환할 수 있습니다. Apple은 실시간 대화 번역을 위해 iTranslate Converse를 제공하고 38개 언어를 인식합니다. 키보드 사용을 최소화하려는 사용자는 Evernote 또는 Braina를 사용해 볼 수 있습니다. 이 앱은 모든 소프트웨어 프로그램의 음성을 텍스트로 변환합니다. Braina는 특히 전문 용어를 잘 사용하며 Apple 및 Android 장치 모두에서 사용할 수 있습니다. NoNotes의 통화 녹음을 사용하여 전화 통화를 녹음하고 변환할 수 있습니다. 이 기술은 주로 직장에서 사용하도록 판매되었지만 난청이있는 개인을 위한 의사소통 도구로서 상당한 잠재력을 보여줍니다.

 

특히, 몇몇 음성-텍스트 앱이 난청이 있는 개인에게 특히 유용한 것으로 나타났습니다. 이러한 앱은 기본적으로 대화에 대한 실시간 캡션을 제공합니다. 예를 들면 iOS용 Ava, Android용 Google의 Live Transcribe, 두 플랫폼 모두에서 작동하는 Otter AI가 있습니다. 2020년 초에 iOS는 Google 제품이 아니지만 동일한 기능을 많이 제공하는 Live

Transcribe 앱도 출시했습니다. 이러한 앱을 사용하면 난청이 있는 개인이 스마트폰에서 앱이 제공하는 텍스트를 읽어 대화에 액세스할 수 있습니다. 각 앱은 디스플레이, 정확도 및 사용 편의성에서 약간의 이점이 있습니다. 소비자는 앱 기능을 비교하여 자신에게 가장 적합한 기능을 결정함으로써 이익을 얻을 수 있습니다.

 

음성-텍스트 변환 기술은 난청이 있는 개인에게 매우 중요할 수 있습니다. 청력 기술과 인공와우(CI)의 발전으로 이전에는 시각 방식의 의사소통에만 의존했던 환자들에게 청각/구두 의사소통 기회가 제공되었습니다. 오늘날, 많은 환자들, 심지어 중증에서 심도 난청 또는 단어 인식 점수가 낮은 청력도를 가진 환자들조차도 오디션을 사용하여 대화를 나눕니다. 이 환자들은 오디션을 사용하여 대화의 일부 또는 대부분을 이해할 수 있으며 이해를 향상시키기 위해 맥락 단서 또는 기타 청각 종결 기술을 사용할 수 있습니다. 그러나 다른 환자들은 청력을 보충하기 위해 시각적 입력에 계속 의존하고 있습니다.

 

일반적으로 "충분히" 잘 듣지만 특정 상황에서 어려움을 겪고 있는 환자를 혼란스럽게 하는 환경적 요인이  결합될 수 있습니다. 붐비는 식당과 같은 시끄러운 상황은 환자가 채워야 하는 많은 틈을 남깁니다. 어두움은 어음 읽기 신호에 대한 접근을 방해할 수 있는 또 다른 환경 요인입니다. 음성-텍스트 기술은 이러한 상황에서 유용한 도구가 될 수 있습니다.

 

과거에는 수화, 음성 읽기 단서, 자막, CART(Communication Real-Time Translation)를 포함한 시각적 입력은 청각을 보완하거나 대체하는 데 사용되었습니다. 그러나 이러한 각각의 방법에는 어려움도 따릅니다. 일부 환자는 텔레비전 소리를 듣는 데 어려움이 있지만 자막의 크기가 너무 작거나 멀리 떨어져 있기 때문에 자막 기능을 사용할 수 없습니다. 음성-텍스트 기술을 통해 이러한 환자는 확대가능한 자막에 접근할 수 있습니다.

 

청각전문가는 이러한 기술을 여러 가지 방법으로 임상 실습에 통합할 수 있습니다. 첫째, 환자에게 권한을 부여하십시오. 기술은 끊임없이 등장하고 있습니다. 환자는 이전에 음성-문자 앱을 시도했지만 실망했을 수 있습니다. 환자에게 다시 시도해야 할 때가 되었음을 알려 주십시오. 많은 기술과 마찬가지로 일부 환자는 새로운 아이디어에 익숙해지고 이전에 효과가 있었던 것이 더 이상 효과적이지 않다는 생각을 포기해야 합니다. 제품을 시연하는 것은 종종 추상적인 토론보다 더 크게 말합니다(의도적인 말장난). 경우에 따라 정보가 필요한 간병인이거나 앱 설치 및 사용 시작에 더 능숙할 수 있습니다. 보조 청취 기술의 도구 상자에 이 정보를 추가하면 전문가의 능력이 향상됩니다.

 

이 기술에 대해 환자에게 상담할 때 환자의 의사소통에 대한 관점을 세심하게 고려하는 것이 중요합니다.선천적으로 청각장애인이며 청각/청각적 접근을 통해 언어를 배운 사람에게는 시각적 신호를 피하는 데 초기 훈련이 집중되었기 때문에 시각적인 신호를 사용하는 앱의 사용을 제안하는 것은 모욕적일 수 있습니다. 의사소통이 어려운 부분에 대한 논의를 통해 환자가 수용할 수 있는 해결책을 제공할 수 있는 기반을 마련할 수 있습니다.

 

출처 : The Hearing Journal 74(2):p 11,14,15, February 2021.

<Voice-to-Text Technology for Patients with Hearing Loss>

 

<이편한보청기 청각센터

문의상담 (전화연결) 031-994-2544


 

[이편한보청기 일산청각센터 찾아오시는 길]


 방문예약을 남겨주신 분들께는 추가 할인혜택을 제공해 드립니다.

댓글

Designed by JB FACTORY