l 티맥스에이아이 자체 테스트 수행… 저음질 통화 음성 인식률 높아
l 음절 에러 비율 한 자리 수준… 우수한 기술력 바탕으로 상용화 기대감 ↑
l 티맥스에이아이 “기업별 AI 컨택 센터 유선 문의 응대에 도움될 것”
인공지능(AI) 플랫폼·서비스 전문 기업 티맥스에이아이는 올 연말 상용화를 앞둔 자사 STT(Speech to Text·음성 인식) 모델이 자체 수행 인식 성능 테스트에서 우수한 결과를 보였다고 7일 밝혔다.
티맥스에이아이에 따르면, 이번 테스트는 저음질 전화망 음성인식 데이터 샘플 4만 763개 및 고객 응대 음성 샘플 2만 1788개를 대상으로 수행됐다. 음성 데이터를 들려주고 STT 모델이 원본에 얼마나 가깝게 텍스트화하는 지를 측정했다.
음절 에러 비율을 의미하는 CER(Character Error Rate)은 8.00%로 나타났다. 이는 100개의 음절 중 92개의 음절을 정확하게 받아 적었음을 의미한다.
고객 응대 음성 테스트에서는 더 높은 정확도를 보였다. 고객 응대 음성 데이터는 매장이나 키오스크에서의 주문·검색·조작·고객 응대 음성 데이터로, 가상 시나리오를 기반으로 제작됐다. 이 테스트에서는 3% 대의 음절 에러 비율을 기록했으며, 지역 방언까지 정확하게 인식해 받아쓰는 것으로 나타났다.
방언까지 정확하게 인식하는 티맥스에이아이 STT는 어떠한 발화자의 음성도 자연스럽게 받아 적는 강점을 갖고 있다. 잡음이 섞인 전화망 음성도 정확하게 텍스트화한다. 이는 최근 기업들의 구축 수요가 급증하고 있는 AI 컨택 센터 운영 시 원활한 유선 문의 응대에 도움이 될 것이란 전망이다.
티맥스에이아이 음성 연구 관계자는 “음성 인식과 음성 합성 외에도 다양한 음성 AI 인식 기술을 확보했다”라며 “단기간 내 상용화 서비스가 가능할 것 보인다”고 말했다.
Comments