뉴스
 








 
 
 




전송 2021-04-07 11:40
[뉴스]

구글, 기계학습으로 음성통화 대역폭 줄이는 Lyra 코덱 베타 출시

구글(Google)이 음성통화 대역폭을 줄일 수 있는 새로운 Lyra 코덱의 베타 버전을 선보였다.


구글은 6일(현지시간) 오픈소스 블로그를 통해 기계학습을 사용해 고품질 음성 통화를 생성하는 혁신적인 새로운 오디오 코덱 Lyra를 보편적으로 사용할 수 있도록 오픈 소스 베타 버전을 공개한다고 밝혔다.

이번 릴리즈에는 개발자가 리눅스(Linux)에서 개발하면서 64-bit Arm 안드로이드 플랫폼에 최적화된 Lyra로 오디오를 인코딩 및 디코딩하는데 필요한 도구를 제공한다.



Lyra 아키텍처는 인코더와 디코더 두 부분으로 나눠지는데, 누군가 전화기에 대고 말하면 인코더는 음성의 고유한 속성을 포착해 40ms 단위로 추출한 다음 압축되어 네트워크를 통해 전송한다.

이를 다시 오디오 파형으로 변환하는 것이 디코더의 역할인데 기존 코덱은 이를 디지털 신호 처리(DSP)를 기반으로 수행하지만 Lyra 아키텍처는 고품질 음성 신호를 재구성하는 특정 유형의 기계 학습 모델을 사용하는 것으로 알려졌다.

구글 Lyra가 Opus와 같은 다른 코덱에 비해 우수한 품질을 위해 원시 오디오를 3kbps로 압축하며, 이것이 완전한 대안은 아니지만 연결이 불안정하거나 모바일 데이터 제한이 있는 환경과 같은 시나리오에서 의미있는 대역폭 절약이 가능하다고 설명했다.



Lyra 코드는 속도, 효율성 및 상호 운용성을 위해 C++로 작성됐으며, 철저한 단위 테스트를 위해 Abseil이 포함된 Bazel 빌드 프레임워크와 GoogleTest 프레임워크를 사용한다.

핵심 API는 파일 및 패킷 레벨에서 인코딩 및 디코딩을 위한 인터페이스를 제공하며, 다양한 필터 및 변환을 포함하는 완전한 신호 처리 도구 체인도 제공된다.

예제 앱은 안드로이드 NDK와 통합되어 네이티브 Lyra 코드를 Java 기반 안드로이드 앱에 통합하는 방법을 보여준다. 또한 Lyra를 실행하는데 필요한 가중치 및 벡터 양자화기를 제공한다.

Lyra 코덱 v0.0.1 베타 버전의 코드와 데모는 GitHub에서 확인할 수 있다.


  태그(Tag)  : 구글, 머신러닝, 안드로이드,
관련 기사 보기
[테크닉] CPU 제조사가 만든 OC 초보와 고수용 툴, 인텔 퍼포먼스 맥시마이저와 XTU
[리뷰] QLED 더하고 소비전력 줄이고, 와사비망고 WM 550 QLED UHD 스마트TV AI 와글와글
[리뷰] 비대면 시대 일상과 문화 생활을 위해, 넷기어 뮤럴 와이파이 디지털 액자
[리뷰] 와사비망고 안드로이드 인증 4K HDR TV, WM UN650 UHD 스마트TV AI 와글와글
[리뷰] 비지니스 환경에 딱 맞는 스마트 프로젝터, BenQ EH600
[취재] 가변 망원 카메라와 4K HDR 120Hz 화면 탑재, 소니 엑스페리아 1 III 발표
태그(Tags) : 구글, 머신러닝, 안드로이드,     관련기사 더보기

  이수원 수석기자 / 필명 폭풍전야 / 폭풍전야님에게 문의하기 swlee@bodnara.co.kr
남들 좋다는 것은 다 따라 하지만 정작 깊게 파고들지는 못하는 성격이다. 정말 좋아하는 일은 취미로 하랬는데, 어쩌다 직업이 되는 바람에 일과 지름이 일심동체인 삶을 살고 있다.
기자가 쓴 다른 기사 보기

Creative Commons License 보드나라의 기사는 저작자표시-비영리-변경금지 2.0 대한민국 라이선스에 따라 이용할 수 있습니다. Copyright ⓒ 넥스젠리서치(주) 보드나라 미디어국
싸이월드 공감 기사링크 퍼가기 기사내용 퍼가기 이 기사를 하나의 페이지로 묶어 볼 수 있습니다. 출력도 가능합니다.
홈으로 탑으로
보드나라 많이본 기사
LG전자, 차세대 신발관리기 슈스타일러 출시 예정
인텔 12세대 코어 CPU 엘더 레이크 쿨러홀 변경, 별도 브라켓 필요
인텔 12세대 코어 CPU 엘더 레이크, 워크스테이션용 3분기 출시?
HDD와 SSD도 품귀? 중국서 신규 가상화폐에 사재기 발생
신규 아키텍처로 8코어지만 10코어급 성능, 인텔 코어 i9-11900K
USB 대신 들고다니는 SSD?,PNY CS2060 프로 엘리트 외장 SSD
대원씨티에스가 만드는 옵션 타협 없는 PC, DWCTS ASUS MASTER ROG PC
와이파이6 시대를 저렴하게 대비해보자,EFM ipTIME AX2004M 유무선공유기
   이 기사의 의견 보기
트위터 베타서비스 개시! 최신 PC/IT 소식을 트위터를 통해 확인하세요 @bodnara

기자의 시각이 항상 옳은것은 아닙니다. 나머지는 여러분들이 채워 주십시요.

2014년부터 어려운 이야기를 쉽게 하는 것으로 편집방침을 바꿉니다.
ㅇㅇ / 21-04-08 2:16/ 자국/ 신고/ 이댓글에댓글달기
-On Mobile Mode -
90년대 9600 bps 모뎀으로 주고 받는 음성보다 3배나 적은 대역폭이라니 놀랍네요. 실시간 Speech-To-Text <=> Text-To-Speech에서 나아가 이제는 실시간으로 성문(聲紋) feature를 얻어 내서 입력 음성과 유사한 소리로 출력해주는 Feature-To-Speech네요.
닉네임 웹봇방지

홈으로 탑으로
 
 
2021년 04월
주간 히트 랭킹

[결과발표] 2021년 1분기 포인트 소진 로또 28
즐겁고 행복한 설 명절 보내십시요
[결과발표] '빙하처럼 시원한 디자인의 PC 4
[결과발표] '2020 베스트 어워드 3차 이벤 2
[결과발표] '보드나라 선정, 2020 베스트 19

실시간 댓글
소셜 네트워크