뉴스
 








 
 
 




전송 2021-04-07 11:40
[뉴스]

구글, 기계학습으로 음성통화 대역폭 줄이는 Lyra 코덱 베타 출시

구글(Google)이 음성통화 대역폭을 줄일 수 있는 새로운 Lyra 코덱의 베타 버전을 선보였다.


구글은 6일(현지시간) 오픈소스 블로그를 통해 기계학습을 사용해 고품질 음성 통화를 생성하는 혁신적인 새로운 오디오 코덱 Lyra를 보편적으로 사용할 수 있도록 오픈 소스 베타 버전을 공개한다고 밝혔다.

이번 릴리즈에는 개발자가 리눅스(Linux)에서 개발하면서 64-bit Arm 안드로이드 플랫폼에 최적화된 Lyra로 오디오를 인코딩 및 디코딩하는데 필요한 도구를 제공한다.



Lyra 아키텍처는 인코더와 디코더 두 부분으로 나눠지는데, 누군가 전화기에 대고 말하면 인코더는 음성의 고유한 속성을 포착해 40ms 단위로 추출한 다음 압축되어 네트워크를 통해 전송한다.

이를 다시 오디오 파형으로 변환하는 것이 디코더의 역할인데 기존 코덱은 이를 디지털 신호 처리(DSP)를 기반으로 수행하지만 Lyra 아키텍처는 고품질 음성 신호를 재구성하는 특정 유형의 기계 학습 모델을 사용하는 것으로 알려졌다.

구글 Lyra가 Opus와 같은 다른 코덱에 비해 우수한 품질을 위해 원시 오디오를 3kbps로 압축하며, 이것이 완전한 대안은 아니지만 연결이 불안정하거나 모바일 데이터 제한이 있는 환경과 같은 시나리오에서 의미있는 대역폭 절약이 가능하다고 설명했다.



Lyra 코드는 속도, 효율성 및 상호 운용성을 위해 C++로 작성됐으며, 철저한 단위 테스트를 위해 Abseil이 포함된 Bazel 빌드 프레임워크와 GoogleTest 프레임워크를 사용한다.

핵심 API는 파일 및 패킷 레벨에서 인코딩 및 디코딩을 위한 인터페이스를 제공하며, 다양한 필터 및 변환을 포함하는 완전한 신호 처리 도구 체인도 제공된다.

예제 앱은 안드로이드 NDK와 통합되어 네이티브 Lyra 코드를 Java 기반 안드로이드 앱에 통합하는 방법을 보여준다. 또한 Lyra를 실행하는데 필요한 가중치 및 벡터 양자화기를 제공한다.

Lyra 코덱 v0.0.1 베타 버전의 코드와 데모는 GitHub에서 확인할 수 있다.


  태그(Tag)  : 구글, 머신러닝, 안드로이드,
관련 기사 보기
[테크닉] CPU 제조사가 만든 OC 초보와 고수용 툴, 인텔 퍼포먼스 맥시마이저와 XTU
[리뷰] 안드로이드TV 들어간 4K HDR 홈 프로젝터, 벤큐(BenQ) W2700i
[리뷰] 스마트폰 트렌드 담은 30만원대 자급제폰, 삼성 갤럭시 A32
[리뷰] 디아블로 세계를 모바일 게임에 담았다, 디아블로 이모탈 알파 테스트 해보니
[리뷰] QLED 더하고 소비전력 줄이고, 와사비망고 WM 550 QLED UHD 스마트TV AI 와글와글
[리뷰] 비대면 시대 일상과 문화 생활을 위해, 넷기어 뮤럴 와이파이 디지털 액자
태그(Tags) : 구글, 머신러닝, 안드로이드,     관련기사 더보기

  이수원 수석기자 / 필명 폭풍전야 / 폭풍전야님에게 문의하기 swlee@bodnara.co.kr
남들 좋다는 것은 다 따라 하지만 정작 깊게 파고들지는 못하는 성격이다. 정말 좋아하는 일은 취미로 하랬는데, 어쩌다 직업이 되는 바람에 일과 지름이 일심동체인 삶을 살고 있다.
기자가 쓴 다른 기사 보기

Creative Commons License 보드나라의 기사는 저작자표시-비영리-변경금지 2.0 대한민국 라이선스에 따라 이용할 수 있습니다. Copyright ⓒ 넥스젠리서치(주) 보드나라 미디어국
싸이월드 공감 기사링크 퍼가기 기사내용 퍼가기 이 기사를 하나의 페이지로 묶어 볼 수 있습니다. 출력도 가능합니다.
홈으로 탑으로
보드나라 많이본 기사
AMD RDNA3 GPU는 RTX 3080 Ti 대비 최대 2.5배 성능?
LG 스탠바이미(StanbyME), 사전예약서 완판
클로즈 베타중인 아마존 뉴 월드, 그래픽 카드 사망 유발?
마이크로소프트, 윈도우 11 인사이더 프리뷰 빌드 22000.100 배포
코로나19 언택트 시대 미니 ITX PC 고민끝,AMD 4700S 데스크탑 키트
이번에도 무료 업그레이드, 윈도우 11 호환 논란 해법은?
스팀 게임을 즐기는 휴대용 게임기, 밸브 스팀 덱(Steam Deck) 발표
AMD 세잔과 RTX 3070 결합한 게이밍 노트북, 레노버 리전5 프로 AMD
   이 기사의 의견 보기
트위터 베타서비스 개시! 최신 PC/IT 소식을 트위터를 통해 확인하세요 @bodnara

기자의 시각이 항상 옳은것은 아닙니다. 나머지는 여러분들이 채워 주십시요.

2014년부터 어려운 이야기를 쉽게 하는 것으로 편집방침을 바꿉니다.
ㅇㅇ / 21-04-08 2:16/ 자국/ 신고/ 이댓글에댓글달기
-On Mobile Mode -
90년대 9600 bps 모뎀으로 주고 받는 음성보다 3배나 적은 대역폭이라니 놀랍네요. 실시간 Speech-To-Text <=> Text-To-Speech에서 나아가 이제는 실시간으로 성문(聲紋) feature를 얻어 내서 입력 음성과 유사한 소리로 출력해주는 Feature-To-Speech네요.
닉네임 웹봇방지

홈으로 탑으로
 
 
2021년 07월
주간 히트 랭킹

[결과발표] 2021년 2분기 포인트 소진 로또 18
[결과발표] [20주년 기념] 벤큐 코리아 인 12
[결과발표] [20주년 기념] '[社說] 창간 20 19
[결과발표] 2021년 1분기 포인트 소진 로또 28
즐겁고 행복한 설 명절 보내십시요

실시간 댓글
소셜 네트워크