구글, 기계학습으로 음성통화 대역폭 줄이는 Lyra 코덱 베타 출시 Page 1:: 보드나라

뉴스

-> 단신뉴스

오늘의 주요뉴스

메인

전송 2021-04-07 11:40

[뉴스]
구글, 기계학습으로 음성통화 대역폭 줄이는 Lyra 코덱 베타 출시

구글(Google)이 음성통화 대역폭을 줄일 수 있는 새로운 Lyra 코덱의 베타 버전을 선보였다.

구글은 6일(현지시간) 오픈소스 블로그를 통해 기계학습을 사용해 고품질 음성 통화를 생성하는 혁신적인 새로운 오디오 코덱 Lyra를 보편적으로 사용할 수 있도록 오픈 소스 베타 버전을 공개한다고 밝혔다.

이번 릴리즈에는 개발자가 리눅스(Linux)에서 개발하면서 64-bit Arm 안드로이드 플랫폼에 최적화된 Lyra로 오디오를 인코딩 및 디코딩하는데 필요한 도구를 제공한다.

Lyra 아키텍처는 인코더와 디코더 두 부분으로 나눠지는데, 누군가 전화기에 대고 말하면 인코더는 음성의 고유한 속성을 포착해 40ms 단위로 추출한 다음 압축되어 네트워크를 통해 전송한다.

이를 다시 오디오 파형으로 변환하는 것이 디코더의 역할인데 기존 코덱은 이를 디지털 신호 처리(DSP)를 기반으로 수행하지만 Lyra 아키텍처는 고품질 음성 신호를 재구성하는 특정 유형의 기계 학습 모델을 사용하는 것으로 알려졌다.

구글 Lyra가 Opus와 같은 다른 코덱에 비해 우수한 품질을 위해 원시 오디오를 3kbps로 압축하며, 이것이 완전한 대안은 아니지만 연결이 불안정하거나 모바일 데이터 제한이 있는 환경과 같은 시나리오에서 의미있는 대역폭 절약이 가능하다고 설명했다.

Lyra 코드는 속도, 효율성 및 상호 운용성을 위해 C++로 작성됐으며, 철저한 단위 테스트를 위해 Abseil이 포함된 Bazel 빌드 프레임워크와 GoogleTest 프레임워크를 사용한다.

핵심 API는 파일 및 패킷 레벨에서 인코딩 및 디코딩을 위한 인터페이스를 제공하며, 다양한 필터 및 변환을 포함하는 완전한 신호 처리 도구 체인도 제공된다.

예제 앱은 안드로이드 NDK와 통합되어 네이티브 Lyra 코드를 Java 기반 안드로이드 앱에 통합하는 방법을 보여준다. 또한 Lyra를 실행하는데 필요한 가중치 및 벡터 양자화기를 제공한다.

Lyra 코덱 v0.0.1 베타 버전의 코드와 데모는 GitHub에서 확인할 수 있다.

태그(Tag) : 구글, 머신러닝, 안드로이드, 앱

관련 기사 보기

[취재] 제미나이와 안드로이드 ChromeOS의 결합, 인텔과 함께하는 구글북 공개
[뉴스] LG전자, 챗GPT 전용 앱 출시
[뉴스] 애플, 안드로이드 단말과의 RCS 메시지 종단간 암호화 지원
[뉴스] 삼성, 갤럭시 S26 시리즈에 애플 에어드롭 호환 퀵쉐어 기능 추가
[뉴스] 구글플레이, 2026 ‘창구 프로그램 8기’ 참여 개발사 모집
[뉴스] 구글, 추론 성능 두 배 향상된 제미나이 3.1 프로 출시
태그(Tags) : 구글, 머신러닝, 안드로이드, 앱 관련기사 더보기

		이수원 수석기자 / 필명 폭풍전야 / swlee@bodnara.co.kr
		남들 좋다는 것은 다 따라 하지만 정작 깊게 파고들지는 못하는 성격이다. 정말 좋아하는 일은 취미로 하랬는데, 어쩌다 직업이 되는 바람에 일과 지름이 일심동체인 삶을 살고 있다.
		기자가 쓴 다른 기사 보기

보드나라 많이본 기사

커스텀 스팀머신의 시대? 밸브 스팀OS에 AMD 외장 그래픽 지원 시작

Let’s 클로! MSI 클로 8 EX AI+ 얼리버드 예판 진행

제이씨현, 선 없는 데스크테리어의 완성 기가바이트 B850M AORUS STEALTH 출시

코잇, ASUS GeForce RTX 그래픽카드 국내 공식 유통 확대 RTX 50 시리즈 공급

USB-C 포트 하나로 확장성과 충전까지, ipTIME UC305HDMI2 / UC306HDMI2-1G

AI 에이전트의 핵심 서버 CPU 흥망사, 메인프레임과 워크스테이션 시대 [PC흥망사 18-1]

레전드에서 부활한 007 퍼스트 라이트, 게인워드 지포스 RTX 5060 Ti Ghost 8GB로 즐기기

NVIDIA RTX SPARK는 인텔과 AMD의 X86 노트북 시장을, AI를 무기로 정복할 수 있을까?

이 기사의 의견 보기

ㅇㅇ / 21-04-08 2:16/ 자국/ 신고/ 이댓글에댓글달기

-On Mobile Mode -
90년대 9600 bps 모뎀으로 주고 받는 음성보다 3배나 적은 대역폭이라니 놀랍네요. 실시간 Speech-To-Text <=> Text-To-Speech에서 나아가 이제는 실시간으로 성문(聲紋) feature를 얻어 내서 입력 음성과 유사한 소리로 출력해주는 Feature-To-Speech네요.

닉네임

웹봇방지

2026년 07월

주간 히트 랭킹

USB-C 포트 하나로 확장성과 충전까지, ipTIME UC305HDMI

AI 에이전트의 핵심 서버 CPU 흥망사, 메인프레임과 워크

레전드에서 부활한 007 퍼스트 라이트, 게인워드 지포스

NVIDIA RTX SPARK는 인텔과 AMD의 X86 노트북 시장을, A

90년대 인터넷 붐과 닷컴 버블이 불러온 썬마이크로시스

게임 '아트'에 최적화된 게이밍 모니터, 벤큐 모비우스 E

돋보이는 고성능 어항형 PC를 위한 선택,MSI MAG X870E

어디에나 어울리는 PCIe 4.0 M.2 SSD, COLORFUL CN700 PR

QHD+ 240Hz로 즐기는 고성능 게이밍 노트북, MSI 크로스

메모리/SSD 반도체 대란과 환율, 비수기 3중 크리를 맞는

TCL A400M	커세어 3200D	젠하이저 모멘텀 5 와이어



다크플래쉬, 실속 더한 18,	델 네트워킹 Z9500 이더넷	BL2423PT



삼성전자 NX3000	엡손 워크포스 DS-40 모바	플렉스터 M6e M.2 SSD