엔비디아, 화상회의용 딥러닝 모델 '비드 투 비드 카메오' 공개 - 테크월드 뉴스

[테크월드뉴스=이재민 기자] 엔비디아가 국제 컴퓨터 비전 컨퍼런스 ‘CVPR 2021’에서 화상회의용 딥러닝 모델인 ‘비드 투 비드 카메오(Vid2Vid Cameo)’를 공개했다.

비드 투 비드 카메오의 핵심 기능은 ▲얼굴 방향 전환 ▲애니메이션 아바타 ▲데이터 압축 등이다.

비드 투 비드 카메오는 클라우드 네이티브 AI 동영상 스트리밍 플랫폼인 엔비디아 맥신(NVIDIA Maxine) SDK 기반으로, 생성적 적대 신경망(GAN)을 통해 사용자의 2D 이미지만으로 참여자가 실제 말하는 것과 같은 토킹헤드(taking-head) 합성 영상을 생성한다.

사용자는 비드 투 비드 카메오를 통해 화상회의에 참여하기에 앞서 자신의 사진이나 캐릭터 아바타와 같은 참조 이미지를 제출해야 한다. 화상회의를 시작하면 AI 모델이 사용자의 움직임을 실시간으로 포착해 이를 기존에 제출한 참조 이미지에 적용한다.

해당 AI 기술은 회의 참석자의 용모를 단정하게 하는 것 외에도 기존 화상회의에 필요한 대역폭을 최대 10배까지 줄여 지터(jitter) 및 랙(lag) 현상을 방지한다. 이 기술은 곧 엔비디아 비디오 코덱 SDK에서 AI 페이스 코덱 형식으로 제공될 예정이다.

Adblock test (Why?)