新闻中心

EEPW首页 > 智能计算 > 业界动态 > 告别视频通话“渣画质”，英伟达新算法最高压缩90%流量

告别视频通话“渣画质”，英伟达新算法最高压缩90%流量

作者：时间：2020-12-02来源：量子位收藏

为了让网速慢的用户用上高清通话，英伟达可谓绞尽脑汁。他们开发的新AI算法，可以将视频通话的流量最高压缩90%以上。

本文引用地址：http://www.amcfsurvey.com/article/202012/420822.htm

　　

　　和其他视频相比，通话的场景比较单一，基本上只有人的头部在运动。因此只要能把头像数据大规模压缩，就能大大节约流量。

　　

　　英伟达的新算法face vid2vid正是从这一点出发。只要一张图片，就能实现重建各种头部姿势图片。

　　H.264视频所需的带宽是这种新算法的2~12倍，从前面的演示也能看出，如果让二者使用相同比特率，那么H.264视频几乎不可用。

　　

　　转动面部不扭曲

　　英伟达提供了一个试用Demo，可以在Pitch（俯仰角）、Yaw（偏航角）、Roll（翻滚角）三个方向上任意旋转。

　　

　　输入一张人脸，最多可以在每个方向上最多旋转30度。以下是三个方向上旋转到最大角度生成的图片。

　　

　　与相比之前的方法，英伟达的这种技术即使在面部转动幅度较大时，人脸也不会扭曲变形。

　　

　　然而，图片终究是不动的，要把生成的人脸放在运动的视频中还要多一个步骤。

　　合成面部视频

　　我们把上传的清晰照片作为源图像，从中获取外貌特征。然后把视频中一帧帧画面作为重构视频的依据，从中提取出面部表情和头部姿势等信息。

　　而表情和姿势这两个数据可以通过关键点进行编码，这样就分离了人物身份信息和运动信息。在传输视频时只要有运动信息即可，从而节约了流量。

　　

　　从源图像s中，我们得到了两组数据：关键点坐标x和雅可比矩阵J。这两组参数与面部的具体特征无关，只包含人的几何特征。

　　其中，雅可比矩阵表示如何通过仿射变换将关键点周围的局部补丁转换为另一幅图像中的补丁。如果是恒等雅可比矩阵，则补丁将直接复制并粘贴到新位置。

　　

　　下图展示了计算前5个关键点的流程。给定源图像以及模型预测的规范关键点。

　　

　　从运动视频估计的旋转和平移应用于关键点，带动头部姿势的变化。然后可以感知表情的变形将关键点调整为目标表情。

　　接下来开始合成视频。使用源和运动的关键点与其雅可比矩阵来估计流wk，从生成流组合成掩码m，将这两组进行线性组合即可产生合成流场w。

　　

　　接着输入人脸面部特征f，即可生成输出图像y。

　　这种方法不仅能用于视频通话，也有其他“新玩法”。

　　比如觉得人物头像有点歪，可以手动输入纠正后的数据，从而将面部转正。

　　

　　又或者是，把一个人的面部特征点和雅可比矩阵用于另一个人，实现面部视频动作的迁移。

　　

　　团队简介

　　这篇文章的第一作者是来自英伟达的高级研究员Ting-Chun Wang。

　　

　　文章的通讯作者是英伟达的著名研究员刘洺堉。

　　

　　如果你长期关注CV领域，一定对这两位作者非常熟悉。他们在图像风格迁移、GAN等方面做出了大量的工作。

　　

　　△ GauGAN

　　两人之前已经有过多次合作。比如。无监督图像迁移网络（NIPS 2017），还有从涂鸦生成照片的GauGAN（CVPR 2019），都是出自这二位之手。

关键词： 英伟达 算法

评论

相关推荐

全球TOP15半导体公司最新排名

半导体英伟达英特尔三星联发科高通 AMD | 2023-12-07

基于LPC2138的血压测量算法开发平台电路图

设计方案基于 LPC2138 血压测量算法开发平台电路图 | 2010-01-20

计算机科学与技术反思录(2)

liujt_ic | 2003-06-06

[转帖]us/os就绪表的维护算法分析

amine | 2002-05-17

数字PID控制算法之一

资源下载 PID PID控制算法 | 2007-12-28

目标跟踪算法在红外热成像跟踪技术上的应用

设计方案目标跟踪算法红外成像技术上应用 | 2009-09-03

Meta&Microsoft：将购买AMD的最新AI芯片作为Nvidia替代品

智能计算人工智能，meta，微软，英伟达，AMD | 2023-12-07

不听话就“封杀”？英伟达没在怕的

智能计算英伟达美国 GPU 禁售 | 2023-12-08

华为AI芯片是英伟达强大的竞争对手？

华为 AI 芯片英伟达黄仁勋 | 2023-12-07

数字PID控制及其改进算法的应用

设计方案数字控制及其改进算法应用 | 2011-05-11

简单实用的单片机CRC 快速算法

资源下载 CRC 算法单片机 | 2007-02-16

大嘴业话——英伟达宣布进军CPU市场

视频英伟达 AI CPU | 2023-11-10

莱迪思与英伟达合作加速推进网络边缘AI

嵌入式系统莱迪思英伟达边缘AI | 2023-12-07

AI 芯片的「护城河」，难以逾越

智能计算台积电英伟达 | 2023-12-12

英伟达首席执行官表示，他将尝试优先考虑日本的人工智能处理器

国际视野英伟达黄仁勋日本 GPU | 2023-12-07

采用Mean-Shift和Camshift算法相结合的火焰视频图像跟踪设计

设计方案采用 Mean-Shift Camshift 算法相结合 | 2011-06-27

CRC算法原理及C语言实现

资源下载 CRC 算法 C语言 | 2007-02-16

英伟达现在正利用其人工智能意外之财投资初创公司，希望能赚更多的大钱

智能计算英伟达人工智能 AI中 | 2023-12-12

无惧新规打压！黄仁勋坚定：英伟达仍为中国开发特供版芯片

智能计算英伟达芯片人工智能 | 2023-12-07

求FSK信号的解调算法，主要是铁路上的移频信号!

dhlwq007 | 2004-08-04

“猫和老鼠”的较量软件破解大揭密（ZT）

武松打虎 | 2004-05-21

vxwokrs下静态图像压缩算法（上）

C-- | 2004-07-26

大嘴业话——ARM再次上市，究竟7年时间算不算被偷走的？（1）

视频英伟达嵌入式 ARM 软银 | 2023-11-06

PID算法

资源下载 PID 算法误差 | 2007-02-16

加密算法之MD5算法

资源下载加密算法加密算法 MD5算法 | 2007-02-16

无线传感器网络低功耗分簇路由算法设计

设计方案无线传感器网络功耗路由算法设计 | 2012-09-07

大嘴业话——ARM再次上市，究竟7年时间算不算被偷走的？（2）

视频 AI 英伟达 ARM | 2023-11-07

英伟达计划在越南开设半导体中心

智能计算英伟达越南 | 2023-12-11

技术专区

关闭