语音网首创页面录制 实现云音视频、白板和短信的实时同

随着实时音视频成为主流交互方式,声网络实时交互服务已经覆盖在线教育、社交直播、企业协作、物联网、医疗、游戏、保险等10多个行业、100多个场景。在教育、医疗、金融等场景中,用户不仅需要实时交互,还需要记录交互过程。开发者在访问稳定流畅的实时交互服务的同时,对实时录制服务的要求也越来越高。

那么好的录音解决方案有哪些特点呢?

在回答这个问题之前,音网首先分析了客户使用录音的原因。一般来说,用户使用录音功能主要有三个原因:

1.质检。比如在教育场景中,需要通过回放录制来检查课程质量,在社交直播或金融双录制场景中,需要保留录制的视频进行合规性审查。

2.保留证书。如教育、医疗、音像客服等。有必要归档并保存一份证书以处理可能出现的纠纷。在这种场景下,对录制方案的核心需求是内容完整性,甚至不能容忍二级视频丢失。

3.回放。比如在教育场景和直播场景中,用户希望观看回放。

那么在这些场景下,什么是好的录音解决方案呢?

我们可以从五个维度来衡量录制方案:

录制效果:需要还原真实的交互场景,包括音视频、课件、白板、聊天信息等

元素。同时也不能对主播的音视频交互体验造成任何负面影响。

集成难度:越简单越好,最好不需要开发。

等待时间:等待时间越短越好。录音后最好立即回放。

文件兼容性:可以在任何平台,任何浏览器上播放。

文件迁移的便捷性:文件下载、上传等迁移过程应该很简单,便于记录文件管理。

为了满足各种场景的录制需求,目前市场上有两种主流方案。

方案一:音视频、白板等元素分别录制,然后拼接播放

主要思路是录制音视频、白板、课件、PPT、聊天内容等。然后在录制后分别回放,并将播放进度与时间戳对齐。这个方案的优点是白板、课件、聊天内容等。都是以数据的形式回放,可以保持原来真实的交互效果。比如PPT可以独立翻页,灵活性更好。但是它的缺点也很明显:

1.整合是困难的。需要同时开发音视频录制、白板录制和聊天内容录制。特别是需要通过时间戳对齐来回放不同的元素,需要付出更多的开发努力才能达到非常好的同步效果。

2.播放兼容性有限。这种方法只能由特殊玩家回放,与主流玩家兼容性不好。

3.漫长的等待时间。为了解决播放兼容性问题,往往需要在录制后进行离线处理,转换成完整的MP4文件。这个过程等待时间长,会带来额外的转码成本。

方案二:本地客户端屏幕录制

无论是在本地客户端录制还是通过屏幕共享将屏幕流发送到云端录制,其本质都是在用户的本地客户端捕捉屏幕内容。这个方案的好处是,你看到的就是你得到的,回放效果可以和真实的交互场景保持一致。但是它的缺点也很明显:

1.影响本地用户的RTC交互体验。在本地捕获屏幕内容会极大地消耗终端设备的计算资源,如果要实时上传,还会占用主播的上行带宽资源,影响本地用户的音视频通话体验,甚至会产生干扰、模糊等严重后果,这对于一个实时交互场景来说是不可接受的致命缺陷。

2.融合很难。开发人员需要最终开发,解决本地存储和上传o

虽然以上两个主流录制方面各有优势,但是对于开发者来说,无论是整合还是录制过程,都有很多明显的不足。基于以上行业痛点,Sound Network发起页面录制,提出第三种录制方案。

页面记录:简单集成,实时同步记录音视频、白板和文本信息

声学网络的页面录制是指通过Web页面渲染的方式,在服务器端同时录制音视频、白板、课件、聊天信息,从而还原真实的交互场景。原理是开发者通过RESTfulAPI发起录制请求,以请求参数的形式将待录制页面的URL发送给Agora录制服务。Agora录制服务会打开网页,以屏幕录制的形式实时录制生成MP4文件,并上传到指定的第三方云存储平台。

根据之前记录方案的维度,将声学网络的页面记录与之前列出的两个传统记录方案进行比较:

相比之下,声学网络的页面记录方案主要有四个核心优势:

在集成时,通过RestfulAPI启动请求记录很容易使用。

录制效果实现了所见即所得,实时同步音视频、白板、课件、聊天信息

录制不会带来额外的带宽和性能开销,录制过程也不影响任何主播/观众的RTC交互体验。

录制后可以实时生成MP4文件,兼容所有主流播放器。

文件下载很简单,方便录音文件管理。

同时,页面录制具有录制任何网页的能力,所以使用WebRTC或者其他方案开发RTC功能的开发者也可以使用。

目前,许多在线教育平台已经采用了声学网络的页面录制功能,声学网络的页面录制服务将在2021年3月1日前免费向用户开放。

免责声明:凡本站注明 “来源:XXX(非中国商业新闻网)”的新闻稿件和图片作品,系本站转载自其它媒体,转载目的在于信息传递,并不代表本站赞同其观点和对其真实性负责 。