抖音直播弹幕协议解析记录

抖音直播弹幕协议解析记录:

记录一下抖音直播弹幕的获取过程


抖音弹幕现在采用 websocket 进行实时传输,一次建立握手连接,可持续实时通信,特别适合直播场景的数据传输

打开浏览器开发者模式,发现除了视频流媒体一直在进行数据传输外,还有早就建立连接的 websocket 在一直传输二进制数据,浏览器和服务器一来一回,但是你除了刷新的时候能发现建立的 wss 连接,之后是捕捉不到的。

抖音直播弹幕协议解析记录_第1张图片


我只关心服务器发送过来的数据,这里面应该就是弹幕的内容,点击其中一条打开看看,里面包含 gzip 格式的压缩包,估计我要的东西就在压缩包里面。

抖音直播弹幕协议解析记录_第2张图片

gzip 的Magic Number 是 1f 8b xx xx,从这里开始截取后面的所有内容

抖音直播弹幕协议解析记录_第3张图片
解压一看:

抖音直播弹幕协议解析记录_第4张图片

这个开头是一个 WebcastMemberMessage, 应该是表示谁谁来了

抖音直播弹幕协议解析记录_第5张图片

果然啊,“随缘" 大哥来了,通过分析更多的数据包,我发现:

WebcastMemberMessage 表示 有人来了
WebcastChatMessage 表示留言消息
WebcastSocialMessage 表示有人关注了主播

这样接下来的工作就简单多了,如果需要更多信息请私信我

你可能感兴趣的:(python,爬虫)