python爬取B站CC字幕(隐藏式字幕)

python爬取B站CC字幕(隐藏式字幕)本文介绍了如何使用 Python 爬取 B 站的隐藏式字幕 CC 字幕 包括理解 srt 文件格式 获取 subtitle url 以及如何爬取并保存字幕内容

大家好,欢迎来到IT知识分享网。

字幕srt文件介绍

srt 的全称是SubRip Text,是一种非常流行的文本字幕,包含一行时间,一行字幕,制作规范非常简单。

B站除了博主配置的原生字幕之外,还提供了一种智能生成的字幕——CC字幕,CCClosed Caption的简称,所谓CC字幕,就是隐藏式字幕。
CC 是把文字加入NTSC电视信号的一种标准化编码方法。
电视机的内置解码器或独立解码器能显示文字。

Caption 和常见的一般字幕(subtitle)的用法是有区别的,它是在无音状态下通过进行一些解释性的语言来描述当前画面中所发生的事情的字幕,例如画面中出现了背景的声音的时候,Caption都会通过字幕进行提示。

CC字幕可以在视频中拖放至任意位置,颜色、位置等都可以在网站上进行调整。该字幕显式地放在一个json之中,而这个json又可以通过开发者工具-Network找到。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/137191.html

(0)
上一篇 2025-06-22 15:26
下一篇 2025-06-22 15:33

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信