这几天正在追剧,原名《大秦帝国之天下》的《大秦赋》,看着看着又想把前几部刷一遍了,但第一部《裂变》自己没有高清资源,搜了一波发现youtube上有个48集版的高清资源,有删减就有删减吧,就想着写个脚本批量下载一下,记录一下过程,主要是youtube1080p及以上的分辨率做了音视频分离,下载后需要用ffmpeg做一次音视频融合。参考了pytube模块。
1.下载音视频数据
pytube可以通过pip安装
1
|
$pip install pytube |
1
2
3
4
5
6
7
8
|
from pytube import YouTube url = 'https://www.youtube.com/watch?v=K5KG4FVaD5M&list=PLtt_YYUGi1gVlXrNAOQX5BsIXAeTdTrwj&index={}' . format (i) result = YouTube(url) print (url + ' ' + result.title) result.streams.get_by_itag( 137 ).download( 'D:/xdedzl/movie/video' ) print ( 'done {} video' . format (i)) result.streams.get_by_itag( 251 ).download( 'D:/xdedzl/movie/audio' ) print ( 'done {} audio' . format (i)) |
result.steams是一系列不同质量的音视频数据,打印出来如下图,可以根据get_by_itag来拿到对应的音视频,137对应1080p的视频,251对应160k的音频
2.融合音视频数据
使用ffmpeg融合音视频,命令如下,具体使用方式可自行查阅
1
|
ffmpeg - i video_path - i audio_path - c:v copy - c:a aac - strict - 2 output_path |
写了个批处理融合了48集的音视频
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
echo off set v = D:\xdedzl\movie\video\ set a = D:\xdedzl\movie\audio\ set o = D:\xdedzl\movie\ set / a i = 1 , b = 49 :SymLoop if % i % LSS % b % ( echo % v % % i % .mp4 echo % a % % i % .webm echo % o % % i % .mp4 ffmpeg - i % v % % i % .mp4 - i % a % % i % .webm - c:v copy - c:a aac - strict - 2 % o % % i % .mp4 set / a "i+=1" GOTO :SymLoop ) pause |
到此这篇关于python爬取youtube视频的文章就介绍到这了,更多相关python爬取youtube视频内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!
原文链接:https://blog.csdn.net/xdedzl/article/details/110739168