python带你探索视、音频分开的内容如何保存并使其合并~

搬砖python中~ 发布时间：2022-06-10 14:30:29 ，浏览量：5

环境使用:

Python 3.8
Pycharm 2021.2版本
ffmpeg

模块使用:

import requests >>> pip install requests

内置模块你安装好python环境就可以了

import re
import json
import subprocess

思路分析一. 数据来源分析

确定自己需求
通过开发者工具进行抓包分析, 分析我们想要数据内容来自于哪里信息数据在网页源代码里面 playinfo里面标题

我们想要数据内容都是来自于网页源代码

I.用浏览器打开这个网址 II. 在这个网页上面用鼠标右键点击查看网页源代码会弹出一个新的窗口 III. ctrl + F 打开搜索框搜索playinfo 可以找到相关信息数据 IV. ctrl + F 打开搜索框搜索标题, 也可以找到相关的数据内容

二. 代码实现步骤过程基本四大步骤

发送请求, 模拟浏览器对于url网址发送请求
获取数据, 获取网页源代码
解析数据, 提取我们想要数据内容
保存数据, 把内容保存本地

部分代码

import requests  # 数据请求模块 
import re  # 正则表达式
import json  # 序列化与反序列
import pprint  # 格式化输出模块
import subprocess
import os


def get_response(html_url, data=None):
    headers = {
        'referer': '解答、完整源码、教程加Q裙：832157862',  # 防盗链 告诉服务器你请求url是从哪里跳转过来的
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.54 Safari/537.36'
    }
    response = requests.get(url=html_url, params=data, headers=headers)
    return response


def get_video_info(play_url):
    # 定义了函数, 一定要调用
    response = get_response(html_url=play_url)  # 调用前面定义好的发送请求函数 函数是可以重复调用
    # print(response.text)  # response.text 获取响应对象文本数据   字符串数据
    title = re.findall('"title":"(.*?)","pubdate"', response.text)[0].replace(' ', '')  # 标题
    title = re.sub(r'[/\:*?"|]', '', title)
    html_data = re.findall('window.__playinfo__=(.*?)', response.text)[0]  # 视频信息
    # print(title)
    # print(html_data)
    # print(type(html_data))
    # 为了方便提取数据, 可以把这个html_data 转成json字典数据
    json_data = json.loads(html_data)
    # print(json_data)
    # print(type(json_data))  # 输出一行
    # 字符串单双引号使用  外面是单引号里面就要使用双引号
    # pprint.pprint(json_data)  # 格式化展开效果
    # 字典取值, 键值对取值 根据冒号左边的内容, 提取冒号右边的内容
    audio_url = json_data['data']['dash']['audio'][0]['baseUrl']
    video_url = json_data['data']['dash']['video'][0]['baseUrl']
    print(audio_url)
    print(video_url)
    video_info = [title, audio_url, video_url]
    return video_info


def save(title, audio_url, video_url):
    audio_content = get_response(html_url=audio_url).content
    video_content = get_response(html_url=video_url).content
    with open('video\\' + title + '.mp3', mode='wb') as f:
        f.write(audio_content)
    with open('video\\' + title + '.mp4', mode='wb') as f:
        f.write(video_content)
    cmd = f"ffmpeg -i video\\{title}.mp4 -i video\\{title}.mp3 -c:v copy -c:a aac -strict experimental video\\{title}output.mp4"
    subprocess.run(cmd, shell=True)
    os.remove(f'video\\{title}.mp4')
    os.remove(f'video\\{title}.mp3')
    print('')
    print(title, '视频下载完成')

def get_search(page, word):
    search_url = '解答、完整源码、教程加Q裙：832157862'
    data = {
        '__refresh__': 'true',
        '_extra': '',
        'context': '',
        'page': page,
        'page_size': '42',
        'from_source': '',
        'from_spmid': '333.337',
        'platform': 'pc',
        'highlight': '1',
        'single_column': '0',
        'keyword': word,
        'category_id': '',
        'search_type': 'video',
        'dynamic_offset': '84',
        'preload': 'true',
        'com2co': 'true',
    }
    json_data = get_response(html_url=search_url, data=data).json()
    bv_list = [i['bvid'] for i in json_data['data']['result']]
    print(bv_list)
    return bv_list


def get_up_video(page, up_id):
    """
    采集up多个视频
    :param page: 采集多少页
    :param up_id: 视频博主ID
    :return:
    """
    up_link = '解答、完整源码、教程加Q裙：832157862'
    data = {
        'mid': up_id,
        'ps': '30',
        'tid': '0',
        'pn': page,
        'keyword': '',
        'order': 'pubdate',
        'jsonp': 'jsonp',
    }
    json_data = get_response(html_url=up_link, data=data).json()
    bv_list = [i['bvid'] for i in json_data['data']['list']['vlist']]
    print(bv_list)
    return bv_list

尾语

好了，我的这篇文章写到这里就结束啦！

有更多建议或问题可以评论区或私信我哦！一起加油努力叭(ง •_•)ง

喜欢就关注一下博主，或点赞收藏评论一下我的文章叭！！！

关注

打赏

1688896170

查看更多评论

python带你探索视、音频分开的内容如何保存并使其合并~

[ 申请 ]友情链接：