python3下载抖音视频

laic zhang 2019年06月28日

# -*- coding:utf-8 -*- from contextlib import closing import requests, json, re, os, sys, random from ipaddress import ip_address from subprocess import Popen, PIPE import urllib class DouYin(object): def __init__(self, width = 500, height = 300): """ 抖音App视频下载 """ rip = ip_address('0.0.0.0') while rip.is_private: rip = ip_address('.'.join(map(str, (random.randint(0, 255) for _ in range(4))))) self.headers = { 'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8', 'accept-encoding': 'gzip, deflate, br', 'accept-language': 'zh-CN,zh;q=0.9', 'pragma': 'no-cache', 'cache-control': 'no-cache', 'upgrade-insecure-requests': '1', 'user-agent': 'Mozilla/5.0 (Linux; U; Android 5.1.1; zh-cn; MI 4S Build/LMY47V) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/53.0.2785.146 Mobile Safari/537.36 XiaoMi/MiuiBrowser/9.1.3', 'X-Real-IP': str(rip), 'X-Forwarded-For': str(rip), } def get_video_urls(self, user_id, type_flag='f'): """ 获得视频播放地址 Parameters: user_id：查询的用户UID Returns: video_names: 视频名字列表 video_urls: 视频链接列表 nickname: 用户昵称 """ video_names = [] video_urls = [] share_urls = [] max_cursor = 0 has_more = 1 i = 0 share_user_url = 'https://www.douyin.com/share/user/%s' % user_id share_user = requests.get(share_user_url, headers=self.headers) while share_user.status_code != 200: share_user = requests.get(share_user_url, headers=self.headers) _dytk_re = re.compile(r"dytk\s*:\s*'(.+)'") dytk = _dytk_re.search(share_user.text).group(1) _nickname_re = re.compile(r'<p class="nickname">(.+?)<\/p>') nickname = _nickname_re.search(share_user.text).group(1) urllib.request.urlretrieve('https://raw.githubusercontent.com/Jack-Cherish/python-spider/master/douyin/fuck-byted-acrawler.js', 'fuck-byted-acrawler.js') try: Popen(['node', '-v'], stdout=PIPE, stderr=PIPE).communicate() except (OSError, IOError) as err: print('请先安装 node.js: https://nodejs.org/') sys.exit() user_url_prefix = 'https://www.douyin.com/aweme/v1/aweme/favorite' if type_flag == 'f' else 'https://www.douyin.com/aweme/v1/aweme/post' print('解析视频链接中') while has_more != 0: process = Popen(['node', 'fuck-byted-acrawler.js', str(user_id)], stdout=PIPE, stderr=PIPE) _sign = process.communicate()[0].decode().strip('\n').strip('\r') user_url = user_url_prefix + '/?user_id=%s&max_cursor=%s&count=21&aid=1128&_signature=%s&dytk=%s' % (user_id, max_cursor, _sign, dytk) req = requests.get(user_url, headers=self.headers) while req.status_code != 200: req = requests.get(user_url, headers=self.headers) html = json.loads(req.text) try: while html['aweme_list'] == []: i = i + 1 sys.stdout.write('已重新链接' + str(i) + '次 (若超过100次，请ctrl+c强制停止再重来)' + '\r') sys.stdout.flush() process = Popen(['node', 'fuck-byted-acrawler.js', str(user_id)], stdout=PIPE, stderr=PIPE) _sign = process.communicate()[0].decode().strip('\n').strip('\r') user_url = user_url_prefix + '/?user_id=%s&max_cursor=%s&count=21&aid=1128&_signature=%s&dytk=%s' % (user_id, max_cursor, _sign, dytk) req = requests.get(user_url, headers=self.headers) while req.status_code != 200: req = requests.get(user_url, headers=self.headers) html = json.loads(req.text) except: pass i = 0 for each in html['aweme_list']: try: url = 'https://aweme.snssdk.com/aweme/v1/play/?video_id=%s&line=0&ratio=720p&media_type=4&vr_type=0&test_cdn=None&improve_bitrate=0' uri = each['video']['play_addr']['uri'] video_url = url % uri except: continue share_desc = each['share_info']['share_desc'] if os.name == 'nt': for c in r'\/:*?"<>|': nickname = nickname.replace(c, '').strip().strip('\.') share_desc = share_desc.replace(c, '').strip() share_id = each['aweme_id'] if share_desc in ['抖音-原创音乐短视频社区', 'TikTok', '']: video_names.append(share_id + '.mp4') else: video_names.append(share_id + '-' + share_desc + '.mp4') share_urls.append(each['share_info']['share_url']) video_urls.append(video_url) max_cursor = html['max_cursor'] has_more = html['has_more'] return video_names, video_urls, share_urls, nickname def get_download_url(self, video_url, watermark_flag): """ 获得带水印的视频播放地址 Parameters: video_url：带水印的视频播放地址 Returns: download_url: 带水印的视频下载地址 """ # 带水印视频 if watermark_flag == True: download_url = video_url.replace('/play/', '/playwm/') # 无水印视频 else: download_url = video_url.replace('/playwm/', '/play/') return download_url def video_downloader(self, video_url, video_name, watermark_flag=False): """ 视频下载 Parameters: video_url: 带水印的视频地址 video_name: 视频名 watermark_flag: 是否下载带水印的视频 Returns: 无 """ size = 0 video_url = self.get_download_url(video_url, watermark_flag=watermark_flag) with closing(requests.get(video_url, headers=self.headers, stream=True)) as response: chunk_size = 1024 content_size = int(response.headers['content-length']) if response.status_code == 200: sys.stdout.write(' [文件大小]:%0.2f MB\n' % (content_size / chunk_size / 1024)) with open(video_name, 'wb') as file: for data in response.iter_content(chunk_size = chunk_size): file.write(data) size += len(data) file.flush() sys.stdout.write(' [下载进度]:%.2f%%' % float(size / content_size * 100) + '\r') sys.stdout.flush() def run(self): """ 运行函数 Parameters: None Returns: None """ self.hello() print('搜索api需要登录，暂时使用UID下载\n分享用户页面，用浏览器打开短链接，原始链接中/share/user/后的数字即是UID') user_id = input('请输入ID (例如95006183):') user_id = user_id if user_id else '95006183' watermark_flag = input('是否下载带水印的视频 (0-否(默认), 1-是):') watermark_flag = watermark_flag if watermark_flag!='' else '0' watermark_flag = bool(int(watermark_flag)) type_flag = input('f-收藏的(默认), p-上传的:') type_flag = type_flag if type_flag!='' else 'f' save_dir = input('保存路径 (例如"E:/Download/", 默认"./Download/"):') save_dir = save_dir if save_dir else "./Download/" video_names, video_urls, share_urls, nickname = self.get_video_urls(user_id, type_flag) nickname_dir = os.path.join(save_dir, nickname) if not os.path.exists(save_dir): os.makedirs(save_dir) if nickname not in os.listdir(save_dir): os.mkdir(nickname_dir) if type_flag == 'f': if 'favorite' not in os.listdir(nickname_dir): os.mkdir(os.path.join(nickname_dir, 'favorite')) print('视频下载中:共有%d个作品!\n' % len(video_urls)) for num in range(len(video_urls)): print(' 解析第%d个视频链接 [%s] 中，请稍后!\n' % (num + 1, share_urls[num])) if '\\' in video_names[num]: video_name = video_names[num].replace('\\', '') elif '/' in video_names[num]: video_name = video_names[num].replace('/', '') else: video_name = video_names[num] video_path = os.path.join(nickname_dir, video_name) if type_flag!='f' else os.path.join(nickname_dir, 'favorite', video_name) if os.path.isfile(video_path): print('视频已存在') else: self.video_downloader(video_urls[num], video_path, watermark_flag) print('\n') print('下载完成!') def hello(self): """ 打印欢迎界面 Parameters: None Returns: None """ print('*' * 100) print('\t\t\t\t抖音App视频下载小助手') print('\t\t作者:Jack Cui、steven7851') print('*' * 100) if __name__ == '__main__': douyin = DouYin() douyin.run()

原文链接

HTML教程 HTML5教程 HTML参考手册 HTML字符集 HTML标签 HTMLDOM教程 CSS教程 CSS3教程 Bootstrap3教程 Bootstrap4教程 FontAwesome图标 Foundation5教程 CSS参考手册 JavaScript教程 JavaScript对象 HTMLDOM对象 jQuery教程 JSON教程 AngularJS教程 Angular2教程 Vue.js教程 React教程 jQueryUI教程 jQueryEasyUI教程 AJAX教程 Highcharts教程 GoogleMapsAPI教程 ES6教程 TypeScript教程 ES6标准入门 PHP教程设计模式正则表达式-教程 WebServices教程 Python2教程 Python3教程 Django教程 NumPy教程 ASP.NET教程 C#教程 Ruby教程 Go语言教程 Java教程 Servlet教程 JSP教程 Maven教程 Node.js教程 C语言教程 C++教程 Perl教程 Lua教程 Scala教程 ASP教程 VBScript教程 Linux教程 Docker教程 SQL教程 MySQL教程 SQLite教程 MongoDB教程 Redis教程 Memcached教程 ADO教程 Android教程 Swift教程 jQueryMobile教程 ionic教程 Kotlin教程 XML教程 DTD教程 XMLDOM教程 XSLT教程 XPath教程 XQuery教程 XLink教程 XMLSchema教程 XSL-FO教程 SVG教程 SOAP教程 RDF教程 WSDL教程 RSS教程 AppML教程 Eclipse教程 Git教程 SVN教程 Firebug教程 HTTP教程网站建设指南浏览器信息网站主机教程 TCP/IP教程 W3C教程网站品质教程