感兴趣的给请加微信备注github项目重构,目前需要有爬虫/后端/全栈开发,如果你不具备相关技术栈也可以进来,主要是想着拉一个群然后大家可以在群里互相交流学习,不允许发广告以及违法的东西,纯粹交朋友和技术交流。
本项目是基于 PyWebIO,FastAPI,AIOHTTP,快速异步的抖音/TikTok/Bilibili数据爬取工具,并通过Web端实现在线批量解析以及下载无水印视频或图集,数据爬取API,iOS快捷指令无水印下载等功能。你可以自己部署或改造本项目实现更多功能,也可以在你的项目中直接调用scraper.py或安装现有的pip包作为解析库轻松爬取数据等.....
一些简单的运用场景:
下载禁止下载的视频,进行数据分析,iOS无水印下载(搭配iOS自带的快捷指令APP 配合本项目API实现应用内下载或读取剪贴板下载)等.....
TikHub-API: 支持用户主页爬取该作者[主页视频数据(去水印链接, 已点赞视频列表(权限需为公开), 视频评论数据, 背景音乐视频列表数据, 等等...), 详细信息请查看TikHub-API文档,此外TikHub-API对比本项目API在抓取TikTok数据时,TikHub-API速度更快。
Web APP: https://douyin.wtf/
API Document: https://api.douyin.wtf/docs
TikHub API Document: https://api.tikhub.io/docs
iOS Shortcut(快捷指令): Shortcut release
?桌面端下载器(仓库推荐):
基于本项目的其他仓库
scraper.py:
web_api.py:
web_app.py:
以上文件的参数大多可在config.ini中进行修改
欢迎提出建议或直接提交PR至此仓库 ?(?ω?)?)
安装解析库:
import asyncio
from douyin_tiktok_scraper.scraper import Scraper
api = Scraper()
async def hybrid_parsing(url: str) -> dict:
# Hybrid parsing(Douyin/TikTok URL)
result = await api.hybrid_parsing(url)
print(f"The hybrid parsing result:
{result}")
return result
asyncio.run(hybrid_parsing(url=input("Paste Douyin/TikTok/Bilibili share URL here: ")))
提示:包含但不仅限于以下例子,如果遇到链接解析失败请开启一个新 issue
提示:也可以在web_api.py的代码注释中查看接口文档
API文档:
在线:https://api.douyin.wtf/docs
TikHub-API文档:
API演示:
更多演示请查看文档内容......
提示:最好将本项目部署至美国地区的服务器,否则可能会出现奇怪的BUG。
推荐大家使用Digitalocean的服务器,主要是因为免费。
使用我的邀请链接注册,你可以获得$200的credit,当你在上面消费$25时,我也可以获得$25的奖励。
我的邀请链接:
https://m.do.co/c/9f72a27dec35
使用脚本一键部署本项目
Please edit config.ini, all input must be numbers!
Default API port: 8000
If you want use different port input new API port here: 80
Use new port for web_api.py: 80
Default API rate limit: 10/minute
If you want use different rate limit input new rate limit here: 60
Use new rate limit: 60/minute
Default App port: 80
If you want use different port input new App port here: 8080
Use new port: 8080
api:单独启动
web:单独启动
all:同时启动和
Run API or Web? [api/web/all/quit] api
Do you want to start the api service when system boot? [y/n] y
Created symlink /etc/systemd/system/multi-user.target.wants/web_api.service → /etc/systemd/system/web_api.service.
API service will start when system boot!
Starting API...
API is running! You can visit http://your_ip:port
You can stop the api service by running: systemctl stop web_api.service
开启/停止服务
开启/关闭开机自动运行
更新项目
Docker Image repo: Docker Hub
curl -fsSL get.docker.com -o get-docker.sh&&sh get-docker.sh &&systemctl enable docker&&systemctl start docker
docker-compose up -d
docker logs -f douyin_tiktok_download_api
docker rm -f douyin_tiktok_download_api
docker-compose pull && docker-compose down && docker-compose up -d
API速度测试(对比官方API)
项目界面
Start: 2021/11/06 GitHub: @Evil0ctal Contact: Evil0ctal1985@gmail.com
公司名称: 天富娱乐-天富医疗器械销售公司
手 机: 13800000000
电 话: 400-123-4567
邮 箱: admin@youweb.com
地 址: 广东省广州市天河区88号