- Python3.8
- requests
- pandas
- wordcloud
- matplotlib
- UID
- 主页
- 等级
- 昵称
- 性别
- 关注数
- 粉丝数
- 关注的UP主
- 个性签名
- 是否开通会员
- 是否是年费会员
- 性别的数据和占比
- 会员占比,会员中年费会员的占比
- 账号活跃情况
- 等级数量占比
- 等级数量
- 每个等级中的总会员数、普通会员数,年费会员数
- 把每个用户关注的UP主写进txt里面,通过词云图来反应关注数最多的UP主
python小白,无聊随便写写的。爬取效率非常慢,我爬了50W数据爬了4天,有服务器推荐在服务器下运行。
下面这条命令可以让你的py文件一直在服务器后台运行,即使你断了远程连接或者自己主机关机依旧在运行。
- nohup python3 -u test.py > test.log 2>&1 &