背景:
本项目为了向一家国际知名电影出品公司, 提供时下中国各网红平台内, 各个热门网红的数据, 交付对应数据 (如果接包方可以做报表更好)
网红数据的爬虫目的:
理想情况是建立起一个网红数据的database,每月或者每个季度更新数据,从而能够帮助今后的BD,并发布网红Index指数
网红数据的爬虫范围:
爬虫针对的网红人数:Top 200~1000人 (待讨论,可以与接包方确定, 原则上越多越好, 但不需要超过1000个网红)
爬虫的平台:抖音、美拍、B站、爱奇艺、腾讯、斗鱼直播、虎牙直播、微博、小红书(待讨论, 可选定3~5个平台范围)
爬虫的数据维度:粉丝数、点赞数、发布数、评论数、转发数、评论内容、弹幕内容(B站)、礼物个数(直播app)、视频时长、直播市场、post文数等(待讨论, 可选定一些指标, 具体可以由接包方定义, 原则上有几个关键指标, 比如粉丝, 点赞等等, 不能没有)
需要与接包方确定:
1. 网红人数
2. 平台和数据内容后
3. 以及爬虫执行时间
4. 是否能够提供爬虫的源代码,便于今后每月/每季度自行操作下载数据
5. 费用
一些问题(不是接包方的硬性要求):
1. 这些平台会定期修改自己的代码以防止爬虫, 接包方一般会如何应对
2. 考虑到网红数据可能存在虚假性,需要leverage资源来对获取的网红数据做进一步分析,包括数据验真,从而给到客户指导性意见,例如帮助他们挑选真正的网红来深入研究流量变现的商业模型,而不是选择了错误的网红导致分析结果有偏差, 这一点听取接包方的意见
附件是一个希望生成的单网红样例(生成效果只是参考, 具体优先要数据).
接包方 | 国家/地区 | |
---|---|---|
![]() |
10
Bestpartner
|
成都市 |
![]() |
7
Zhangyuebb
|
北京市 |
![]() |
5
Xisou
|
上海市 |
![]() ![]() |
5
Ittray
|
广州市 |
![]() |
6
Liwei2017
|
成都市 |