- 积分
- 259
- 鸿鹄币
- 个
- 好评度
- 点
- 精华
- 注册时间
- 2020-3-9
- 最后登录
- 1970-1-1
- 阅读权限
- 30
- 听众
- 收听
初级工程师
|
虽然EDG夺冠已经过去了一段时间,但是当时的火爆程度是很大的,这个比赛一直也是备受全网瞩目,在比赛时,微博热搜第一名,足足有8194万人观看。并且在bilibili平台,吸引3.5亿人气,满屏弹幕;腾讯视频600万人看过;斗鱼和虎牙平台的热度也是居高不下;比赛结束后,央视新闻也发微博祝贺EDG战队夺冠;我们不仅通过直播和新闻来感受到了比赛的整个过程,也可以通过Python来分析热点来感受粉丝的热情。
今天要做的,就是通过回放获取每个视频里面的弹幕数据,看看粉丝在躁动的心情下,说了点啥?首先我们需要先获取到访问接口https://api.bilibili.com/x/v1/dm/list.so?oid,然后分享下完整提取视频弹幕的代码如下:
// 要访问的目标页面
string targetUrl = "http://httpbin.org/ip";
// 代理服务器(产品官网 www.16yun.cn)
string proxyHost = "http://t.16yun.cn";
string proxyPort = "31111";
// 代理验证信息
string proxyUser = "username";
string proxyPass = "password";
// 设置代理服务器
WebProxy proxy = new WebProxy(string.Format("{0}:{1}", proxyHost, proxyPort), true);
ServicePointManager.Expect100Continue = false;
var request = WebRequest.Create(targetUrl) as HttpWebRequest;
request.AllowAutoRedirect = true;
request.KeepAlive = true;
request.Method = "GET";
request.Proxy = proxy;
//request.Proxy.Credentials = CredentialCache.DefaultCredentials;
request.Proxy.Credentials = new System.Net.NetworkCredential(proxyUser, proxyPass);
// 设置Proxy Tunnel
// Random ran=new Random();
// int tunnel =ran.Next(1,10000);
// request.Headers.Add("Proxy-Tunnel", String.valueOf(tunnel));
//request.Timeout = 20000;
//request.ServicePoint.ConnectionLimit = 512;
//request.UserAgent = "Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.82 Safari/537.36";
//request.Headers.Add("Cache-Control", "max-age=0");
//request.Headers.Add("DNT", "1");
//String encoded = System.Convert.ToBase64String(System.Text.Encoding.GetEncoding("ISO-8859-1").GetBytes(proxyUser + ":" + proxyPass));
//request.Headers.Add("Proxy-Authorization", "Basic " + encoded);
using (var response = request.GetResponse() as HttpWebResponse)
using (var sr = new StreamReader(response.GetResponseStream(), Encoding.UTF8))
{
string htmlStr = sr.ReadToEnd();
}
因为获取的弹幕数据比较多,网站也有反爬机制,所以爬虫程序里面是加了代理,使用的是亿牛云代理动态转发模式,比较简单,方便。通过获取到弹幕数据可以看出,粉丝的热情真的不是一般的高呀。小伙伴们是不是也是众多粉丝中的一个呢? |
|