序:优酷之前更新了次算法(很久之前了,呵呵。。。),故此很多博客的解析算法已经无法使用。很多大牛也已经更新了新的解析方法。我也在此写篇解析过程的文章。(本文使用语言为C#)
由于优酷视频地址时间限制,在你访问本篇文章时,下面所属链接有可能已经失效,望见谅。
例:http://v.youku.com/v_show/id_XNzk2NTI0MzMy.html
1 string getVid(string url) 2 { 3 string strRegex = "(?<=id_)(\\w+)"; 4 Regex reg = new Regex(strRegex); 5 Match match = reg.Match(url); 6 return match.ToString(); 7 }
http://v.youku.com/player/getPlayList/VideoIDS/XNzk2NTI0MzMy/Pf/4/ctype/12/ev/1
将前述vid嵌入到上面url中访问即可得到视频信息文件。由于视频信息过长不在此贴出全部内容。下面是部分重要内容的展示。(获取文件为json文件,可直接解析)
1 { "data": [ { 2 "ip": 1991941296, 3 "ep": "MwXRTAsbJLnb0PbJ8uJxAdSivUU11wnKXxc=", 4 "segs": { 5 "hd2": [ 6 { 7 "no": "0", 8 "size": "34602810", 9 "seconds": 205, 10 "k": "248fe14b4c1b37302411f67a", 11 "k2": "1c8e113cecad924c5" 12 }, 13 { 14 "no": "1", 15 },] }, } ],}
上面显示的内容后面都会使用到。其中segs包含hd3,hd2,flv,mp4,3gp等各种格式,并且每种格式下均分为若干段。本次选用清晰度较高的hd2(视频格式为flv)
http://pl.youku.com/playlist/m3u8?ctype=12&ep={0}&ev=1&keyframe=1&oip={1}&sid={2}&token={3}&type={4}&vid={5}
以上共有6个参数,其中vid和oip已经得到,分别之前的vid和json文件中的ip字段,即(XNzk2NTI0MzMy和1991941296),但是ep,sid,token需要重新计算(json文件中的ep值不能直接使用)。type比较简单,后面会说。
计算方法单纯的为数学计算,下面给出计算的函数。三个参数可一次性计算得到。其中涉及到Base64编码解码知识,点击查看。
1 private static string myEncoder(string a, byte[] c, bool isToBase64) 2 { 3 string result = ""; 4 List<Byte> bytesR = new List<byte>(); 5 int f = 0, h = 0, q = 0; 6 int[] b = new int[256]; 7 for (int i = 0; i < 256; i++) 8 b[i] = i; 9 while (h < 256) 10 { 11 f = (f + b[h] + a[h % a.Length]) % 256; 12 int temp = b[h]; 13 b[h] = b[f]; 14 b[f] = temp; 15 h++; 16 } 17 f = 0; h = 0; q = 0; 18 while (q < c.Length) 19 { 20 h = (h + 1) % 256; 21 f = (f + b[h]) % 256; 22 int temp = b[h]; 23 b[h] = b[f]; 24 b[f] = temp; 25 byte[] bytes = new byte[] { (byte)(c[q] ^ b[(b[h] + b[f]) % 256]) }; 26 bytesR.Add(bytes[0]); 27 result += System.Text.ASCIIEncoding.ASCII.GetString(bytes); 28 q++; 29 } 30 if (isToBase64) 31 { 32 Byte[] byteR = bytesR.ToArray(); 33 result = Convert.ToBase64String(byteR); 34 } 35 return result; 36 } 37 public static void getEp(string vid, string ep, ref string pNew, ref string token, ref string sid) 38 { 39 string template1 = "becaf9be"; 40 string template2 = "bf7e5f01"; 41 byte[] bytes = Convert.FromBase64String(ep); 42 ep = ystem.Text.ASCIIEncoding.ASCII.GetString(bytes); 43 string temp = myEncoder(template1, bytes, false); 44 string[] part = temp.Split('_'); 45 sid = part[0]; 46 token = part[1]; 47 string whole = string.Format("{0}_{1}_{2}", sid, vid, token); 48 byte[] newbytes = System.Text.ASCIIEncoding.ASCII.GetBytes(whole); 49 epNew = myEncoder(template2, newbytes, true); 50 }
计算得到ep,token,sid分别为diaVGE+IVMwB5CXXjz8bNHi0cCEHXJZ0vESH/7YbAMZuNaHQnT/Wzw==, 4178, 441265221168712cdf4f8。注意,此时ep并不能直接拼接到url中,需要对此做一下url编码ToUrlEncode(ep)。最终ep为diaVGE%2bIVMwB5CXXjz8bNHi0cCEHXJZ0vESH%2f7YbAMZuNaHQnT%2fWzw%3d%3d
Type值和选择的segs有密切关系。如本文选择的hd2,type即为flv,下面是segs,type和清晰度的对照。
“segs”,”type”,”清晰度” "hd3", "flv", "1080P" "hd2", "flv", "超清" "mp4", "mp4", "高清" "flvhd", "flv", "高清" "flv", "flv", "标清" "3gphd", "3gp", "高清"
最后的m3u8地址为
http://pl.youku.com/playlist/m3u8?ctype=12&ep=diaVGE%2bIVMwB5CXXjz8bNHi0cCEHXJZ0vESH%2f7YbAMZuNaHQnT%2fWzw%3d%3d&ev=1&keyframe=1&oip=1991941296&sid=441265221168712cdf4f8&token=4178&type=flv&vid=XNzk2NTI0MzMy
将上述m3u8文件下载后,其中内容即为真实地址,不过还需要稍微处理一下。部分内容如下:
1 #EXTM3U 2 #EXT-X-TARGETDURATION:12 3 #EXT-X-VERSION:3 4 #EXTINF:6, 5 http://59.108.137.14/696CD107FE4D821FFBF173EB3/03000208005430B01849631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=0&ts_end=5.9&ts_seg_no=0&ts_keyframe=1 6 #EXTINF:5.533, 7 http://59.108.137.14/696CD107FE4D821FFBF173EB3/03000208005430B01849631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=5.9&ts_end=11.433&ts_seg_no=1&ts_keyframe=1 8 #EXTINF:5.467, 9 http://59.108.137.14/696CD107FE4D821FFBF173EB3/03000208005430B01849631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=11.433&ts_end=16.9&ts_seg_no=2&ts_keyframe=1 10 #EXTINF:9.267,
其中每条url只包含6s左右视频,但是可将url中参数部分去掉即可得到实际的长度。但是每条去掉后需合并一下相同的url,如上述列表可得到url片段
http://59.108.137.14/696CD107FE4D821FFBF173EB3/03000208005430B01849631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv
将m3u8中所有的url片段全部下载即可大功告成。