聚星亭

吾笨笨且懒散兮 急须改之而奋进
posts - 74, comments - 166, trackbacks - 0, articles - 0
  C++博客 :: 首页 :: 新随笔 :: 联系 :: 聚合  :: 管理

难得我母亲要我给她下音乐听,她在好听音乐网上听到一首,我就要百度好久才能找到播放的是哪首,好长时间才下了仅仅的几首。
记得以前迅雷可以直接分析出下载地址来的,可是现在不知怎么的,迅雷的版本高了,功能却变得弱智了。
没有办法就只有自己找找规律分析一下了,下面记录我的分析过程,贴出来纪念下:

先看下网址的规律:
多个歌曲连播的URL地址形式:
http://www.haoting.com/play/htsonglian1.htm?id=123907&id=357857
其中id=后面的数字就是歌曲的ID。


单首歌曲播放的URL形式:
http://www.haoting.com/htmusic/357857ht.htm
其中的数字就是歌曲的ID。

查看其源文件,得到如下内容:

<SCRIPT language="JavaScript" src="/js/lianbohy.js"></SCRIPT>


打开这个文件,查看其代码,仔细分析得到有用信息如下:

function digui(musicids,length)
{
 
if(idindex < length)
 {
  idvalue 
= musicids[idindex];
  s 
= document.createElement("script");
  s.type
="text/javascript";
  s.src
="http://haoting.com/musicjs/"+musicids[idindex]+".js"// 这个是关键。
  document.getElementsByTagName("head")[0].appendChild(s);
 
 }
 
}

 

由于到这里两种网址中歌曲的ID已经都取到了只要访问如下格式的URL:
 http://haoting.com/musicjs/歌曲的ID.js
比如:
 http://haoting.com/musicjs/357857.js

就可以下载到如下内容的JS文件:

var url_357857="/21z/0/dianxiao2yyyyqx090620/1/0897053676a18e5e_1.wma";  //下载地址
var music_357857="相爱后动物感伤(CD Version) - 阿密特(张惠妹)";   //这个是歌曲名
var singer_357857="最新单曲";       //这个是歌手名
var nclassid_357857=5538;
var specialid_357857="abb60fe6d6c77f45";
var specialName_357857="最新单曲合辑NO.48";     //这个是专辑名


我们知道这个音乐在网站上的相对地址了,怎么才能知道它完整的地址呢?

继续分析lianbohy.js中的代码,找到如下信息:

 

//播放歌曲
function play(str,obj)
{
 
 
var STAND_STR = "/19z/",
 STAND_STR2 
= "/20z/",
 STAND_STR3 
= "/21z/",
 STAND_STR4 
= "/22z/";
 
if(url.indexOf(STAND_STR)==-1 && url.indexOf(STAND_STR2)==-1 && url.indexOf(STAND_STR3)==-1 && url.indexOf(STAND_STR4)==-1)  
  ht 
= "http://ow.haoting.com";
 
else 
  ht 
= "http://wma.haoting.com";
 
 
if(window.navigator.userAgent.indexOf("MSIE"== -1)
 {
  installPlayer(ht
+url);
 }
 
else
 {
  haotingplay.url
=ht+url;
  haotingplay.controls.play();
  showTLab();
 }
 
}


嘿嘿,明白了吧,如果看不懂这些代码,就把它跟我们找到的地址一起对比下:
 STAND_STR3 = "/21z/",
 ht = "http://wma.haoting.com";
 haotingplay.url=ht+url;
再看下相对地址:
 var url_357857="/21z/0/dianxiao2yyyyqx090620/1/0897053676a18e5e_1.wma";


根据上面的文件我们可以提取出很多的信息,其中下载地址如下:
http://wma.haoting.com/21z/0/dianxiao2yyyyqx090620/1/0897053676a18e5e_1.wma

分析完毕,下面开始写个小程序,让它自动完成我上面的分析过程并显示结果:
首先需要用程序来分解上面的网址,从中提取出里面的歌曲ID:

/************************************************************************/
// 函数名称:    AnalyseXUrl
// 参数列表:
//            1、 pUrl      : 要分析的网址。
//            2、    desMusicID:    用来存放歌曲ID的缓冲区。
//            3、 desBufLen :    URL中存在歌曲ID的数量。
// 函数功能:
//                从给定的网址中分离出歌曲的ID。
// 返回值  :
//                获取成功返回TRUE, 否则是FALSE。
/*
***********************************************************************/
BOOL WINAPI AnalyseXUrl(PCHAR pUrl, PDWORD desMusicID, PDWORD desBufLen)
{
    
bool bStart = false;
    
char tmpID[10= {0};

    
int UrlLen = lstrlen(pUrl);
    
if (0 < UrlLen)
    {
        
if (NULL != strstr(pUrl, "haoting.com/htmusic/\0"&& NULL != strstr(pUrl, ".htm\0"))
        {
            
//http://www.haoting.com/htmusic/357857ht.htm
            for (int i = 0, x = 0; i<lstrlen(pUrl); i++)
            {
                
if (pUrl[i] >= '0' && pUrl[i] <= '9')
                {
                    tmpID[x] 
= pUrl[i];
                    x
++;
                }        
            }
            sscanf(tmpID, 
"%d", desMusicID);
            
*desBufLen = 1;
            
return TRUE;
        } 
        
else if(NULL != strstr(pUrl, ".htm?id=\0"))
        {
            
*desBufLen = 0;
            
//http://www.haoting.com/play/htsonglian1.htm?id=123907&id=357857
            for (int i = 0, x = 0; i<lstrlen(pUrl); i++)
            {
                
if (i>=0 && pUrl[i-1== '=')
                {
                    bStart 
= true;
                    x 
= 0;
                }

                
if (pUrl[i] == '&')
                {
                    bStart 
= false;
                    sscanf(tmpID, 
"%d", desMusicID);
                    
*desBufLen += 1;
                    desMusicID
++;
                    RtlZeroMemory(tmpID, 
10);
                }

                
if (bStart)
                {
                    tmpID[x] 
= pUrl[i];
                    x
++;
                }
            }
            sscanf(tmpID, 
"%d", desMusicID);
            
*desBufLen += 1;
            
return TRUE;
        }
        
else
        {
            
return FALSE;
        }
    }
    
else
    {
        
return FALSE;
    }
}
         OK,成功得到ID我们就可以构造一个网址,得到ID对应歌曲的信息:
/************************************************************************/
// 函数名称:    GetXCode
// 参数列表:    
//            1、    nMusicID:    指定歌曲的ID
//            2、 desCode    :    用来存放HTML代码的缓冲区
// 函数功能:
//                获取指定URL中的HTML代码。
// 返回值  :
//            返回获取的代码的字节数。
/*
***********************************************************************/
int WINAPI GetXCode(int nMusicID, PCHAR desCode)
{
    
char    szMusicID[10= {0};
    BOOL    bReadFlg 
= FALSE;
    
char    MusicXCodeBuf[1024= {0}; 
    DWORD    dwBytesRead 
= 0
    
char    pUrl[128]    = "http://haoting.com/musicjs/\0";    //"http://haoting.com/musicjs/"+musicids[idindex]+".js"
    sprintf(szMusicID, "%d", nMusicID);

    lstrcat(pUrl, szMusicID);
    lstrcat(pUrl, 
".js\0");

    HINTERNET hNet 
= ::InternetOpen("Wonderful Songs"//当HTTP协议使用时,这个参数随意赋值 
        PRE_CONFIG_INTERNET_ACCESS, //访问类型指示Win32网络函数使用登记信息去发现一个服务器。 
        NULL, 
        INTERNET_INVALID_PORT_NUMBER, 
//使用INTERNET_INVALID_PORT_NUMBER相当于提供却省的端口数。 
        0 //标志去指示使用返回句句柄的将来的Internet函数将"不"为回调函数发送状态信息 
        ) ; 
    
    HINTERNET hUrlFile 
= ::InternetOpenUrl(hNet,    //从InternetOpen返回的句柄 
        pUrl,    //需要打开的URL ,我们要打开哪个网址就可以填到这里
        NULL,    //用来向服务器传送额外的信息,一般为NULL 
        0,        //用来向服务器传送额外的信息,一般为 0 
        INTERNET_FLAG_RELOAD, //InternetOpenUrl行为的标志 
        0) ;    //信息将不会被送到状态回调函数 

    bReadFlg 
= ::InternetReadFile(hUrlFile,        //InternetOpenUrl返回的句柄 
            MusicXCodeBuf,            //保留数据的缓冲区,也就是存放网页的内容拉
            sizeof(MusicXCodeBuf), 
            
&dwBytesRead);    //指向包含读入缓冲区字节数的变量的指针; 

    
if (!bReadFlg)
    {
        lstrcpy(desCode, 
"连接超时\0");
    }
    
else
    {
        lstrcpy(desCode, MusicXCodeBuf);
    }


    ::InternetCloseHandle(hUrlFile); 
    ::InternetCloseHandle(hNet); 

    
return lstrlen(desCode);
}

/************************************************************************/
// 函数名称:    AnalyseXCode
// 参数列表:    
//            1、 nMusicID:    歌曲ID。
//            2、    XCode     :    HTML代码。
// 函数功能:
//                从JS代码中分离歌曲的关键信息到结构体中。
// 返回值  :
//                返回 SONG_STRU 结构,其中存放的歌曲的信息。
// 参数的格式:
//                var url_357857="/21z/0/dianxiao2yyyyqx090620/1/0897053676a18e5e_1.wma";
//                var music_357857="相爱后动物感伤(CD Version) - 阿密特(张惠妹)";
//                var singer_357857="最新单曲";
//                var nclassid_357857=5538;
//                var specialid_357857="abb60fe6d6c77f45";
//                var specialName_357857="最新单曲合辑NO.48";
/*
***********************************************************************/
SONG_STRU WINAPI AnalyseXCode(
int nMusicID, PCHAR XCode)
{
    
bool        bStart = false;
    
char        *pdest;
    
char        tmpStr[128]    = {0};
    
char        szMusicID[10= {0};
    
    SONG_STRU    struMusicInfo ;

    struMusicInfo.id            
=    nMusicID;
    struMusicInfo.MusicName        
=    new char[128];
    struMusicInfo.Singer        
=    new char[128];
    struMusicInfo.specialName    
=    new char[128];
    struMusicInfo.Url            
=    new char[128];
        
    
if (XCode != NULL)
    {
        
//解析下载地址
        pdest  = strstr(XCode, "url_\0");
        
if (NULL != pdest)
        {
            
for (int i = pdest - XCode + 1, x = 0; i<lstrlen(XCode); i++)
            {
                
if (i>=0 && XCode[i-2== '=')
                {
                    bStart 
= true;
                    x 
= 0;
                }
                
                
if (XCode[i+1== ';')
                {
                    bStart 
= false;

                    
if(strstr(tmpStr, "/19z/\0")==NULL && strstr(tmpStr, "/20z/\0")==NULL && \
                                strstr(tmpStr, 
"/21z/\0")==NULL && strstr(tmpStr, "/22z/\0")==NULL)  
                    {
                        lstrcpy(struMusicInfo.Url, 
"http://ow.haoting.com");
                    }
                    
else 
                    {
                        lstrcpy(struMusicInfo.Url, 
"http://wma.haoting.com");
                    }
                
                    lstrcat(struMusicInfo.Url, tmpStr);
                    RtlZeroMemory(tmpStr, 
128);
                    
break;
                }
                
                
if (bStart)
                {
                    tmpStr[x] 
= XCode[i];
                    x
++;
                }
            }
        }

        
//解析歌曲名字
        pdest  = strstr(XCode, "music_\0");
        
if (NULL != pdest)
        {
            
for (int i = pdest - XCode + 1, x = 0; i<lstrlen(XCode); i++)
            {
                
if (i>=0 && XCode[i-2== '=')
                {
                    bStart 
= true;
                    x 
= 0;
                }
                
                
if (XCode[i+1== ';')
                {
                    bStart 
= false;
                    lstrcpy(struMusicInfo.MusicName, tmpStr);
                    RtlZeroMemory(tmpStr, 
128);
                    
break;
                }
                
                
if (bStart)
                {
                    tmpStr[x] 
= XCode[i];
                    x
++;
                }
            }
        }

        
//解析歌手名字
        pdest  = strstr(XCode, "singer_\0");
        
if (NULL != pdest)
        {
            
for (int i = pdest - XCode + 1, x = 0; i<lstrlen(XCode); i++)
            {
                
if (i>=0 && XCode[i-2== '=')
                {
                    bStart 
= true;
                    x 
= 0;
                }
                
                
if (XCode[i+1== ';')
                {
                    bStart 
= false;
                    lstrcpy(struMusicInfo.Singer, tmpStr);
                    RtlZeroMemory(tmpStr, 
128);
                    
break;
                }
                
                
if (bStart)
                {
                    tmpStr[x] 
= XCode[i];
                    x
++;
                }
            }
        }

        
//解析专辑名字
        pdest  = strstr(XCode, "specialName_\0");
        
if (NULL != pdest)
        {
            
for (int i = pdest - XCode + 1, x = 0; i<lstrlen(XCode); i++)
            {
                
if (i>=0 && XCode[i-2== '=')
                {
                    bStart 
= true;
                    x 
= 0;
                }
                
                
if (XCode[i+1== ';')
                {
                    bStart 
= false;
                    lstrcpy(struMusicInfo.specialName, tmpStr);
                    RtlZeroMemory(tmpStr, 
128);
                    
break;
                }
                
                
if (bStart)
                {
                    tmpStr[x] 
= XCode[i];
                    x
++;
                }
            }
        }
    }

    
return    struMusicInfo;
}

         然后将它得到的信息显示到程序的界面的就可以了,由于直接显示在分析的时候,会造成界面的暂时性假死,所以我单独抛了个线程来完成分析的工作,界面只负责显示,然后在分析的时候加上等待时间,以减少对网络和电脑资源的消耗。
         效果如下图:


当然,如果大家有兴趣,可以写个程序,通过对ID的遍历来实现歌曲搜索、下载等功能,不过可能会比较消耗网络资源我就不写了,嘿嘿!

工程下载:/Files/bester/HaotingPlg/GetDownloadUrlPlg.rar

Feedback

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写  回复  更多评论   

2009-06-30 08:05 by besterChen
这里有另一种写法和分析:
http://bbs.pediy.com/showthread.php?t=92326

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写  回复  更多评论   

2009-12-22 11:01 by 我靠
靠。会点小技术,就不要公开,md,我对haoting采集大半年了。
你这个破技术公开,导致好听代码重新调整,我又要重写我程序,拜托楼主你还能不要公开这点破烂玩意呢。

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写  回复  更多评论   

2010-01-13 13:37 by besterChen
@我靠
抱歉哦,我不是故意的……

我就是平时无聊,搞个博客来显摆显摆,装下牛人~

仅仅是满足下自己的虚荣心而已,希望你别往心里去~

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写  回复  更多评论   

2010-07-30 05:22 by hoodlum1980
GetXCode函数里设置pUrl的时候,用一个sprintf函数就好了呀,干吗还要连续的strcat呢呵呵。。。
看得出来,lz还是很留恋在C的多字节字符串处理上(可能和我一样,用熟了就不喜欢换别的了),不过我还是建议楼主逐渐适应TCHAR上来(毕竟NT以后的操作系统都采用宽字符了),只需要记得大部分用_tcs开头就是了,基本上所有的多字节字符串都有 tchar 版本;

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写[未登录]  回复  更多评论   

2010-07-30 18:00 by besterchen
@hoodlum1980
恩,是啊~
我会注意的,(*^__^*) 嘻嘻……~

只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   知识库   博问   管理