解析百度搜索结果link?url=参数分析(全)

解析百度搜索结果link?url=参数分析(全)

2023年7月9日发(作者:)

解析百度搜索结果link?url=参数分析(全)前⼏天写过⼀篇可以获取到百度跳转之后的⽹址的⽂章,在百度了⼀下,有⼈也研究过百度link?url=的。

1、加密⽅式根据:随机+输⼊停留时间+快照地址进⾏加密

2、整个代码中应该有三个部分:1、搜索词的时间;2、搜索的关键词;3、随机⽣成的唯⼀性标识代码。

3、在任何环境或浏览器下 url=最后有⼀段相似的代码

从以上别⼈研究的结果可以知道,“最后有⼀段相似的代码”是⽐较可⽤的,于是先从此⼊⼿。

我搜索“enenba” 发现,我的第⼀个搜索结果的URL都有⼀段代码是相同的,那就是

/link?url=…………ebac5573358cc3c0659257bfcf54763ec1c5ecff3b3fbd1d4c

所有搜索结果都有的⼀段代码 ebac5573358cc3c0659257bfcf54 (搜索N次后发现)

后⾯结尾的 763ec1c5ecff3b3fbd1d4c 看起来像是搜索结果的真实URL。(已经验证是真实URL的密⽂)

我是这样验证的:

1、先百度搜索

第⼀个结果链接:

/link?url=…………ebac5573358cc3c0659257bfcf546427d385fef6656de2404d6843da27

看到前⾯的⼏位6427d385fef6656de2404d6843da27

2、 再百度搜索

第⼀个结果链接:

/link?url=…………ebac5573358cc3c0659257bfcf54 6427d385e6ff7a6de0434d6843da

看到前⾯的⼏位6427d385e6ff7a6de0434d6843da

……

多次搜索N个⽹站后发现,域名前⼏位是“www.”的,密⽂是都是6427d385

并且www.是四个字符,密⽂6427d385是⼋个字符。可以知道密⽂两个字符等于url⼀个字符。

于是写了⼀个php表单查询并得到密⽂部分,⽅便以后查看。

出个php源码:

复制代码 代码如下:

查询百度link?ulr=真实链接表单

/*

getrealurl 获取301、302重定向后的URL地址 by

@param str $url 查询

$return str 定向后的url的真实url

*/

function getrealurl($url){

$header = get_headers($url,1);

if (strpos($header[0],'301') || strpos($header[0],'302')) {

if(is_array($header['Location'])) {

return $header['Location'][count($header['Location'])-1];

}else{

return $header['Location'];

}

}else {

return $url;

}

}

$input = '

';

$url = isset($_GET['url'])?$_GET['url']:'';

if(empty($url)) exit($input);

$urlreal = getrealurl($url);

echo '真实的url为:'.$urlreal;

$urlreal = ltrim($urlreal,''); $search = '/ebac5573358cc3c0659257bfcf54([0-9a-f]+)/i';

preg_match($search,$url,$r);

$url_encode = $r[1]; unset($r);

echo '
密⽂部分为:'.$url_encode.'
';

$urlreal_arr = str_split($urlreal);

$url_encode_arr = str_split($url_encode,2);

echo '
';

echo $input;

>

上⼀个在线例⼦:猛击测试

明天再研究,待续。。。。

本站事先声明:cnbeta上的⽂章不是我发布的。我解析只是根据⾃⼰的想法进⾏研究的,只是求个过程,⾄于有没有结果,我⾃有定论,⼤家别喷了。

接上⼀篇⽂章,仔细看了下百度结果url的长段代码,发现密⽂中只有数字和a到f字母组成,也就是⼗六进制的代码。

⼗六进制是从 0->1->2->3->4->5->7->8->9->a->b->c->d->e->f

我采集⼀系列的url并统计了第⼀位的代码。

<

XX这⼀位代码对应的url是这样的

复制代码 代码如下:33 0 23 @ 13 P 03 ` 73 p 63

! 32 1 22 A 12 Q 02 a 72 q 62

" 31 2 21 B 11 R 01 b 71 r 61

# 30 3 20 C 10 S 00 c 70 s 60

$ 37 4 27 D 17 T 07 d 77 t 67

% 36 5 26 E 16 U 06 e 76 u 66

& 35 6 25 F 15 V 05 f 75 v 65

' 34 7 24 G 14 W 04 g 74 w 64

( 3b 8 2b H 1b X 0b h 7b x 6b

) 3a 9 2a I 1a Y 0a i 7a y 6a

* 39 : 29 J 19 Z 09 j 79 z 69

+ 38 ; 28 K 18 [ 08 k 78 { 68

, 3f < 2f L 1f 0f l 7f | 6f

- 3e = 2e M 1e ] 0e m 7e } 6e

. 3d > 2d N 1d ^ 0d n 7d ~ 6d

/ 3c ? 2c O 1c _ 0c o 7c 6c

发现应该是⼀个ascii码表中的字符,但是顺序应该是混淆了。但是都是这个⼀个进制内都是这样:

3->2->1->0->7->6->5->4->b->a->9->8->f->e->d->c

四位⼀个降序,看出总体是递减的。

但是不解的是 从_ 到 `在ascii是相邻的 对应的 0c 和 73 是跳跃的。没办法,看不出规律,再看看第⼆位的这组代码

ebac5573358cc3c0659257bfcf54XXYY。。。。

YY这⼀位代码对应的url是这样的

复制代码 代码如下:70 0 60 @ 50 P 40 ` 30 p 20

! 71 1 61 A 51 Q 41 a 31 q 21

" 72 2 62 B 52 R 42 b 32 r 22

# 73 3 63 C 53 S 43 c 33 s 23

$ 74 4 64 D 54 T 44 d 34 t 24

% 75 5 65 E 55 U 45 e 35 u 25

& 76 6 66 F 56 V 46 f 36 v 26

' 77 7 67 G 57 W 47 g 37 w 27

( 78 8 68 H 58 X 48 h 38 x 28

) 79 9 69 I 59 Y 49 i 39 y 29

* 7a : 6a J 5a Z 4a j 3a z 2a

+ 7b ; 6b K 5b [ 4b k 3b { 2b

, 7c < 6c L 5c 4c l 3c | 2c

- 7d = 6d M 5d ] 4d m 3d } 2d

. 7e > 6e N 5e ^ 4e n 3e ~ 2e / 7f ? 6f O 5f _ 4f o 3f 2f

第⼆位的这⼀组的秘⽂很好的遵循 ⼗六进制递增的顺序。

0->1->2->3->4->5->7->8->9->a->b->c->d->e->f

总体是递减的。

再看第三组

ebac5573358cc3c0659257bfcf54XXYYZZ。。。。

ZZ这⼀位代码对应的url是这样的

复制代码 代码如下:84 0 94 @ a4 P b4 ` c4 p d4

! 85 1 95 A a5 Q b5 a c5 q d5

" 86 2 96 B a6 R b6 b c6 r d6

# 87 3 97 C a7 S b7 c c7 s d7

$ 80 4 90 D a0 T b0 d c0 t d0

% 81 5 91 E a1 U b1 e c1 u d1

& 82 6 92 F a2 V b2 f c2 v d2

' 83 7 93 G a3 W b3 g c3 w d3

( 8c 8 9c H ac X bc h cc x dc

) 8b 9 9b I ab Y bb i cd y dd

* 8e : 9e J ae Z be j ce z de

+ 8f ; 9f K af [ bf k cf { df

, 88 < 98 L a8 b8 l c8 | d8

- 89 = 99 M a9 ] b9 m c9 } d9

. 8a > 9a N aa ^ ba n ca ~ da

/ 8b ? 9b O ab _ bb o cb db

不解释了上顺序:

4->5->6->7->0->1->2->3->4->c->b->e->f->8->9->a->b

总体是递增的

还没看后⾯的位数,不过⼤概可以知道是 四位为⼀组的混淆⼗六进制混淆,⾄于是递增还是递减,需要⼀定的数据量来判断。

下次采集1000条url数据进⾏判断。

待续。。。。

发布者:admin,转转请注明出处:http://www.yc00.com/news/1688890365a181643.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信