网络攻防-子域名收集实验

admin•2025-09-17 10:52:40•网站建设•阅读19

1.题目本次实验主要考察大家的编程能力及子域名的信息收集方法，在文件夹“Lab1_code”提供了使用 Bing 搜索引擎的域名收集功能。请对该代码进行扩展，使其可支持百度搜索引擎的域名收集功能。

1.题目

本次实验主要考察大家的编程能力及子域名的信息收集方法，在文件夹“Lab1_code”提供了使用 Bing 搜索引擎的域名收集功能。请对该代码进行扩展，使其可支持百度搜索引擎的域名收集功能。需要实现如下功能：
a) 支持百度搜索引擎的域名提取，其中从百度搜索引擎提取的域名
需为真实域名，而非百度的域名跳转链接；
b) 可扩充其他功能，比如域名所在的标题等信息。

2.实验步骤及结果

1.在百度搜索引擎上收缩搜索 site:qq，使用网页的检查功能查头部字段，找到 Request URL，Accept，Cookie，User-Agent，referer等字段。

2.将代码中的请求头中使用到的头部字段更换为找到的以上字段。

3.提取出爬取页面的域名以及标题内容。

4.检测获取的域名是否是真实的，如果不是，则从爬取的内容中通过正则表达式获取真实域名。

5.最终爬取结果如下。获取了site:qq搜索结果的域名、网页名称、真实域名等信息。

3.完整代码

# 本次实验内容主要为：收集baidu域名下的子域名，
# 收集方法为使用bing搜索引擎，采用爬手段，爬取搜索到的域名
# bing搜索引擎搜索子域名的语法为：domain:[域名]
import requests                          #用于请求网页
from bs4 import BeautifulSoup            #用于处理获取的到的网页源码数据
from urllib.parse import urlparse        #用于处理url
import re
#定义一个采用bing搜索的方法
def baidu_search():
    Subdomain = []           #定义一个空列表用于存储收集到的子域名
    #定义请求头，绕过反爬机制
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36 SLBrowser/8.0.1.4031 SLBChan/103',
        'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9',
        'referer': 'https://wappass.baidu/',
        'Cookie':'BIDUPSID=AE44C5B2EBE1737A2D11F88EFF992543; PSTM=1629159880; BAIDUID=836DC437AFD55FD2ABBFB1373529BA84:FG=1; sugstore=0; BD_UPN=12314753; H_PS_PSSID=; kleck=8e806f85d57d64d478cd7e8d9bd4c8af; delPer=0; BD_CK_SAM=1; PSINO=2; BA_HECTOR=a58ka50k8ka00ka1akak2gah1iftvu91o; ZFY=M9W3yUZNmeWbKd0BTGStEH7cCi8Mv0O9mecypG7Oh4w:C; BAIDUID_BFESS=836DC437AFD55FD2ABBFB1373529BA84:FG=1; Hm_lvt_aec699bb6442ba076c8981c6dc490771=1694434689; Hm_lpvt_aec699bb6442ba076c8981c6dc490771=1694434689; BDRCVFR[30lSwWI4omf]=mbxnW11j9Dfmh7GuZR8mvqV; BDRCVFR[hiIP0dwB613]=mk3SLVN4HKm; BDORZ=FFFB88E999055A3F8A630C64834BD6D0; H_PS_645EC=d979DOJrpb5wzSwlUNQYbW%2BU0g1ieUHqKyV6lKS1dXH%2B7sA14OS39bdp6KlmPbFlgAzxXifTE6Ib; BDSVRTM=181'
    }
    #定义请求url
    url='https://www.baidu/s?wd=site%3Aqq&rsv_spt=1&rsv_iqid=0x9e28488c0016ff42&issp=1&f=8&rsv_bp=1&rsv_idx=2&ie=utf-8&tn=48021271_74_hao_pg&rsv_enter=1&rsv_dl=tb&rsv_sug3=15&rsv_sug1=4&rsv_sug7=100&rsv_sug2=0&rsv_btype=i&prefixsug=site%253Aqq&rsp=5&inputT=5648&rsv_sug4=6877&p_tk=2132qVWjJEDlb8%2BD7rJO0hvD1L8ywRB%2B992tDsrxORuKXMueJGYbtASlKR8TC%2BfP60urwXR94zFX30a1UfP5FRkXcBHpoAKUmCipQFIGhX5jm3xalo0o8EYQ8HEXpwRg%2BDqGJBCJ%2BxE6zTo8M%2BoDyeQAjpGgzzSKklChuxTGQMfVi34%3D&p_timestamp=1694433156&p_sign=c741fe88613585a26c66c4f317e76293&p_signature=9a9337900fe08513180ec5c60aa9836b&__pc2ps_ab=2132qVWjJEDlb8%2BD7rJO0hvD1L8ywRB%2B992tDsrxORuKXMueJGYbtASlKR8TC%2BfP60urwXR94zFX30a1UfP5FRkXcBHpoAKUmCipQFIGhX5jm3xalo0o8EYQ8HEXpwRg%2BDqGJBCJ%2BxE6zTo8M%2BoDyeQAjpGgzzSKklChuxTGQMfVi34%3D|1694433156|9a9337900fe08513180ec5c60aa9836b|c741fe88613585a26c66c4f317e76293'
              #访问url，获取网页源码
    #找到隐藏的真实域名
      # 不允许重定向

    resp = requests.get(url, headers=headers)
    soup = BeautifulSoup(resp.content,'html.parser')    #创建一个BeautifulSoup对象，第一个参数是网页源码，第二个参数是Beautiful Soup 使用的 HTML 解析器，
    job_bt = soup.find_all('div',class_="result")                        #find_all()查找源码中所有<h2>标签的内容
    for i in job_bt:
        #print(div)
        link = i.get('mu')
        name = i.a.string

         #循环获取‘href’的内容
        #urlparse是一个解析url的工具，scheme获取url的协议名，netloc获取url的网络位置
        domain = str(urlparse(link).scheme + "://" + urlparse(link)loc)
        if domain in Subdomain:              #如果解析后的domain存在于Subdomain中则跳过，否则将domain存入子域名表中
            pass
        else:
            print(name)
            Subdomain.append(domain)
            print(domain)
            r = requests.get(domain, headers=headers, allow_redirects=False)
            print(r.status_code)
            #real = r.content.replace('\r', '').replace('In','').replace('\t', '')
            if r.status_code == 302:  # 如果返回302，就从响应头获取真实地址
                real_url = r.headers.get('Location')
            else:  # 否则从返回内容中用正则表达式提取出来真实地址
                #real_url = re.findall("href='(.*?)'", r.text)[0]
                try:
                     real_url = re.findall("URL='(.*?)'", r.text)[0]
                except IndexError: real_url='同上'
            print('real_url is:', real_url)

baidu_search()

发布者：admin，转转请注明出处：http://www.yc00.com/web/1754691910a5191839.html

攻防域名网络

admin

网站建设
vivo如何root（Vivo如何设置4g网络）
vivo手机怎么开启root权限啊?建议不要ROOT设备；虽然ROOT可以实现更多的功能，但不是官方操作，无法获得官方支持，并且可能会降低设备的稳定性和
admin
1月前
240
网站建设
网络攻防测试
第1讲章节测验一. 单选题（共14题） 1 【单选题】以下用于域名解析的协议是 A、 IIS B、 ARP C、 DNS D、 DHCP 我的答案： C 5.0分
admin
1月前
210
网站建设
【网络攻防】章节测试
第一章在Linux中，用来显示和设置网卡的IP地址的命令是A、iwconfigB、ifconfigC、inconfigD、ipconfig我的答案：B5.0分正确答案&#xff1a
admin
1月前
180
网站建设
网络原理done
文章目录ARP协议模拟一次ARP过程ARP周边问题ARP欺骗RARPDNS域名解析服务域名简介DNS结论ICMP协议NAT技术（重点）NAPTNAT缺点内网穿透代理服务器正向代理反向代理NAT和代
admin
1月前
190
网站建设
【Linux网络】IP协议{初识报头分片网段划分子网掩码私网公网IP认识网络世界路由表}
文章目录1.入门了解2.认识报头3.认识网段4.路由跳转相关指令路由该文诸多理解参考文章：好文！ 1.入门了解用户需求：将我的数据可靠的跨网络从A主机送到B主机传输层T
admin
1月前
120
网站建设
网络安全攻防秘籍，从零基础到精通，收藏这篇就够了！
互联网冲浪，谁还没遇到过几个“李鬼”？网络安全这玩意儿，就像天气预报，你永远不知道明天会下啥“妖风”。眼瞅着攻防演练就要开始了，咱
admin
1月前
190
网站建设
网络安全设备防护原理网络安全防护装置
防火墙简介网络层的防护设备，依照特殊的规则允许或者限制传输的数据通过是由软件和硬件设备组合而成，在内部网和外部网之间、专用网和公共网之间的界面上构造的保护屏障下一代防火墙(NG F
admin
1月前
200
网站建设
计算机无法连接网络打印机,网络打印机无法连接的解决方法是什么
网络打印机无法连接的解决方法是什么网络打印机无法连接的解决方法。1、首先确定计算机是否可以连接网络打印机，网络打印机都会有一个内网ip地址，可以先ping一下看通不通，如果不
admin
1月前
210
网站建设
不使用网线就无法将两台计算机连接成网络,不通过路由器将两台计算机连接到网络的方法不止一种-如何将两台计算机连接到局域网...
现在有许多数据传输方法，最常见的是U盘，LAN，Internet等. 人们已经习惯了基于Internet和wifi的这种生活方式. 我记得很多年前，当时
admin
1月前
170
网站建设
GD32 使用DP83848 移植 LWIP 网线热插入网络不通的解决办法
问题描述 GD32 单片机网线正常插入状态下，启动程序，网络正常。如果GD32 单片机在未接网线的状态下，启动程序后，再将网线插入网口后&#xf
admin
1月前
240
网站建设
“无线网络连接”时出错显示“地址仍未与网络终结点关联”怎么办？网线没问题，但是不能上网。
cmd 管理员运行 netsh winsock resetnetsh int ip reset reset.log重启就好了还不行私M我操作如下：C:windowssystem32>netsh
admin
1月前
230
网站建设
【共享网络】——一台电脑如何通过另一台联网电脑访问网络
电脑A没有连接网络，电脑B已经连接wifi。电脑A如何通过访问电脑B从而连接网络？1. 将这2台电脑用网线直连2. 电脑B打开【网络和Internet设置】3. 右键点击WLAN&#xf
admin
1月前
200
网站建设
ubuntu 以太网已连接但是无法联网_Ubuntu无法连接网络的解决办法
虚拟机中Ubuntu无法连接网络的有效解决办法：1、Ubuntu网络设置：依次单击【System Settings】-->【Network】-->【Wired】-->【Optio
admin
1月前
130
网站建设
主机ubuntu连接无线网络，通过网线分享网络给Xavier的配置过程
1.使用环境主机系统：ubuntu18.04，连接无线网络。从机系统：xavier机器，也是ubuntu18.04.主机和从机通过网线连接。2.网络配
admin
1月前
200
网站建设
Win10 连接网络后任务栏卡死
Win10 连接网络后任务栏卡死Win10 连接网络桌面任务栏就卡死，此问题是因为任务栏中的“资讯和兴趣”的网络访问导致的，通常可以通过禁用该功能解决此问题。插网线的直接拔掉网线。自动连接 W
admin
1月前
230
网站建设
解决：Ubuntu连接不上网络
今天莫名奇妙，我的ubuntu20.04断网了。检查了一下，使用的也是桥接模式，啥也没有变化。然后我上Ubuntu16.04版本看了，那里又可以成功上网，所以，不是电脑的问题。看了网上两个教程，解决了。总结来说，就是里面可能有两
admin
1月前
200
网站建设
Android Studio实现网络视频播放器
项目目录一、项目概述二、开发环境三、项目结构四、运行演示五、项目总结六、源码下载一、项目概述本次项目实现了一个简单的网络视频播放器，调用的是高度自定义的视频框架jiaozivideoplayer。通过gson解
admin
1月前
180
网站建设
爱快路由，通过域名分流解决QQ网吧特权不生效的问题
前言这是以前做网吧维护时写的一篇文章，虽然如今网吧江河日下，但这并不是关键。解决问题的思路才是值得关注的。。说明一下，英雄联盟网吧特权，客户机不生效的问
admin
1月前
190
网站建设
零路由器网络共享指南
本文还有配套的精品资源，点击获取简介：网络共享工具通过一台设备的网络连接，使得其他设备也能接入互联网。特别是在没有路由器的环境下，使用手机或电脑作
admin
1月前
130
网站建设
Windows 11网络设置重置完全指南：从入门到精通
Windows 11网络设置重置完全指南：从入门到精通引言：为什么需要重置网络设置？在数字化办公时代，网络连接稳定性直接影响工作效率。当遇到以下典型问题时，系统网络配置可能已出现异常：浏览器显示"无Internet连接&
admin
29天前
450

发表回复

评论列表（0条）

暂无评论

网络攻防-子域名收集实验

1.题目

2.实验步骤及结果

3.完整代码

发表回复

评论列表（0条）

联系我们

400-800-8888

网络攻防-子域名收集实验

1.题目

2.实验步骤及结果

3.完整代码

相关推荐

发表回复

评论列表（0条）

联系我们

400-800-8888