查看原文
其他

【技巧】如何调查一个已经无法访问的网站

dingba 丁爸 情报分析师的工具箱 2023-01-02

首先给大家推荐一个网站:

网络情报--在网站上进行基础的开源情报研究

https://tryhackme.com/room/webosint

该网站通过完成任务模式引导学员学习有关网络的开源情报知识。

其中如何调查一个已经无法访问的网站就是其训练任务之一:

当您被告知要调查一家公司时,您做的第一件事是什么?通过网络浏览器,找到该公司对的网站并查看它,对吗?

如果网站已经无法访问怎么办?


这并不意味着这是路的尽头。

OSINT 研究人员可能仍然能够将这些点联系起来并找到有关此类组织的有用信息。

1、任务是尽可能多地查找有关 RepublicofKoffee.com 网站的信息。

注册域名的公司名称是什么?

注册公司列出的电话号码是什么?(不包括国家代码或特殊字符/空格)

为站点列出的第一个名称服务器是什么?

注册人的姓名列出了什么?

哪个国家/地区被列为注册人?


仅仅因为当您访问“RepublicOfKoffee.com”时没有显示任何内容,并不意味着有人不拥有该域。事实上,如果有任何类型的登陆页面,甚至是垃圾页面,那么你可以肯定有人确实拥有它。但它目前是否由在我们感兴趣的时间段内使用它的同一个人拥有?我们可能会也可能无法弄清楚,但值得一看。

2、whois 查询

我们可以通过 whois 查询来确认当前的注册状态。

“whois”查找是可用的域侦查的最基本形式。有多个网站也可以为您做这件事。

比如通过访问lookup.icann.org应该会告诉您当前使用的托管公司和名称服务器。查看原始数据选项将显示更多详细信息。

我们正在寻找可以用作枢轴点的任何数据。也许是电子邮件地址?或者更好的是,实际地址或电话号码?

通过上述在线工具,可以找到所需的信息:网站注册的公司名称、电话号码、名称服务器、注册人的名字和注册人所在的国家。

该域名是由一家叫 NAMECHEAP INC 的公司所有的。

同样,您也可以找到电话号码、名称服务器、注册人的名字和注册人的国家,如下图所示:

注册的电话号码

DNS服务器名称

注册人

注册国家

3、查找网站历史信息

任务:

博客作者的名字是什么?

作者来自哪个城市和国家?

作者经常光顾的国家公园内的寺庙叫什么名字(英文)?


这就是 Archive.org 和 Internet Wayback Machine 发挥作用的地方。

可以在电脑上安装archive.org 浏览器扩展程序,当它无法在Web 浏览器中加载时,它会自动拉出一个选项来搜索Wayback Machine 上的站点。

无论是使用浏览器扩展程序,还是前往 archive.org 并搜索它,都可以查看我们的目标域 RepublicOfKoffee.com 有哪些可用的网页快照。

这里要利用的是https://web.archive.org/,它保存着一年中不同时期的网站档案。


需要找到目标网站上第一个博客的作者姓名。导航到时光机器时间轴上找到的第一个存档:

博客作者:Steve

接下来需要找到作者写作的国家。您已经知道了博客中提到的城市名称和地方,做一点研究就能找到地点  — — 韩国光州。

导航到下一个博客,需要在其中找到作者所参观的寺庙的名称:

对博客中提到的地方进行一些检查就很容易发现寺庙名是:证心寺。(jeungsimsa temple)

4、深入分析DNS

到目前为止,我们已经收集了一些关于我们目标网站上内容的好信息,尽管它已经好几年没有上线了。

但是技术细节呢?

这时可以用ViewDNS.info来分析了。

ViewDNS.info 提供了一个方便的用户界面,用于在目标网站上查找注册信息。使用此信息,可能会得出某些未明确说明的结论,例如网站是否托管在共享或专用 IP 地址上。这个问题的答案可能意味着有关网站预算和流量的事情。

任务

截至 2016 年 10 月,RepublicOfKoffee.com 的 IP 地址是什么?

基于托管在同一 IP 地址上的其他域,我们可以安全地假设目标使用哪种托管服务?

IP 地址在域的历史记录中更改了多少次?



接下来需要查找的是截至2016年10月的 RepublicOfKoffee.com 的IP地址。使用IP历史记录提取所需的信息:

现在您需要找出目标网站使用的托管服务。使用反向查找来达到这个目的。有一长串的域名与之前找到的IP相关联。这说明目标网站所有者使用的是共享托管服务,因为它的成本比专用托管服务低很多。

回溯IP历史,在该域名历史上,IP地址变化过4次。

5、继续训练

现在有一个新的目标域名 heat.net,任务是:

截至 2011 年 12 月,该域列出的 IP 地址是什么?

基于共享相同 IP 的域,域所有者使用什么样的托管服务?

该网站是在什么日期首次被互联网档案馆捕获的?(MM/DD/YY 格式)

2001 年最终捕获的第一个正文段落的第一句话是什么?

使用您的搜索引擎技能,负责网站原始版本的公司名称是什么? 

2010 年最后一次捕获时网站上的第一个标题是什么意思?

还是使用ViewDNS.info来分析:

截至2011年12月列出的该域的IP地址

域名所有者正在使用的托管服务

域名所有者正在使用的共享主机服务

互联网档案馆https://web.archive.org/捕获的第一个网站的日期:

第一段的第一句摘自2001年的网页快照:

SegaSoft是负责该网站原始版本的公司。

6、网站背后的信息

网站消失了一段时间然后又回来了,这不是很有趣吗?显然,该网站的目的现在不同了。首先,您对这个网站有什么直觉吗?您的总体印象是什么?它感觉像是合法的信息来源吗?


要找到规律,必须考虑被调查对象的每一个方面。长时间休眠的网站,在重新上线后,会引起不同的关注。要验证网站是否合法,需要记住一些要点,如网站的语言、用户界面和设计等。

有些时候开发人员会在源代码中留下注释,可以通过分析这些注释来收集更多关于目标的信息。外链和内链可以用来将信息连接起来。

任务:

文章正文中有多少个内部链接?

文章正文中有多少个外部链接?

文章中唯一的外部链接中的网站(不是广告)

尝试找到链接到该网站的 Google Analytics 代码

谷歌分析代码是否在其他网站上使用?

该网站的链接是否嵌入了任何明显的附属代码?

  • 本案例中的内链数:5

  • 外链数:1

  • 外链地址:purchase.org


链接到该网站的 Google Analytics 代码:

使用文章上的查看页面源代码,并找到如下所示的Google Analytics 代码

为了查明此 Google analytic 代码是否已在其他任何网站上用过,使用 nerdydata.com。该在线工具将搜索网页,并告诉您是否在其他任何网站中找到了该查询;


7、继续深挖heat.net

在这个任务中,您需要找到目标网站即 heat.net 和外链之间的联系。重新查看IP历史工具,你会发现外链(purchase.org)与 heat.net 是相同的所有者。

您发现这两个网站的所有权是相同的。当看到 heat.net 时,并没有发现该网站非常有趣或吸引人,也没有产生那么多的流量,而另一方面,purchase.org 是一个电子商务网站,可能比 heat.net 产生更多的收入。

结论

业主正在运行一个私人博客网络(PBN),以说服搜索引擎将他们的主网站排到更高的位置,这是一种常用的SEO优化手段。也就是说,Heat.net 只是为了诱骗搜索引擎将 purchase.org 排到更高的位置。

长按识别下面的二维码可加入星球下载

里面已有近千篇资料可供下载

越早加入越便宜哦


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存