news 2026/6/3 3:50:38

开源情报(OSINT):在 GitHub 上收集信息的工具和方法

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
开源情报(OSINT):在 GitHub 上收集信息的工具和方法

在本文中,我们将探讨在 GitHub 上进行开源情报调查时可以使用的工具和技术。

GitHub 是全球最大的软件开发和版本控制平台,托管着数百万个公共和私有代码仓库。它基于 Git 分布式版本控制系统构建,允许开发人员存储代码、跟踪代码变更、协作开发项目并进行项目管理。

对于开源情报(OSINT)分析师而言,GitHub 不仅仅是一个代码存储平台,它还是最丰富的在线情报来源之一。由于开发者在日常工作中会使用 GitHub,并且不会刻意建立公开档案,因此 GitHub 往往能够全面展现组织的实际运作方式。它涵盖了所使用的技术、项目团队成员、正在开发的产品,有时甚至包括一些不宜公开的敏感信息。

本文将探讨在 GitHub 上进行开源情报 (OSINT) 调查的方法。

步骤 1:使用 Google Dorks 在 GitHub 上查找人员

GitHub 的内置搜索功能虽然相当实用,但存在一些明显的局限性:它需要授权,而且无法完整索引内容或某些文件类型。相比之下,像 Google 这样的网络爬虫可以索引 GitHub 上很大一部分公开内容。

我们来尝试按名称查找个人资料:

site:github.com “Full Name

我们来尝试查找公司页面上提到的人员:

site:github.com "Company Name" "members"

或者,您可以尝试按如下方式查找配置文件:

site:github.com filename:config.json

当然,搜索范围并不局限于这些扩展名。例如,您还可以搜索数据库:

site:github.com/targetorg filename:*.sql

步骤二:GitHub API 端点

GitHub 在 api.github.com 提供了一个 REST API,它以 JSON 格式返回网站上所有可用数据的结构化数据,以及一些无法通过 Web 界面访问的数据。无需授权即可请求公共数据,但每小时请求次数限制为 60 次。使用个人访问令牌 (PAT) 可以将此限制提高到每小时 5,000 次。

要收集用户信息,请在浏览器中打开以下网址:

https://api.github.com/users/[username]

这些数据揭示了诸如位置和账户创建日期等重要信息。

另一个命令允许你从提交历史记录中提取电子邮件地址。即使 GitHub 用户没有公开他们的电子邮件地址,它通常也包含在提交元数据中,而 API 提供了对此信息的直接访问。

https://api.github.com/repos/[owner]/[repository]/commits

许多 API 接口都提供有价值的信息,但手动查找它们可能非常耗时。因此,让我们考虑使用自动化工具。

步骤 3:自动化 GitHub 开源情报

TruffleHog 是功能最强大、维护最活跃的开源秘密发现工具之一。

另一个值得考虑的工具是 Octosuite。这个框架用 Python 编写,非常适合自动化 GitHub 开源情报收集。它将多个 API 端点整合到一个简化的工作流程中,并提供格式化的输出。

安装过程使用以下命令:

kali> python3 -m venv .venv

kali> source .venv/bin/activate

kali> pip3 install octosuite

接下来,您可以直接从命令行向 GitHub 发送请求。例如,让我们访问用户 API 端点:

kali> octosuite user username

您还可以获取GitHub上提到的所有公司员工的信息:

kali>octosuite org company_name –members

当您需要基于 GitHub 上的开放数据生成结构化报告,而无需编写自己的脚本时,Octosuite 就显得尤为有用。

GitHub 是开源情报的宝贵资源,因为许多用户将其用作工作空间,并拥有包含个人信息的公开个人资料。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/3 3:49:47

ARL Docker 一键部署

1. 更新系统 & 安装 Docker apt update -y apt install docker.io -y systemctl enable docker systemctl start docker 2. 安装 Docker Compose apt install docker-compose -y 验证: docker-compose version 3. 配置 Docker 镜像加速(关键&…

作者头像 李华
网站建设 2026/6/3 3:49:16

Google AI Studio

Google AI Studio 是 Google 推出的一个基于浏览器的 AI 开发与实验平台,可以理解为 Gemini 模型的官方 Playground(实验场)。开发者和普通用户都可以直接在网页中测试、调用和构建基于 Gemini 的 AI 应用。 它能做什么? Google…

作者头像 李华
网站建设 2026/6/3 3:48:48

从SGAN到InfoGAN:聊聊GAN家族里那些‘不务正业’的判别器们

从SGAN到InfoGAN:GAN判别器的角色进化与设计哲学在生成对抗网络的发展历程中,判别器这个"打假警察"的角色经历了令人惊叹的蜕变。最初,它只是简单地分辨真假;后来,它学会了分类;再后来&#xff0…

作者头像 李华
网站建设 2026/6/3 3:43:22

QMT数据获取避坑指南:你的`get_market_data`和`get_local_data`用对了吗?

QMT数据获取避坑指南:你的get_market_data和get_local_data用对了吗?在量化交易领域,数据获取是最基础却也是最容易踩坑的环节。特别是对于刚刚接触迅投QMT平台或者从其他平台迁移过来的开发者来说,xtquant模块中几个看似相似的数…

作者头像 李华