资源共享频道

20:39 · 2024年11月5日 · 周二

一款无代码网页数据提取神器：Maxun，可以用它2分钟创建一个自定义机器人，自动抓取数据，定时运行

支持抓取列表、文字或者整个页面的截图

支持多个页面自动分页或者滚动操作

直接将网站转换为API接口，导出为电子表格，与Google Sheets集成，支持自定义代理以绕过反爬虫机制

支持定时任务

仓库地址：https://github.com/getmaxun/maxun

https://calendly.com/karishmashuklaa/maxun

#爬虫

爬虫

12:55 · 2024年11月5日 · 周二

Maxun - Web：数据采集自动化平台 | #爬虫

爬虫 • 无代码 • 智能化 • 全自动化

无代码网络数据提取平台, 用户可以在 2 分钟内训练一个网络爬虫机器人, 无需编程知识就能实现自动化的网页数据抓取, 支持将网站转换为 API 或直接导出到电子表格。

✨主要特性:
- 无代码方式提取数据
- 支持处理分页和滚动
- 可以按特定时间表运行机器人
- 支持网站到 API 的转换
- 支持网站到电子表格的转换
- 允许用户连接外部代理以绕过反爬虫保护
- 即将推出: 自适应网站布局变化、支持需要登录和双因素认证的网站抓取

✨机器人动作类型:
- Capture List: 用于提取结构化数据和批量项目
- Capture Text: 用于提取单个文本内容
- Capture Screenshot: 可获取全页面或可见区域截图

爬虫

08:57 · 2022年12月26日 · 周一

HuoHuan
一款微信群爬虫 Windows 客户端工具，用于获取网络中他人公开并且有效的微信群聊二维码图片。
https://github.com/laosanyuan/HuoHuan
https://oiloil.lanzoue.com/b031qnfuj
密码：5oxw
#爬虫 #微信 #开源

GitHub

GitHub - laosanyuan/HuoHuan: 互联网微信群聊二维码获取工具

互联网微信群聊二维码获取工具. Contribute to laosanyuan/HuoHuan development by creating an account on GitHub.

爬虫微信开源

04:15 · 2022年3月27日 · 周日

awesome-web-scraping

这里面收集了有关网络 #爬虫的各种资料、工具库的列表，不仅仅是 Python，还有 Go、Ruby、JavaScript、PHP ，一些爬虫商业服务、控制台工具、无头浏览器、验证码破解网站等中文版

爬虫