一款无代码网页数据提取神器:Maxun,可以用它2分钟创建一个自定义机器人,自动抓取数据,定时运行

支持抓取列表、文字或者整个页面的截图

支持多个页面自动分页或者滚动操作

直接将网站转换为API接口,导出为电子表格,与Google Sheets集成,支持自定义代理以绕过反爬虫机制

支持定时任务

仓库地址:https://github.com/getmaxun/maxun

https://calendly.com/karishmashuklaa/maxun

#爬虫
Maxun - Web:数据采集自动化平台 | #爬虫

爬虫 • 无代码 • 智能化 • 全自动化

无代码网络数据提取平台, 用户可以在 2 分钟内训练一个网络爬虫机器人, 无需编程知识就能实现自动化的网页数据抓取, 支持将网站转换为 API 或直接导出到电子表格。

主要特性:
- 无代码方式提取数据
- 支持处理分页和滚动
- 可以按特定时间表运行机器人
- 支持网站到 API 的转换
- 支持网站到电子表格的转换
- 允许用户连接外部代理以绕过反爬虫保护
- 即将推出: 自适应网站布局变化、支持需要登录和双因素认证的网站抓取

机器人动作类型:
- Capture List: 用于提取结构化数据和批量项目
- Capture Text: 用于提取单个文本内容
- Capture Screenshot: 可获取全页面或可见区域截图
awesome-web-scraping

这里面收集了有关网络 #爬虫 的各种资料、工具库的列表,不仅仅是 Python,还有 Go、Ruby、JavaScript、PHP ,一些爬虫商业服务、控制台工具、无头浏览器、验证码破解网站等 中文版
 
 
Back to Top