支持抓取列表、文字或者整个页面的截图
支持多个页面自动分页或者滚动操作
直接将网站转换为API接口,导出为电子表格,与Google Sheets集成,支持自定义代理以绕过反爬虫机制
支持定时任务
仓库地址:https://github.com/getmaxun/maxun
https://calendly.com/karishmashuklaa/maxun
#爬虫
备案查询网
ICP 域名备案查询服务,这个是真方便,直接输入网站地址即可,无论是个人还是企业都能查,还会提供备案号和审核时间,没什么大用,但挺有意思,我试了几个网站都能查到,完全免费,无需注册。
https://www.beiancx.com
歌曲宝
音乐下载站,可按歌曲和歌手进行检索,并提供了热门歌曲和搜索排行榜,还支持歌词下载,低品质 MP3 可直接下载,走的是酷我接口,高品质 MP3 则需要去网盘下载,完全免费,无需注册。
www.gequbao.com
Compress JPG
在线图片压缩工具,支持 JPG、PNG、WebP、GIF、AVIF、JXL 和 QOI 格式,基于浏览器本地运行,最多可同时处理 1000 张图片,并可一次性打包下载,完全免费,无需注册。
批量压缩过程中,网页可能会卡死,等待压缩完成即可。
https://compressjpg.io/zh-CN
Infinimouse
一个鼠标无限移动工具,可使鼠标突破屏幕边缘,并在另一边出现,达到无限循环的状态,支持单显示器,也支持多显示器,可按需禁用其它方向,完全免费,适用于 Windows 系统。
github.com/angel333/infinimouse
FreeMp3Cloud
MP3 音乐下载工具,可按歌曲和歌手进行搜索,并可直接播放,对国内音乐的支持不是特别好,部分音乐可能会搜索不到,免费使用,无需注册。
g2.freemp3cloud.com
如何向 8 岁小学生解释ChatGPT 的运行原理?【3B1B:LLM的本质是单词预测器】 | youtube
LLM的本质是一个复杂的数学函数,它只做一件事:针对给出的任何文本,预测下一个单词。
要构建一个聊天机器人,你需要先给出一些文本,描述用户与假想的AI助手之间互动。用户的输入是这次互动的开始,然后,你让模型反复预测AI助手会“说出”的下一个单词,这就是用户得到的输出结果。
但是,LLM 并非以确定方式预测下一个单词,而是为所有可能的下一个单词分别分配一个概率。这样的话,如果你允许LLM以更随机方式,选择可能性更低的下一个单词,输出结果会看起来更自然。
因此,这意味着,对于一个固定的提示词,LLM 每次给出的答案通常是不同的。
LLM的本质是一个复杂的数学函数,它只做一件事:针对给出的任何文本,预测下一个单词。
要构建一个聊天机器人,你需要先给出一些文本,描述用户与假想的AI助手之间互动。用户的输入是这次互动的开始,然后,你让模型反复预测AI助手会“说出”的下一个单词,这就是用户得到的输出结果。
但是,LLM 并非以确定方式预测下一个单词,而是为所有可能的下一个单词分别分配一个概率。这样的话,如果你允许LLM以更随机方式,选择可能性更低的下一个单词,输出结果会看起来更自然。
因此,这意味着,对于一个固定的提示词,LLM 每次给出的答案通常是不同的。
Maxun - Web:数据采集自动化平台 | #爬虫
爬虫 • 无代码 • 智能化 • 全自动化
无代码网络数据提取平台, 用户可以在 2 分钟内训练一个网络爬虫机器人, 无需编程知识就能实现自动化的网页数据抓取, 支持将网站转换为 API 或直接导出到电子表格。
✨主要特性:
- 无代码方式提取数据
- 支持处理分页和滚动
- 可以按特定时间表运行机器人
- 支持网站到 API 的转换
- 支持网站到电子表格的转换
- 允许用户连接外部代理以绕过反爬虫保护
- 即将推出: 自适应网站布局变化、支持需要登录和双因素认证的网站抓取
✨机器人动作类型:
- Capture List: 用于提取结构化数据和批量项目
- Capture Text: 用于提取单个文本内容
- Capture Screenshot: 可获取全页面或可见区域截图
爬虫 • 无代码 • 智能化 • 全自动化
无代码网络数据提取平台, 用户可以在 2 分钟内训练一个网络爬虫机器人, 无需编程知识就能实现自动化的网页数据抓取, 支持将网站转换为 API 或直接导出到电子表格。
✨主要特性:
- 无代码方式提取数据
- 支持处理分页和滚动
- 可以按特定时间表运行机器人
- 支持网站到 API 的转换
- 支持网站到电子表格的转换
- 允许用户连接外部代理以绕过反爬虫保护
- 即将推出: 自适应网站布局变化、支持需要登录和双因素认证的网站抓取
✨机器人动作类型:
- Capture List: 用于提取结构化数据和批量项目
- Capture Text: 用于提取单个文本内容
- Capture Screenshot: 可获取全页面或可见区域截图