网站首页 > 技术文章 正文
我们在学习nodejs时,我觉得比较简单的应用还是从爬虫着手去学习。毕竟我们在做项目的时候,没有数据也不方便分析。
我这里应用了egg的框架,不了解egg的可以查看官方文档,这里就不介绍了。
我们先说下CURL请求:
curl 是常用的命令行工具,用来请求 Web 服务器。它的名字就是客户端(client)的 URL 工具的意思。
它的功能非常强大,命令行参数多达几十种。如果熟练的话,完全可以取代 Postman 这一类的图形界面工具。
默认情况下curl时不带任何参数,默认就是用get请求;
curl https://www.example.com
egg的get请求方式:
this.ctx.curl(url, option)
url:当然是请求地址了
option对应参数
如果请求的结果返回的是json数据,则需要指定数据类型
this.ctx.curl('https://www.example.com', {dataType: 'json'})
那么一个完整的get/post请求就是
this.ctx.curl('https://www.example.com', {
method: 'GET/POST',
dataType: 'json',
headers: {
token: 'xxx'
},
data: {
id: 1
}
...
})
值得注意一点就是,我们在请求到的数据是整个网络体,我们真正需要的数据也就是网页体在data中。
掌握curl请求之后就可以抓取数据了,至于抓取到的数据怎么分析,就看你自己了。
猜你喜欢
- 2024-11-06 JavaScript学习笔记(二十五)——HTTP
- 2024-11-06 原生js实现文件下载并设置请求头header
- 2024-11-06 干货-Http请求get、post工具类(get和post请求的区别是什么)
- 2024-11-06 聊聊在springcloud gateway如何获取请求体
- 2024-11-06 python接口自动化-发送get请求(python get请求 url传参)
- 2024-11-06 想测试HTTP响应不知道如何开展怎么办?
- 2024-11-06 接口测试遇到500报错?别慌,你的头部可能有点问题
- 2024-11-06 一文讲清HPP的请求方法和过程(hp partsufer)
- 2024-11-06 HTTP请求对象(获取用户请求信息)(如何查看http请求的头部信息)
- 2024-11-06 学习笔记-HTTP 请求方法详解(学习笔记-HTTP 请求方法详解pdf)
- 02-21走进git时代, 你该怎么玩?_gits
- 02-21GitHub是什么?它可不仅仅是云中的Git版本控制器
- 02-21Git常用操作总结_git基本用法
- 02-21为什么互联网巨头使用Git而放弃SVN?(含核心命令与原理)
- 02-21Git 高级用法,喜欢就拿去用_git基本用法
- 02-21Git常用命令和Git团队使用规范指南
- 02-21总结几个常用的Git命令的使用方法
- 02-21Git工作原理和常用指令_git原理详解
- 最近发表
- 标签列表
-
- cmd/c (57)
- c++中::是什么意思 (57)
- sqlset (59)
- ps可以打开pdf格式吗 (58)
- phprequire_once (61)
- localstorage.removeitem (74)
- routermode (59)
- vector线程安全吗 (70)
- & (66)
- java (73)
- org.redisson (64)
- log.warn (60)
- cannotinstantiatethetype (62)
- js数组插入 (83)
- resttemplateokhttp (59)
- gormwherein (64)
- linux删除一个文件夹 (65)
- mac安装java (72)
- reader.onload (61)
- outofmemoryerror是什么意思 (64)
- flask文件上传 (63)
- eacces (67)
- 查看mysql是否启动 (70)
- java是值传递还是引用传递 (58)
- 无效的列索引 (74)