Spark & Shine

点亮自己,照亮周边

Skip to content
  • 首页
  • Contiki OS
  • The ONE
  • 数据分析
  • 关于我
  • 留言
  • 更多
    • Qiankun SU
    • 网络编码
    • Stack Overflow
    • 旧博客
    • 至理名茶
    • 酬谢
  • 中文
    • English English

反爬

爬虫与反爬:使用代理proxy

2020-08-30 Updated: 2021-02-08 5.4K

使用同一个IP地址频繁抓取数据,IP容易被封。可以使用代理解决这个问题。

Read more →

数据分析 proxy, 代理, 反爬, 爬虫 Leave a comment

爬虫与反爬:使用用户代理User-agent

2020-08-28 Updated: 2021-02-08 4.3K

网页抓取机器人容易被服务器识别并拒绝提供服务,通过网页请求指定用户代理User-agent为浏览器,将爬虫伪装成浏览器访问,从而提升爬取成功率。

Read more →

数据分析 fake-useragent, User Agent, 反爬, 爬虫, 用户代理 1 Comment

微信公众号

WeChat Public

标签云

GTFS Ubuntu 域名 NetworkX Map 罗马 EC2 ns3 消息 布匿战争 使用笔记 wordpress 流程控制 词以类记 地缘看世界 The ONE Markdown awk 仿真器 基本语法 Eclipse application notes Python 法国 iteration 数据集 网络编码 beamer MessageEventGenerator Packet Tracer Java 爬虫 Latex AWS 迦太基 整理 英语 matplotlib 法语 安装 代码高亮 目录 MySQL 发音规则 代数

分类目录

近期评论

  • BUPTcxb发表在《The ONE使用笔记:目录》
  • jinbin tu发表在《Bubble Rap数据集Infocom05, Hong-Kong, Cambrige, Infocom06, Reality》
  • 数据分析:目录 – Spark & Shine发表在《代数方法求PageRank》
  • 数据分析:目录 – Spark & Shine发表在《用Python操作MySQL数据库》
  • 数据分析:目录 – Spark & Shine发表在《NetworkX使用笔记:基本操作》

最多浏览

  • 历史时间轴(中国、欧洲、世界) (259.1K)
  • 解决“The requested URL was not found on this server” (118.1K)
  • WordPress目录下产生一堆随机文件 (95.4K)
  • The ONE使用笔记:目录 (85.2K)
  • 《圆桌派》片尾曲 (76.2K)
  • 代数结构入门:群、环、域、向量空间 (70.9K)
Based on WordPress and Radiate | Total views: 2,948,096 | Total posts: 308