Spark & Shine

点亮自己,照亮周边

Skip to content
  • 首页
  • Contiki OS
  • The ONE
  • 数据分析
  • 关于我
  • 留言
  • 更多
    • Qiankun SU
    • 网络编码
    • Stack Overflow
    • 旧博客
    • 至理名茶
    • 酬谢
  • 中文
    • English English

反爬

爬虫与反爬:使用代理proxy

2020-08-30 Updated: 2021-02-08 4.5K

使用同一个IP地址频繁抓取数据,IP容易被封。可以使用代理解决这个问题。

Read more →

数据分析 proxy, 代理, 反爬, 爬虫 Leave a comment

爬虫与反爬:使用用户代理User-agent

2020-08-28 Updated: 2021-02-08 3.4K

网页抓取机器人容易被服务器识别并拒绝提供服务,通过网页请求指定用户代理User-agent为浏览器,将爬虫伪装成浏览器访问,从而提升爬取成功率。

Read more →

数据分析 fake-useragent, User Agent, 反爬, 爬虫, 用户代理 1 Comment

微信公众号

WeChat Public

标签云

爬虫 词以类记 网络编码 代数 The ONE ns3 Eclipse Java AWS wordpress awk 安装 会议 beamer 法国 Ubuntu Latex 消息 法语 罗马 代码高亮 数学 数据集 域名 整理 发音规则 application notes 使用笔记 NetworkX 基本语法 地缘看世界 Python 英语 matplotlib 迦太基 GTFS Markdown EC2 目录 MessageEventGenerator 布匿战争 仿真器 Map MySQL Packet Tracer

分类目录

近期评论

  • BUPTcxb发表在《The ONE使用笔记:目录》
  • jinbin tu发表在《Bubble Rap数据集Infocom05, Hong-Kong, Cambrige, Infocom06, Reality》
  • 数据分析:目录 – Spark & Shine发表在《代数方法求PageRank》
  • 数据分析:目录 – Spark & Shine发表在《用Python操作MySQL数据库》
  • 数据分析:目录 – Spark & Shine发表在《NetworkX使用笔记:基本操作》

最多浏览

  • 历史时间轴(中国、欧洲、世界) (240K)
  • 解决“The requested URL was not found on this server” (107.5K)
  • WordPress目录下产生一堆随机文件 (85.2K)
  • The ONE使用笔记:目录 (75.2K)
  • 《圆桌派》片尾曲 (69.2K)
  • 代数结构入门:群、环、域、向量空间 (61K)
Based on WordPress and Radiate | Total views: 2,459,056 | Total posts: 308