本文将数据分析相关的笔记整理成目录的形式,便于索引,包括数据获取、Python、数据分析。
1. 数据获取
1.1 爬虫
- 第一个爬虫程序:建立联系方式表格
- Python爬取成语:从3字到12字
- 爬虫与反爬:使用用户代理User-agent
- 爬虫与反爬:使用代理proxy
- 抓取由jQuery动态产生的网页数据:以东方财富中的沪港通历史数据为例
- 爬虫与反爬:使用Selenium+ChromeDriver抓取动态网页
1.2 数据
GTFS数据
金额数据:
2. Python
基础
- Python脚本学习笔记:基本语法、流程控制、自定义函数
- Python使用笔记:格式化字符串
- Python Application Notes: list
- Python Application Notes: set and frozenset
- Python Application Notes: dict
- Python Application Notes: mutable, hashable and iterable
- Python Application Notes: packages, modules and classes
- Python使用笔记:面向对象基本语法
文件处理
- Python Application Notes: pathname manipulations
- Read and write Excel files with Python
- Read and write Excel files with Python
- Python以unicode编码格式读入外部文件
时间处理
NetworkX
- NetworkX使用笔记:基本操作
- NetworkX Application Notes: Draw a graph with matplotlib
- Draw with Matplotlib: Basic Steps for Plotting a Figure
- Draw with Matplotlib: Colors, Markers and Line Styles
- Draw with Matplotlib: (Stacked) Bar Charts with error bar
- NetworkX使用笔记:读入外部文件并转换成各种格式
- NetworkX Application Notes: Draw trees with pygraphviz
- NetworkX Application Notes: A better way to visualize graphs
- python-igraph安装及用外部文件创建图
其他
- Build a Windows executable from Python scripts on Linux
- 用Python批量查询域名(并行化,附源代码)
- 批量查询5个字成语首字母组成的.com域名
- 用Python操作MySQL数据库
- 在新浪云安装Python应用
- 写Python脚本让带参数程序运行多次
- Install Pyhton module Fifi, a library for finite field arithmetics
3. 数据分析
- Calculate minimum dominating sets
- Calculate a minimum spanning tree with Python
- Calculate a maximal independent set with Python
- Simple regression analysis using Python
- 网页排序算法PageRank
- 代数方法求PageRank
微信赞赏
支付宝赞赏