# Numpy 库
# 0x00 前言
本文为 Cheatsheet 类型文章,用于记录我在日常编程中经常使用的 Numpy 相关语句。
对于数据分析应用而言,最应该关注:
- 用于数据整理和清理、子集构造和过滤、转换等快速的矢量化数组运算。
- 常用的数组算法,如排序、唯一化、集合运算等。
- 高效的描述统计和数据聚合 / 摘要运算。
- 用于异构数据集的合并 / 连接运算的数据对齐和关系型数据运算。
- 将条件逻辑表述为数组表达式(而不是带有 if-else-if 分支的循环)
- 数据的分组运算(聚合、转换、函数应用等)。
学习 Numpy 本质上是为了更好的使用 Pandas
# 0x01 ndarray
# 1.1 数据类型
# 1.2 创建 ndarray
# 1.3 数组和标量之间的运算
当我们把数组当做矢量的时候。
- 两个大小相同的矢量将运算到元素级
- 矢量和标量将作用与每一个元素
- 不同大小的矢量之间的运算叫做广播
# 1.4 索引和切片
# 1.4.1 一般索引和一般切片
对于一维数组的话,如果没有显式 copy 则会修改原来的值。
切片语法与 Python 相近
# 1.4.2 切片型索引
a[:2,1:]
a[2,1:]
# 1.4.3 布尔型索引
参考 pandas 语法
# 0xEE 参考链接
ChangeLog:
- 2017-06-03 初始化本文
- 2018-02-03 重修文字