# Numpy 库

# 0x00 前言

本文为 Cheatsheet 类型文章,用于记录我在日常编程中经常使用的 Numpy 相关语句。

对于数据分析应用而言,最应该关注:

  • 用于数据整理和清理、子集构造和过滤、转换等快速的矢量化数组运算。
  • 常用的数组算法,如排序、唯一化、集合运算等。
  • 高效的描述统计和数据聚合 / 摘要运算。
  • 用于异构数据集的合并 / 连接运算的数据对齐和关系型数据运算。
  • 将条件逻辑表述为数组表达式(而不是带有 if-else-if 分支的循环)
  • 数据的分组运算(聚合、转换、函数应用等)。

学习 Numpy 本质上是为了更好的使用 Pandas

# 0x01 ndarray

# 1.1 数据类型

# 1.2 创建 ndarray

# 1.3 数组和标量之间的运算

当我们把数组当做矢量的时候。

  1. 两个大小相同的矢量将运算到元素级
  2. 矢量和标量将作用与每一个元素
  3. 不同大小的矢量之间的运算叫做广播

# 1.4 索引和切片

# 1.4.1 一般索引和一般切片

对于一维数组的话,如果没有显式 copy 则会修改原来的值。

切片语法与 Python 相近

# 1.4.2 切片型索引

a[:2,1:]
a[2,1:]

# 1.4.3 布尔型索引

参考 pandas 语法

# 0xEE 参考链接


ChangeLog:

  • 2017-06-03 初始化本文
  • 2018-02-03 重修文字