Numpy Cheatsheet

0x00 前言

本文为 Cheatsheet 类型文章,用于记录我在日常编程中经常使用的 Numpy 相关语句。

主要包含:

Numpy 库

0x00 前言

本文为 Cheatsheet 类型文章,用于记录我在日常编程中经常使用的 Numpy 相关语句。

对于数据分析应用而言,最应该关注:

  • 用于数据整理和清理、子集构造和过滤、转换等快速的矢量化数组运算。
  • 常用的数组算法,如排序、唯一化、集合运算等。
  • 高效的描述统计和数据聚合 / 摘要运算。
  • 用于异构数据集的合并 / 连接运算的数据对齐和关系型数据运算。
  • 将条件逻辑表述为数组表达式(而不是带有 if-else-if 分支的循环)
  • 数据的分组运算(聚合、转换、函数应用等)。

学习 Numpy 本质上是为了更好的使用 Pandas

0x01 ndarray

1.1 数据类型

1.2 创建 ndarray

1.3 数组和标量之间的运算

当我们把数组当做矢量的时候。

  1. 两个大小相同的矢量将运算到元素级
  2. 矢量和标量将作用与每一个元素
  3. 不同大小的矢量之间的运算叫做广播

1.4 索引和切片

1.4.1 一般索引和一般切片

对于一维数组的话,如果没有显式 copy 则会修改原来的值。

切片语法与 Python 相近

1.4.2 切片型索引

1
2
a[:2,1:]
a[2,1:]

1.4.3 布尔型索引

参考 pandas 语法

0xEE 参考链接


ChangeLog:

  • 2017-06-03 初始化本文
  • 2018-02-03 重修文字