Skip to content

数据结构之序列

Series 是 Pandas 中的一维带标签数组。

创建序列

从列表创建

python
import pandas as pd

s = pd.Series([1, 2, 3, 4, 5])
print(s)

自定义索引

python
s = pd.Series([1, 2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e'])
print(s)

从字典创建

python
s = pd.Series({'a': 1, 'b': 2, 'c': 3})
print(s)

序列属性

python
s = pd.Series([1, 2, 3, 4, 5])

print(s.values)  # 获取值数组
print(s.index)   # 获取索引
print(s.dtype)   # 获取数据类型
print(s.shape)   # 获取形状

访问数据

python
s = pd.Series([10, 20, 30, 40], index=['a', 'b', 'c', 'd'])

# 通过位置访问
print(s[0])      # 10

# 通过标签访问
print(s['a'])    # 10

# 切片访问
print(s[0:2])    # 位置切片
print(s['a':'c']) # 标签切片

序列运算

python
s1 = pd.Series([1, 2, 3])
s2 = pd.Series([4, 5, 6])

print(s1 + s2)   # 加法
print(s1 * 2)    # 标量乘法
print(s1 > 2)    # 条件判断

常用方法

python
s = pd.Series([1, 2, 3, 4, 5])

print(s.head(3))     # 前3个元素
print(s.tail(3))     # 后3个元素
print(s.mean())      # 平均值
print(s.sum())       # 求和
print(s.max())       # 最大值
print(s.min())       # 最小值

Series 是 DataFrame 的构建基础,理解 Series 对后续学习非常重要。