Appearance
Pandas 概述
什么是 Pandas?
Pandas 是一个开源的 Python 数据分析库,名称来源于 "Panel Data"(面板数据)。
核心数据结构
Pandas 主要提供两种数据结构:
Series(序列)
一维带标签数组,可以存储任意数据类型。
python
import pandas as pd
s = pd.Series([1, 3, 5, 7, 9])
print(s)DataFrame(数据框)
二维带标签数据结构,是 Pandas 最常用的数据类型。
python
df = pd.DataFrame({
'A': [1, 2, 3],
'B': [4, 5, 6]
})
print(df)Pandas 与 NumPy 的关系
- Pandas 构建在 NumPy 之上
- NumPy 提供底层数值计算支持
- Pandas 提供更高级的数据处理功能
主要功能
- 数据读取与写入
- 数据清洗与预处理
- 数据筛选与查询
- 数据聚合与分组
- 数据合并与连接
- 时间序列分析
- 数据可视化
应用场景
- 金融数据分析
- 科学计算
- 商业智能
- 机器学习数据准备
- 时间序列分析
Pandas 是 Python 数据科学生态系统的核心组件,掌握 Pandas 是成为数据分析师的必经之路。