Skip to content

Pandas 概述

什么是 Pandas?

Pandas 是一个开源的 Python 数据分析库,名称来源于 "Panel Data"(面板数据)。

核心数据结构

Pandas 主要提供两种数据结构:

Series(序列)

一维带标签数组,可以存储任意数据类型。

python
import pandas as pd

s = pd.Series([1, 3, 5, 7, 9])
print(s)

DataFrame(数据框)

二维带标签数据结构,是 Pandas 最常用的数据类型。

python
df = pd.DataFrame({
    'A': [1, 2, 3],
    'B': [4, 5, 6]
})
print(df)

Pandas 与 NumPy 的关系

  • Pandas 构建在 NumPy 之上
  • NumPy 提供底层数值计算支持
  • Pandas 提供更高级的数据处理功能

主要功能

  • 数据读取与写入
  • 数据清洗与预处理
  • 数据筛选与查询
  • 数据聚合与分组
  • 数据合并与连接
  • 时间序列分析
  • 数据可视化

应用场景

  • 金融数据分析
  • 科学计算
  • 商业智能
  • 机器学习数据准备
  • 时间序列分析

Pandas 是 Python 数据科学生态系统的核心组件,掌握 Pandas 是成为数据分析师的必经之路。