Pandas数据结构
2021-8-6
| 2023-8-6
0  |  阅读时长 0 分钟
type
status
date
slug
summary
tags
category
icon
password
Property

Pandas数据结构
  • Series是一种类似于一维数组的对象,由一组数据(各种Numpy数据类型)以及一组与之相关的数据标签(即索引)组成
  • DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)
 

Series

Pandas Series 类似表格中的一个列(column),可以保存任何数据类型,由索引(index)和列组成:
参数说明:
  • data:一组数据(ndarray 类型)
  • index:数据索引标签,如果不指定,默认从 0 开始
  • dtype:数据类型
  • name:设置名称
  • copy:拷贝数据,默认为 False
 

Series创建

 
 

Series的基本用法

 
 
 
 

DataFrame

DataFrame是一个表格型的数据结构,含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,可以被看做由 Series 组成的字典(共同用一个索引)。
notion image
notion image
 
notion image
 
DataFrame构造方法如下:
参数说明:
  • data:一组数据(ndarray、series, map, lists, dict 等类型)
  • index:索引值,或者可以称为行标签
  • columns:列标签,默认为 RangeIndex (0, 1, 2, …, n)
  • dtype:数据类型
  • copy:拷贝数据,默认为 False
 

DateFrame构建

字典类

数组、列表或元组构成的字典构造dataframe
 
Series构成的字典构造dataframe
 
字典构成的字典构造dataframe
 

列表类

  • 2D ndarray 构造dataframe
  • 字典构成的列表构造dataframe
  • Series构成的列表构造dataframe
 

DataFrame的基本用法

  • T转置
  • 通过列索引获取列数据(Series类型)
  • 增加列数据
  • 删除列
 
  • Pandas
  • Pandas索引操作
    目录