【Python】数据分析.pandas.序列（Series）- 技术文档

【Python】数据分析.pandas.序列（Series）

网友投稿 971 2022-11-08 14:15:13

【Python】数据分析.pandas.序列（Series）

文章目录

数据分析.pandas.数据结构介绍

pandas介绍序列（Series）

一、序列的创建二、序列重新指定索引三、序列的切片、索引操作四、序列的拆解（键、值）五、序列的算数运算

数据分析.pandas.数据结构介绍

pandas介绍

pandas是建立在numpy基础上的高级数据分析处理库，也是Python的重要数据分析处理库。pandas提供了众多的高级函数，极大地简化了数据分析处理的流程。主要包括：

带有标签的数据结构，主要包括序列（series）和数据框（dataframe）等允许简单索引和多级索引整合了对数据集的集合和转换功能生成特定类型的数据支持从Excel、CSV等文本格式中导入数据，以pytables/HDF5格式高效地读写数据能够高效的处理带有默认值的数据集能够进行常规的统计回归分析

序列（Series）

序列是可以容纳证书、浮点数、字符串等数据类型的一位带标签的数组（标签也被称为是索引）。

一、序列的创建

import stringimport pandas as pd#创建序列t1 = pd.Series([15,46,19,24,33])print(t1)#索引数据# 0 15# 1 46# 2 19# 3 24# 4 33# dtype: int64# t = pd.Series([15,46,19,24,33],index=["a","b","c","d","e"])t2 = pd.Series([15,46,19,24,33],index=list("abcde"))print(t2)# a 15# b 46# c 19# d 24# e 33# dtype: int64#以字典形式创建（键-值）temp_dict = {"name":"小明","age":20,"tel":10086}t3 = pd.Series(temp_dict)print(t3)# name 小明# age 20# tel 10086# dtype: objectt4 = {string.ascii_uppercase[i]:i for i in range(5)}print(t4)# {'A': 0, 'B': 1, 'C': 2, 'D': 3, 'E': 4}print(pd.Series(t4))# A 0# B 1# C 2# D 3# E 4# dtype: int64

返回顶部

二、序列重新指定索引

t4 = {string.ascii_uppercase[i]:i for i in range(5)}print(t4)# {'A': 0, 'B': 1, 'C': 2, 'D': 3, 'E': 4}print(pd.Series(t4))# A 0# B 1# C 2# D 3# E 4# dtype: int64#当重新指定索引时，新的索引不能与旧索引对应的数据为nant5 = pd.Series(t4,index=list(string.ascii_uppercase[3:8]))print(t5)# D 3.0# E 4.0# F NaN# G NaN# H NaN# dtype: float64

当重新指定索引时，新的索引不能与旧索引对应的数据为nan。t5 = pd.Series(t4,index=list(string.ascii_uppercase[3:8]))t5是在t4的基础上重新指定索引，[3:8]指按照字典创建方式索引从第4个开始第7个结束，所以就是从D到H，但是原来索引只到E，对于新的索引没有值与之对应，就为nan。

返回顶部

三、序列的切片、索引操作

#创建序列t1 = pd.Series([15,46,19,24,33])print(t1)#索引数据# 0 15# 1 46# 2 19# 3 24# 4 33# dtype: int64t3 = pd.Series(temp_dict)print(t3)# name 小明# age 20# tel 10086# dtype: objectprint(pd.Series(t4))# A 0# B 1# C 2# D 3# E 4# dtype: int64print(t5)# D 3.0# E 4.0# F NaN# G NaN# H NaN# dtype: float64#切片、索引操作print(t4["A"])# 0print(t3[["name","age"]])# name 小明# age 20# dtype: objectprint(t3[1])# 20print(t5[["D","E","F"]])# D 3.0# E 4.0# F NaN# dtype: float64print(t1[t1>20])# 1 46# 3 24# 4 33# dtype: int64

返回顶部

四、序列的拆解（键、值）

Series本质上是由两个数组构成的，一个数组是构成对象的键（index，索引），一个数组是构成对象的值（values），键与值配对出现。

#创建序列t1 = pd.Series([15,46,19,24,33])print(t1)#索引数据# 0 15# 1 46# 2 19# 3 24# 4 33# dtype: int64#取出序列的索引和值print(t1.index)# RangeIndex(start=0, stop=5, step=1)print(t1.values)# [15 46 19 24 33]

返回顶部

五、序列的算数运算

数列和数组的一个重要不同点是：不同的序列进行运算时，相同位置会自动对齐，并进行运算。当两个序列进行运算时，如果不是公共的索引，则在运算结果中自动标记为nan。

#序列的运算s = pd.Series(np.arange(5),index=['a','b','c','d','e'])print(s)# a 0# # b 1# # c 2# # d 3# # e 4# # dtype: int32S = s[1:]+s[3:]print(S)# b NaN# c NaN# d 6.0# e 8.0# dtype: float64

s[1:] ---> b到es[3:] ---> d到e

由上面的案例可以看出，序列的运算是在交集间进行的，且是具有相同索引的值进行运算。

返回顶部

小程序数据埋点分析如何助力提升用户体验与运营效率？

971 2022-11-08

【Python】数据分析.pandas.序列（Series）

触点数字孪生，揭秘它的独特魅力

App 2.0开发模式的行业看法

小程序数据埋点分析如何助力提升用户体验与运营效率？

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序快速入门

资源下载使用

实时内容互动引擎

跨终端设备适配

小程序生成App

小程序生命周期管理

AI 开发小程序

推荐文章

前端跨端方案的未来，技术与市场的双重挑战

超级应用的崛起，重塑数字生活的未来

企业app开发流程是什么？

app运营模式有哪些？

探讨如何通过融媒体宣发矩阵建设，提升用户体验与品牌曝光率

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

超级App 解决方案

智慧车载解决方案

信创解决方案

物联网解决方案

小游戏解决方案

音视频解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计