最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

pandas的介绍与应用Pandas创建Series数据类型,where方法

互联网 admin 3浏览 0评论

pandas的介绍与应用Pandas创建Series数据类型,where方法

Pandas 是基于 NumPy 的一个开源 Python 库,它被广泛用于快速分析数据,以及数据清洗和准备等工作。它的名字来源是由“ Panel data”(面板数据,一个计量经济学名词)两个单词拼成的。简单地说,你可以把 Pandas 看作是 Python 版的 Excel。但是它还能很好地处理来自一大堆各种不同来源的数据,比如 Excel 表格、CSV 文件、SQL 数据库,甚至还能处理存储在网页上的数据。

简单使用方法:

import pandas as pd
import numpy as np
import  string# 查看pandas版本信息
print(pd.__version__)# ********************创建Series对象#  1). 通过列表创建Series对象
array = ["粉条", "粉丝", "粉带"]
# 如果不指定索引, 默认从0开始;
s1 = pd.Series(data=array)
print(s1)
# 如果不指定索引, 默认从0开始;
ss1 = pd.Series(data=array, index=['A', 'B', 'C'])
print(ss1)# 2). 通过numpy的对象Ndarray创建Series;
n = np.random.randn(5)   # 随机创建一个ndarray对象;
s2 = pd.Series(data=n)
print(s2)
# 修改元素的数据类型;
ss2 = s2.astype(np.int)
print(ss2)# 3). 通过字典创建Series对象;
dict = {string.ascii_lowercase[i]:i for i in range(10)}
s3 = pd.Series(dict)
print(s3)
array = ["粉条", "粉丝", "粉带"]
s1 = pd.Series(data=array)
print(s1)# 1). 修改Series索引
print(s1.index)
s1.index = ['A', 'B', 'C']
print(s1)# 2). Series纵向拼接;
array = ["粉条", "粉丝", "粉带"]
# 如果不指定索引, 默认从0开始;
s2 = pd.Series(data=array)
s3 = s1.append(s2)
print(s3)# 3). 删除指定索引对应的元素;
s3 = s3.drop('C')  # 删除索引为‘C’对应的值;
print(s3)# 4). 根据指定的索引查找元素
print(s3['B'])
s3['B'] = np.nan
print(s3)# 5). 切片操作  --- 同列表
print(s3[:2])
print(s3[::-1])
print(s3[-2:])  # 显示最后两个元素

基于Series运算

import pandas as pd
import numpy as np
import  strings1  = pd.Series(np.arange(5), index=list(string.ascii_lowercase[:5]))
s2  = pd.Series(np.arange(2, 8), index=list(string.ascii_lowercase[2:8]))print(s1)
print(s2)# *****************8按照对应的索引进行计算, 如果索引不同,则填充为Nan;# 加法
print(s1 + s2)
print(s1.add(s2))# -
print(s1 - s2)
print(s1.sub(s2))# *
print(s1 * s2)
print(s1.mul(s2))# /
print(s1 / s2)
print(s1.div(s2))# 求中位数
print(s1)
print(s1.median())# 求和
print(s1.sum())# max
print(s1.max())# min
print(s1.min())

where方法

import pandas as pd
import numpy as np
import string# &**********series中的where方法运行结果和numpy中完全不同;
s1 = pd.Series(np.arange(5), index=list(string.ascii_lowercase[:5]))
print(s1.where(s1 > 3)) #将对象中大于三的输出,不大于三的输出为NaN# 对象中不大于3的元素赋值为10;
print(s1.where(s1 > 3, 10))# 对象中大于3的元素赋值为10;
print(s1.mask(s1 > 3, 10))

pandas的介绍与应用Pandas创建Series数据类型,where方法

Pandas 是基于 NumPy 的一个开源 Python 库,它被广泛用于快速分析数据,以及数据清洗和准备等工作。它的名字来源是由“ Panel data”(面板数据,一个计量经济学名词)两个单词拼成的。简单地说,你可以把 Pandas 看作是 Python 版的 Excel。但是它还能很好地处理来自一大堆各种不同来源的数据,比如 Excel 表格、CSV 文件、SQL 数据库,甚至还能处理存储在网页上的数据。

简单使用方法:

import pandas as pd
import numpy as np
import  string# 查看pandas版本信息
print(pd.__version__)# ********************创建Series对象#  1). 通过列表创建Series对象
array = ["粉条", "粉丝", "粉带"]
# 如果不指定索引, 默认从0开始;
s1 = pd.Series(data=array)
print(s1)
# 如果不指定索引, 默认从0开始;
ss1 = pd.Series(data=array, index=['A', 'B', 'C'])
print(ss1)# 2). 通过numpy的对象Ndarray创建Series;
n = np.random.randn(5)   # 随机创建一个ndarray对象;
s2 = pd.Series(data=n)
print(s2)
# 修改元素的数据类型;
ss2 = s2.astype(np.int)
print(ss2)# 3). 通过字典创建Series对象;
dict = {string.ascii_lowercase[i]:i for i in range(10)}
s3 = pd.Series(dict)
print(s3)
array = ["粉条", "粉丝", "粉带"]
s1 = pd.Series(data=array)
print(s1)# 1). 修改Series索引
print(s1.index)
s1.index = ['A', 'B', 'C']
print(s1)# 2). Series纵向拼接;
array = ["粉条", "粉丝", "粉带"]
# 如果不指定索引, 默认从0开始;
s2 = pd.Series(data=array)
s3 = s1.append(s2)
print(s3)# 3). 删除指定索引对应的元素;
s3 = s3.drop('C')  # 删除索引为‘C’对应的值;
print(s3)# 4). 根据指定的索引查找元素
print(s3['B'])
s3['B'] = np.nan
print(s3)# 5). 切片操作  --- 同列表
print(s3[:2])
print(s3[::-1])
print(s3[-2:])  # 显示最后两个元素

基于Series运算

import pandas as pd
import numpy as np
import  strings1  = pd.Series(np.arange(5), index=list(string.ascii_lowercase[:5]))
s2  = pd.Series(np.arange(2, 8), index=list(string.ascii_lowercase[2:8]))print(s1)
print(s2)# *****************8按照对应的索引进行计算, 如果索引不同,则填充为Nan;# 加法
print(s1 + s2)
print(s1.add(s2))# -
print(s1 - s2)
print(s1.sub(s2))# *
print(s1 * s2)
print(s1.mul(s2))# /
print(s1 / s2)
print(s1.div(s2))# 求中位数
print(s1)
print(s1.median())# 求和
print(s1.sum())# max
print(s1.max())# min
print(s1.min())

where方法

import pandas as pd
import numpy as np
import string# &**********series中的where方法运行结果和numpy中完全不同;
s1 = pd.Series(np.arange(5), index=list(string.ascii_lowercase[:5]))
print(s1.where(s1 > 3)) #将对象中大于三的输出,不大于三的输出为NaN# 对象中不大于3的元素赋值为10;
print(s1.where(s1 > 3, 10))# 对象中大于3的元素赋值为10;
print(s1.mask(s1 > 3, 10))
发布评论

评论列表 (0)

  1. 暂无评论