数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(3)
leetcode
文章目录
Mysql笔记
1.读取本的数据集
# 读取本地的数据集
# 数据集可以私信我我发给你们,同样也可以
df = pd.read_excel('data1.xlsx')
df
blender
2.查看数据的前5行
使用head()函数查看数据的前几行,可以传入具体的数,默认是5
Overleaf
# 查看数据的前5行
df.head()
开发语言
3.将salary列的数据转换为最大值和最小值的平均值
map和apply函数接受的参数都是一个行数,而且都不会直接改变原数据,都是返回一个新的DataFrame对象
DC/EP
# 将salary列数据转换为最大值和最小值的平均值
# 方式一 使用map函数
def fun(x):
a,b = x.split('-')
a = int(a.strip('k'))*1000
b = int(b.strip('k'))*1000
return int((a+b)/2)
df['salary'].map(fun)
# 方式二使用apply函数
df['salary'] = df['salary'].apply(fun)
df
4.将数据根据学历进行分组计算平均值
使用groupby()函数进行分组
unity 合批
# 将数据根据学历进行分组并计算平均值
df.groupby('education').mean()
iOS Unlocker
5.将createTime列转换为月日
# 将create Time列转换为月日
for i in range(len(df)):
df.iloc[i,0] = df.iloc[i,0].to_pydatetime().strftime('%m-%d')
df.head()
liunx
6.查看所索引,数据类型和内存信息
info()函数
搜狗
# 查看索引,数据类型,和内存信息
df.info()
android13
7.查看数值型列的汇总统计
describe() 返回的数据包括,数量,数据的平均值,标准差,最小值,最大值,25%、50% 75 % 的分位数
ConvNeXt
# 查看数值型列的汇总统计
df.describe()
小程序多选select
8.新增一列根据salary将数据分为三组
# 新增一列根据salary将数据分为三组,并且设置等级
bins = [0,5000,20000,50000]
group_names = ['底','中','高']
df['categories'] = pd.cut(df['salary'],bins,labels=group_names)
df
鏁版嵁鍒嗘瀽
9.按照salary列队数据降序排序
sort_values 默认是升序
异步
# 按照salary列对数据降序排列
# ascending=False降序
# ascending=True升序
df.sort_values('salary',ascending=False)
容器
10.取出第33行的数据
根据索引选出第33行,索引从0开始
开发模式
# 取出第33行的数据
df.loc[32]
mysql 索引优化
今天的10道题涉及的东西多了一些,
groupby
、describe
、cut
、sort_values
、info
等,如果想要全部的了解这些,仅靠这10道题是远远不够的,希望大家能够额外找些试题练习,也可以根据跟着博主的文章一块刷题✨✨✨haar
推荐使用牛客网进行练习 直达牛客,快人一步
flink
AMBA协议
欢迎您的关注
iOS 启动图适配
声明:本站博客内容版权均属于原作者所有,这里所提供资源均只能用于参考学习用,书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。