ベ断桥烟雨ミの学习笔记 ベ断桥烟雨ミの学习笔记
首页
机器学习
技术杂谈
  • Qlittle - 一个笔记Blog (opens new window)
  • 冰白寒祭的博客 (opens new window)
GitHub (opens new window)
首页
机器学习
技术杂谈
  • Qlittle - 一个笔记Blog (opens new window)
  • 冰白寒祭的博客 (opens new window)
GitHub (opens new window)
  • 蓝桥云课

    • 实验一
      • 列名、行名和行号的索引
      • DataFrame.apply + lambda 实现条件过滤
      • Groupby 分组
      • DataFrame 列求和
    • 挑战一
    • 实验二
    • 挑战二
    • 实验三
    • 挑战三
    • 实验四
    • 挑战四
    • 实验五
    • 挑战五
    • 实验六
    • 挑战六
    • 实验七
    • 挑战七
    • 实验八
    • 挑战八
    • 实验九
    • 挑战九
  • 机器学习
  • 蓝桥云课
Dragon1573
2021-09-28
目录

实验一

# 使用 Pandas 进行数据探索

# 列名、行名和行号的索引

在 pandas.DataFrame 中,表格切片 df[:n] 和 df[:-n] 可以分别使用 df.head(n) 和 df.tail(n) 替换。

# DataFrame.apply + lambda 实现条件过滤

示例中的过滤条件 df['State'].apply(lambda state: state[0] == 'W') 可以进一步简化为 df['State'].str[0] == 'W' ,使用 .str 方法将 pandas.Series 数据类型转换为字符串,用下标索引或数组切片方式获取所有元素的指定字符串片段。

# Groupby 分组

Pandas 对数据分组提供了『惰性求值』特性支持,在对分组结果调用统计学函数(例如 describe() 和 agg())之前并不会对 DataFrame 数据集实际执行分组操作。

# DataFrame 列求和

在『增减 DataFrame 的行列』一节中,我们通过加法运算符累计4列数据统计出所有用户的总通话次数。此处,我们可以借助 Pandas 内置的 .sum(axis=1) 方法对给定列进行求和。

total_calls = df[['Total day calls', 'Total eve calls',
                  'Total night calls', 'Total intl calls']].sum(axis=1)
上次更新: 2021/09/28, 20:57:56
挑战一

挑战一→

Theme by Vdoing | Copyright © 2021-2023 Dragon1573 | CC-BY-SA 4.0
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式