作者 | 刘早起
来源 | 早起Python(ID:zaoqi-python)
头图 | CSDN 下载自东方ICSQL 和 Python 几乎是当前数据分析师必须要了解的两门语言,它们在处理数据时有什么区别?本文将分别用 MySQL 和 pandas 来展示七个在数据分析中常用的操作,希望可以帮助掌握其中一种语言的读者快速了解另一种方法!
在阅读本文前,你可以访问下方网站下载本文使用的示例数据,并导入 MySQL 与 pandas 中,一边敲代码一边阅读!
https://raw.githubusercontent.com/pandas-dev/pandas/master/pandas/tests/io/data/csv/tips.csv
选择
在 SQL 中,我们可以使用 SELECT 语句从表选择数据,结果被存储在一个结果表中,语法如下:
SELECT column_name,column_name
FROM table_name;
如果不想显示全部的记录,可以使用 TOP 或 LIMIT 来限制行数。因此选择 tips 表中的部分列可以使用下面的语句
SELECT total_bill, tip, smoker, time
FROM tips
LIMIT 5;
而在 pandas 中,我们可以通过将列名列表传递给 DataFrame 来完成列选择
在 SQL 中,进行选择的同时还可以进行计算,比如添加一列
SELECT *, tip/total_bill as tip_rate
FROM tips
LIMIT 5;
在 pandas 中使用 DataFrame.assign() 同样可以完成这个操作
查找
单条件查找在 SQL 中,WHERE 子句用于提取那些满足指定条件的记录,语法如下
SELECT column_name,column_name
FROM table_name
WHERE column_name operator value;
比如查找示例数据中 time = dinner 的记录
SELECT *
FROM tips
WHERE time = 'Dinner'
LIMIT 5;
而在 pandas 中,按照条件进行查找则可以有多种形式,比如可以将含有 True/False 的 Series 对象传递给 DataFrame,并返回所有带有 True 的行
在SQL中,进行多条件查找可以使用AND/OR来完成
SELECT *
FROM tips
WHERE time = 'Dinner' AND tip > 5.00;
在pandas中也有类似的操作
在pandas检查空值是使用 notna() 和 isna() 方法完成的。
frame[frame['col1'].notna()]
在SQL中可以使用 IS NULL 和 IS NOT NULL 完成
SELECT *
FROM frame
WHERE col2 IS NULL;
SELECT *
FROM frame
WHERE col1 IS NOT NULL;
更新
在 SQL 中使用 UPDATE
UPDATE tips
SET tip = tip*2
WHERE tip < 2;
而在 pandas 中则有多种方法,比如使用 loc 函数
tips.loc[tips['tip'] < 2, 'tip'] *= 2
删除
在 SQL 中使用 DELETE
DELETE FROM tips
WHERE tip > 9;
在pandas中,我们选择应保留的行,而不是删除它们
tips = tips.loc[tips['tip']
关注
打赏
最近更新
- 深拷贝和浅拷贝的区别(重点)
- 【Vue】走进Vue框架世界
- 【云服务器】项目部署—搭建网站—vue电商后台管理系统
- 【React介绍】 一文带你深入React
- 【React】React组件实例的三大属性之state,props,refs(你学废了吗)
- 【脚手架VueCLI】从零开始,创建一个VUE项目
- 【React】深入理解React组件生命周期----图文详解(含代码)
- 【React】DOM的Diffing算法是什么?以及DOM中key的作用----经典面试题
- 【React】1_使用React脚手架创建项目步骤--------详解(含项目结构说明)
- 【React】2_如何使用react脚手架写一个简单的页面?


微信扫码登录