当前位置:主页 > python教程 > python:pandas合并csv文件的方法(图书数据集成)

python:pandas合并csv文件的实例内容

发布:2020-02-04 10:27:49 51


给网友朋友们带来一篇python相关的编程文章,网友钱志勇根据主题投稿了本篇教程内容,涉及到python、pandas、csv、python:pandas合并csv文件的方法(图书数据集成)相关内容,已被363网友关注,下面的电子资料对本篇知识点有更加详尽的解释。

python:pandas合并csv文件的方法(图书数据集成)

数据集成:将不同表的数据通过主键进行连接起来,方便对数据进行整体的分析。

两张表:ReaderInformation.csv,ReaderRentRecode.csv

ReaderInformation.csv:

python:pandas合并csv文件的方法(图书数据集成)

ReaderRentRecode.csv:

python:pandas合并csv文件的方法(图书数据集成)

pandas读取csv文件,并进行csv文件合并处理:

# -*- coding:utf-8 -*-
import csv as csv
import numpy as np
# -------------
# csv读取表格数据
# -------------
'''
csv_file_object = csv.reader(codecs.open('ReaderRentRecode.csv', 'rb'))
header = csv_file_object.next()
print header
print type(header)
print header[1]
data = []
for row in csv_file_object:
  data.append(row)
data = np.array(data)
print data[0::, 0]
'''
# -------------
# pandas读取表格数据
# -------------
import pandas as pd
df = pd.read_csv('ReaderRentRecode.csv') # 读者借阅信息表
'''
print df.head()
print '----------------'
print df[['读者证号', '读者姓名', '书名', '中图法分类号']] # 选取其中的四列
print '------------------------------------------------------------------'
print
'''
dd = pd.read_csv('ReaderInformation.csv')
'''
print dd.head()
print '----------------'
print dd[['读者证号', '读者性别', '读者单位', '读者类别']]
print '------------------------------------------------------------------'
print
'''
data = pd.merge(df, dd, on=['读者证号', '读者姓名'], how='left') # pandas csv表左连接
data = data[['读者证号', '读者姓名', '读者性别', '书名', '中图法分类号', '读者单位', '读者类别']]
print data
print '------------------------------------------------------------------'
print
# -------------
# pandas写入表格数据
# -------------
data.to_csv(r'data.csv', encoding='gbk')

合并后的csv文件:data.csv

python:pandas合并csv文件的方法(图书数据集成)

通过使用pandas的函数merge来进行两个表的左连接,最后得到相应的data.csv文件。

以上这篇python:pandas合并csv文件的方法(图书数据集成)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持码农之家。


参考资料

相关文章

  • Pandas创建DataFrame提示:type object 'object' has no attribute 'dtype'解决方案

    发布:2023-04-17

    Pandas数据帧(DataFrame)是二维数据结构,它包含一组有序的列,每列可以是不同的数据类型,这篇文章主要给大家介绍了关于Pandas创建DataFrame提示:type object ‘object‘ has no attribute ‘dtype‘的解决方案,需要的朋友可以参考下


  • 理解Python利用reportlab生成PDF文档

    发布:2020-03-16

    今天小编就为大家分享一篇关于Python使用reportlab模块生成PDF格式的文档,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧


  • python数据用echarts显示出来

    发布:2019-06-27

    在本篇文章里小编给大家分享的是关于python数据用echarts显示出来的相关知识点内容,需要的朋友们学习下。


  • Python 查找字符在字符串中的位置示例效果

    发布:2020-01-28

    下面为大家分享一篇Python 查找字符在字符串中的位置实例,具有很好的参考价值,希望对大家有所帮助。一起过来看看吧


  • Python 字典(Dictionary)操作详解

    发布:2022-03-28

    这篇文章主要介绍了Python 字典(Dictionary)的详细操作方法,需要的朋友可以参考下


  • python怎么定义变量

    python怎么定义变量

    发布:2022-09-06

    给网友朋友们带来一篇关于python的教程,python中变量就是代表某个数据(值)的名称。定义变量,如x=5,x是一个变量,它的值是5。变量和值之间用=链接。在赋值时,值是什么数据类型,就决定了这个变量的类型,变量名引用了数值的同


  • Python守护线程用法实例

    发布:2022-06-23

    为网友们分享了关于Python的教程,这篇文章主要介绍了Python守护线程用法,结合具体实例形式分析了Python守护线程的功能、使用方法与相关操作技巧,需要的朋友可以参考下


  • python 实现“神经衰弱”翻牌游戏代码

    发布:2021-05-07

    这篇文章主要介绍了python 实现"神经衰弱"游戏,帮助大家更好的理解和使用python的pygame库,感兴趣的朋友可以了解下


网友讨论