数据分析和建模方面的大量编程工作都是用在数据准备上的:载入.清理.转换以及重塑.有时候,存放在文件或数据库中的数据并不能满足你的数据处理应用的要求.很多人都选择使用通用编程语言(如Python.Perl.R或Java)或UNIX文本处理工具(如sed或awk)对数据格式进行专门处理.幸运的是,pandas和Python标准库提供了一组高级的.灵活的.高效的核心函数和算法,它们使你可以轻松地将数据规整化为正确的形式. 1.合并数据集 pandas对象中的数据能够通过一些内置的方式进行合并: pan