DataFrame是一个二维数据,包括行和列,类似于Excel的sheet;Series是一个一维数据,类似于DataFrame的一列。
DataFrame的构造
pandas.DataFrame(data, index, columns, dtype, copy)
data:数据(array-like 类型:可以是ndarray、series, map, lists, dict 等类型)。
index:行索引,如果不指定行索引—默认给一个0、1、2、3、… 这样的序号行索引。需与data行数一致。
columns:列索引 ,如果不指定列索引—默认给一个0、1、2、3、… 这样的序号列索引。需与data列数一致。
dtype:数据类型。
copy:拷贝数据,默认为 False。
以上参考【数据分析】认识Pandas:DataFrame和Series结构、属性
第一种——使用zip()
函数:
pandas.DataFrame(data=zip(list_1, list_2), columns=['name', 'gender'])
第二种——利用字典:
pandas.DataFrame{'name': list_1, 'gender': list_2}
第三种——利用列表:
pandas.DataFrame(data=[list_1, list_2], columns=['name', 'gender'])
第四种——利用ndarray:
data = np.array([list_1, list_2])
pandas.DataFrame(data=data, columns='name', 'gender')
以上list_1和list_2均为列表。
备注:在知乎中看到一个更为全面的总结:创建DataFrame:10种方式任你选
Series的构造
pandas.Series( data, index, dtype, name, copy)
各参数与DataFrame类似,其中name为数据列的表头。
构造方式也与DataFrame类似。