numpy和pandas笔记 发表于 2024-04-24 | 分类于 学习记录 | 阅读次数: numpy, pandas学习记录 1234#使用numpy读取csv或者txt文件#unpack按列读取,一般不用file = np.loadtxt(file_path, delimiter=',',dtype=float,skiprows=5,unpack=True)file.astype('float32') #转换类型 12345678910111213141516171819202122232425262728293031323334353637383940414243#series是一维,dataframe是二维 dataframe的某一列是series类型#创建series,通过ndarray,list, 字典等创建import pandas as pdimport stringt1 = pd.Series(np.arange(10),index=list(string.ascii_uppercase[:10]))t2 = pd.Series({'name':'xiaoming'})t3 = pd.Series([1,2,3,4,5])#读取series的第一二三行t1[[1,2,3]]t1[['b','c','d']]#查看index, 可以转化为列表t1.index #查看values, 就是将series转化为一维的ndarrayt1.values#datafram的属性df.shapedf.dtypes #列数据类型df.ndim #维度df.index #行索引df.columns #列索引df.values #转化为ndarraydf.head(3) #前三行df.tail(3)#读取csvdf=pd.read_csv('.csv')#读取dataframe的某一行 series类型df.iloc[1,:]#填充nandf.fillna(0)#dataframe某一列的中位数df["list_index"].median()#dataframe的某一列, series类型data['Title']data.Title#apply,默认axis=0,在列上运算df.apply(lambda x: (x - x.mean())/x.std()) #x是一个向量#one-hot编码df = pd.get_dummies(df, dummy_na=True)#concat函数c=pd.concat([a,b],axis=1) a,b是series或者dataframe类型 打赏