公司網(wǎng)站免費(fèi)網(wǎng)站免費(fèi)wordpress增加登錄頁(yè)面
鶴壁市浩天電氣有限公司
2026/01/24 10:50:53
公司網(wǎng)站免費(fèi)網(wǎng)站免費(fèi),wordpress增加登錄頁(yè)面,知名網(wǎng)站定制報(bào)價(jià),趣頭條自媒體平臺(tái)1、serier系數(shù)#xff0c;可以看作是豎起來的listprint(s_1.index)當(dāng)加入index后,index等于多少#xff0c;那么它對(duì)應(yīng)的那一行數(shù)據(jù)的行名就是多少pandas庫(kù)和numpy庫(kù)的不同就是#xff0c;numpy只能處理數(shù)值類型的數(shù)據(jù)#xff0c;而pandas可以處理字符串等print(s_3.values…1、serier系數(shù)可以看作是豎起來的listprint(s_1.index)當(dāng)加入index后,index等于多少那么它對(duì)應(yīng)的那一行數(shù)據(jù)的行名就是多少pandas庫(kù)和numpy庫(kù)的不同就是numpy只能處理數(shù)值類型的數(shù)據(jù)而pandas可以處理字符串等print(s_3.values)2、操作seriesimport pandas as pd s_1 pd.Series([1,2,3,4,5], index[a, b, c, d, e]) s_2 pd.Series([lily, rose, jack]) #查 (1)通過標(biāo)簽訪問 #訪問某個(gè)元素 print(s_1[d]) #訪問多個(gè)元素[Series的切片] print(s_1[a:d]) #訪問多個(gè)元素 print(s_1[[a, d]]) (2)通過索引訪問 print(s_2[2]) print(s_2[0:2]) print(s_2[[0, 2]]) print(s_1[4]) #刪除 s_1 s_1.drop(a) #判斷一下某個(gè)值是否在Series里面 print(jim ! s_2.values) #改 s_2[0] Peter #創(chuàng)建Series dic_1 {name1: Peter, name2:tim, name3:rose} s_4 pd.Series(dic_1) print(s_4) #重置索引 s_4.index range(0, len(s_4)) print(1)3、pandas.DataFrame()就是excel表由多個(gè)series拼接而成1屬性2常見操作3簡(jiǎn)單操作df.columns修改列名df.index:修改行名df.loc:增加一行del:刪除某列直接在原數(shù)據(jù)上刪除df.drop(文件中的內(nèi)容, axis1, inplaceFalse):刪除某行或某列的內(nèi)容若axis0,則代表刪除行等于1則代表刪除列若inplaceFalse表示不知道在原數(shù)據(jù)上刪除而是返回一個(gè)刪除后的新表格否則則在原數(shù)據(jù)上刪除import pandas as pd df pd.DataFrame( {age:[10,11,12],name:[tim, tom, rose], income:[100,200,300]}, index[person1, person2, person3]) print(df) # 修改列名 a df.columns df.columns range(0, len(df.columns)) print(df.columns) # 修改行名 print(df.index) df.index range(0,len(df.index)) print(df.index) #在最后添加一列 df[pay] [20, 30, 40] print(df) # 增加一行 df.loc[person4, [age, name, income]] [20, kitty, 200] print(df) 訪問DataFrame #訪問某列 print(df.name) a df.name b df[name] #訪問某些列 print(df[[age, name]]) # #訪問行 print(df[0:2]) # #使用loc訪問 print(df.loc[[person1, person3]]) #訪問某個(gè)值 print(df.loc[person1, name]) #直接在原數(shù)據(jù)上刪除 del df[age] print(df) #刪除列 data df.drop(name, axis1, inplaceFalse) print(data) #刪除行 df.drop(person3, axis0, inplaceTrue)4、數(shù)據(jù)框查詢的2種方法 loc() iloc() import pandas as pd import numpy as np #生成指定日期 df pd.DataFrame( np.arange(30).reshape(5,6),index[20180101,20180102,20180103,20180104,20180105], columns[A,B,C,D,E,F]) loc()方法 df.loc[x, y] 【標(biāo)簽索引】 #打印某個(gè)值 print(df.loc[20180103, B]) #打印某列值 print(df.loc[:,B]) print(df.loc[20180103:,B]) print(df.loc[20180103:,[B, D]]) #打印某行值 print(df.loc[20180101, :]) #打印某些行 print(df.loc[20180103:,:]) iloc()方法 位置索引 #獲取某個(gè)數(shù)據(jù) print(df.iloc[1,2]) #獲取某列 print(df.iloc[:,2]) #獲取某幾列 print(df.iloc[:,[1,3]]) #獲取某行 print(df.iloc[1,:]) #獲取某些行 print(df.iloc[[1,2,4],:])5、數(shù)據(jù)導(dǎo)入與導(dǎo)出1pandas.read_2csv(文件名)功能讀取csv文件列名為文件中第一行的數(shù)據(jù)行名從0開始依次遞增若所要讀取的文件沒有列名則需要在括號(hào)中文件名的后面在加一個(gè)headerNone但不使用時(shí)默認(rèn)headerTrue代表文件中第一行的數(shù)據(jù)作為列名當(dāng)headerNone時(shí)列名輸出和行名一樣的數(shù)2pandas.read_excel(文件名)功能讀取excel文件3pandas.read_txt(文件名,sep,,headerNone)功能讀取txt文件sep,,代表指定文件中的分隔符為逗號(hào)4導(dǎo)出文件to_csv:導(dǎo)出csv文件導(dǎo)出.csv:導(dǎo)出文件的文件名indexTrue:導(dǎo)出時(shí) 包含DataFrame的索引即行標(biāo)簽?zāi)J(rèn)值為True若為False則不導(dǎo)出行標(biāo)簽導(dǎo)出excel文件也是類似的方法6、缺失值處理1)isnull()功能判斷讀取文件中空值的位置若是空值輸出True,否則輸出False2fillna()功能進(jìn)行缺失值的填充只能將所有的缺失值都填充為同一個(gè)數(shù)3dropna()功能刪除缺失值所在的整行數(shù)據(jù)7、重復(fù)值處理1duplicated()功能找到重復(fù)的位置若重復(fù)輸出True,否則輸出False2duplicated(參數(shù)1參數(shù)2,……)功能根據(jù)文件中的列名來判斷是否重復(fù)參數(shù)文件中所存在的列名3提取重復(fù)行的信息通過bool提取內(nèi)容提取輸入為True的整行數(shù)據(jù)4刪除重復(fù)的行8、數(shù)據(jù)抽取1df[列名]df:讀取文件后將文件存放到的地方列名所讀取文件中所存在的列名即第一行的信息想要選取一定范圍內(nèi)的可以在后面加上一定條件如df[好評(píng)數(shù)] 17000則選取df中好評(píng)數(shù)大于17000的信息注選取后輸出的結(jié)果是布爾值只有True和False若為True則是要選取的數(shù)據(jù)為False則不是df_1 df[df[好評(píng)數(shù)] 17000]若在df[ ]中選取數(shù)據(jù)則直接輸出符合條件的所有信息而不是輸出布爾值2str.contains(參數(shù),naFalse)df[第一行列名].str.contains(參數(shù))對(duì)第一列每一個(gè)元素進(jìn)行匹配若存在輸出True不存在輸出False若此處為確實(shí)值輸出NaNnaFalse若存在na且等于False輸出具體的內(nèi)容但不輸出缺失項(xiàng)的信息若等于True則連缺失行內(nèi)容一起輸出3)邏輯運(yùn)算和、|或9、數(shù)據(jù)框的合并concat()函數(shù)使用方式concat([df1,df2,df3...])import pandas as pd import numpy as np df_1 pd.DataFrame(np.arange(12).reshape(3,4)) df_2 2*df_1 #豎向合并 new_df1 pd.concat([df_2, df_1]) #橫向合并 new_df2 pd.concat([df_1, df_2], axis1) join參數(shù) inner:表示交集 outer:表示并集 df_3 pd.DataFrame(np.arange(12).reshape(3,4), index[A, B, 2]) new_df3 pd.concat([df_1, df_3], axis1, joininner) new_df4 pd.concat([df_1, df_3], axis1, joinouter)