久久久久久久视色,久久电影免费精品,中文亚洲欧美乱码在线观看,在线免费播放AV片

<center id="vfaef"><input id="vfaef"><table id="vfaef"></table></input></center>

    <p id="vfaef"><kbd id="vfaef"></kbd></p>

    
    
    <pre id="vfaef"><u id="vfaef"></u></pre>

      <thead id="vfaef"><input id="vfaef"></input></thead>

    1. 站長資訊網(wǎng)
      最全最豐富的資訊網(wǎng)站

      pandas技巧之 DataFrame中的排序與匯總方法

      pandas技巧之  DataFrame中的排序與匯總方法

      相關(guān)學(xué)習(xí)推薦:python教程

      今天是pandas數(shù)據(jù)處理專題的第六篇文章,我們來聊聊DataFrame的排序與匯總運算。

      在上一篇文章當(dāng)中我們主要介紹了DataFrame當(dāng)中的apply方法,如何在一個DataFrame對每一行或者是每一列進(jìn)行廣播運算,使得我們可以在很短的時間內(nèi)處理整份數(shù)據(jù)。今天我們來聊聊如何對一個DataFrame根據(jù)我們的需要進(jìn)行排序以及一些匯總運算的使用方法。

      排序

      排序是我們一個非?;镜男枨螅趐andas當(dāng)中將這個需求進(jìn)一步細(xì)分,細(xì)分成了根據(jù)索引排序以及根據(jù)值排序。我們先來看看Series當(dāng)中的排序方法。

      Series當(dāng)中的排序方法有兩個,一個是sort_index,顧名思義根據(jù)Series中的索引對這些值進(jìn)行排序。另一個是sort_values,根據(jù)Series中的值來排序。這兩個方法都會返回一個新的Series:

      pandas技巧之  DataFrame中的排序與匯總方法

      索引排序

      對于DataFrame來說也是一樣,同樣有根據(jù)值排序以及根據(jù)索引排序這兩個功能。但是由于DataFrame是一個二維的數(shù)據(jù),所以在使用上會有些不同。最簡單的差別是在于Series只有一列,我們明確的知道排序的對象,但是DataFrame不是,它當(dāng)中的索引就分為兩種,分別是行索引以及列索引。所以我們在排序的時候需要指定我們想要排序的軸,也就是axis。

      默認(rèn)的情況我們是根據(jù)行索引進(jìn)行排序,如果我們要指定根據(jù)列索引進(jìn)行排序,需要傳入?yún)?shù)axis=1。

      pandas技巧之  DataFrame中的排序與匯總方法

      我們還可以傳入ascending這個參數(shù),用來指定我們想要的排序順序是正序還是倒序。

      pandas技巧之  DataFrame中的排序與匯總方法

      值排序

      DataFrame的值排序有所不同,我們不能對行進(jìn)行排序,只能針對列。我們通過by參數(shù)傳入我們希望排序參照的列,可以是一列也可以是多列。

      pandas技巧之  DataFrame中的排序與匯總方法

      排名

      有的時候我們希望得到元素的排名,我們會希望知道當(dāng)前元素在整體當(dāng)中排第幾,pandas當(dāng)中也提供了這個功能,它就是rank方法。

      pandas技巧之  DataFrame中的排序與匯總方法

      我們可以發(fā)現(xiàn)我們隨手輸入的一串?dāng)?shù)字當(dāng)中,包含兩個7,7是Series當(dāng)中最大的數(shù)字,但是它們的排名為什么是6.5呢?

      其實很簡單,因為7出現(xiàn)了兩次,分別是第6位和第7位,這里對它所有出現(xiàn)的排名取了平均,所以是6.5。如果我們不希望它取平均,而是根據(jù)出現(xiàn)的先后順序給出排名的話,我們可以用method參數(shù)指定我們希望的效果。

      pandas技巧之  DataFrame中的排序與匯總方法

      method的合法參數(shù)并不止first這一種,還有一些其他稍微冷門一些的用法,我們一并列出。

      pandas技巧之  DataFrame中的排序與匯總方法

      如果是DataFrame的話,默認(rèn)是以行為單位,計算每一行中元素占整體的排名。我們也可以通過axis參數(shù)指定以列為單位計算:

      pandas技巧之  DataFrame中的排序與匯總方法

      匯總運算

      最后我們來介紹一下DataFrame當(dāng)中的匯總運算,匯總運算也就是聚合運算,比如我們最常見的sum方法,對一批數(shù)據(jù)進(jìn)行聚合求和。DataFrame當(dāng)中同樣有類似的方法,我們一個一個來看。

      首先是sum,我們可以使用sum來對DataFrame進(jìn)行求和,如果不傳任何參數(shù),默認(rèn)是對每一行進(jìn)行求和。

      pandas技巧之  DataFrame中的排序與匯總方法

      除了sum之外,另一個常用的就是mean,可以針對一行或者是一列求平均。

      pandas技巧之  DataFrame中的排序與匯總方法

      由于DataFrame當(dāng)中常常會有為NA的元素,所以我們可以通過skipna這個參數(shù)排除掉缺失值之后再計算平均值。

      另一個我個人覺得很好用的方法是descirbe,可以返回DataFrame當(dāng)中的整體信息。比如每一列的均值、樣本數(shù)量、標(biāo)準(zhǔn)差、最小值、最大值等等。是一個常用的統(tǒng)計方法,可以用來了解DataFrame當(dāng)中數(shù)據(jù)的分布情況。

      pandas技巧之  DataFrame中的排序與匯總方法

      除了介紹的這些方法之外,DataFrame當(dāng)中還有很多類似的匯總運算方法,比如idxmax,idxmin,var,std等等,大家感興趣可以去查閱相關(guān)文檔,但是根據(jù)我的經(jīng)驗一般用不到。

      想了解

      贊(0)
      分享到: 更多 (0)
      網(wǎng)站地圖   滬ICP備18035694號-2    滬公網(wǎng)安備31011702889846號