Menu
快讀
  • 旅遊
  • 生活
    • 美食
    • 寵物
    • 養生
    • 親子
  • 娛樂
    • 動漫
  • 時尚
  • 社會
  • 探索
  • 故事
  • 科技
  • 軍事
  • 国际
快讀

Pandas讓Python變得更好

2021 年 3 月 11 日 铁血观世界

Pandas使用Python進行數據處理

Pandas讓Python變得更好

除了Smucker的Goober開玩笑之外,Pandas僅僅通過內置Python就能使Python成爲Data Science更可行的語言。 這並不是說Python沒有許多可以模仿這種效果的出色軟件包,因爲Python擁有數量衆多的用于機器學習和數據處理的軟件包。 Pandas使得相對困難的事情,或者在其他語言中更加痛苦的事情,在Python中變得異常容易。

IPython的

支持Pandas的最大事情是-Pandas本身。 該軟件包來自第一方,旨在合並數據科學的主要內容,例如IPython Notebooks和Numpy。 將它們組合在一起的方式很有道理,但我不只是告訴您,我還將向您展示使用其他語言的軟件包的感覺,這是我的最愛:

Julia

有趣的是,我們用來創建數據框架的軟件包是DataFrames.jl。 當然,我們現在將使用逗號分隔值文件(CSV文件)。 所以第一步就是讀取我們的數據……但是我們該怎麽做呢? 在更改日志中,簡要提到了一種稱爲read_table的方法,但是在大多數情況下,這似乎已被棄用。

Pandas讓Python變得更好

“省略了12列打印”

好吧,一切都很好,但是爲什麽呢? 出于某種奇怪的原因,他們選擇根據列的特定長度,在Iframe外部渲染數據幀,並省略列。 那麽我們如何顯示所有列? 顯示所有列非常容易,只需在show方法中添加bool類型參數即可,如下所示:

Pandas讓Python變得更好

相信我,R的數據框架也不如Pandas好,在大多數情況下,使用R和Julia的人傾向于PyCall Pandas,而不是使用各自語言的數據框架包。

脾氣暴躁的Pandas讓Python變得更好

重要的是要記住,由于這是一種編程語言,因此香草Python和線性代數實際上並沒有您想象的那樣好。 我認爲這僅僅是因爲Python比”線性代數”具有更高的水平,而且當然不應該期望它成爲許多公司現在深陷其中的統計語言。當然,我的df.dropna()示例是非常輕巧的,但可以保證在某些時候與Numpy的緊密集成將使您的生活比以前更加輕松!

Pandas本身

除了Pandas與其他Python軟件包的出色集成和方法論之外,Pandas還具有許多好處,它們所做的所有出色的開源工作都提供了這些好處。 每一次轉彎,分度,連接,融化,旋轉,甚至交叉制表都可以與Pandas一起完成。 這些任務確實可以使用其他程序包提供一整小時的工作,但是使用Pandas可以輕松,即時地完成任務。

借助replace()函數之類的簡單工具,可以更輕松地使用Pandas,該工具可用于替換NaN或只是奇怪的數據。 Pandas做了很多工作,做了一點工作,這就是它如此受歡迎和令人印象深刻的原因。 但是Pandas還有其他一些巨大的好處。

字符串訪問器

是的,傳說是正確的:

數據框是榮耀的字典。

但是,並非所有字典都是一樣的。 首先,在我所知道的語言中,熊貓的條件屏蔽是迄今爲止最好的。

Pandas讓Python變得更好

如您所見,典型的字符串命名方案在Julia中不起作用。 取而代之的是,Julia使用的符號是通過在變量名前加一個冒號而創建的。 因此,讓我們嘗試使用符號代替:

汽車

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

©2026 快讀 | 服務協議 | DMCA | 聯繫我們