Menu
快讀
  • 旅遊
  • 生活
    • 美食
    • 寵物
    • 養生
    • 親子
  • 娛樂
    • 動漫
  • 時尚
  • 社會
  • 探索
  • 故事
  • 科技
  • 軍事
  • 国际
快讀

知乎人均985?Python爬50W數據,BI做出可視化後,我有了答案

2021 年 3 月 11 日 这个夏天很欧洲

友情提醒:文末有….

一次完整的python數據分析流程是怎麽樣的?

使用python從網站抓取數據,並將這些數據保存到SQLite數據庫中,然後對數據進行清洗,最後對數據進行數據可視化分析。

可是熟悉的人應該知道,python爬取簡單,但是分析起來是很困難的,SQL語句、Pandas和Matplotlib這些十分繁瑣,一般人也不會。

于是我想到了用一種更簡單的方式進行數據分析,那就是python爬取+BI分析。什麽是BI就不用我多做介紹了吧,python強大的數據獲取能力,配合敏捷BI簡單快捷的數據可視化操作,分析效果那肯定是杠杠的!

那這次我們就來看看“人均985,年薪百萬”的知乎背後,到底有什麽秘密?話不多說,開爬!

一、我們想要哪些數據?

知乎用戶的學校和公司肯定是首當其沖的,我想看看到底這些人是編的還是真的哈哈哈。

知乎人均985?Python爬50W數據,BI做出可視化後,我有了答案

每頁有20個問題,所以你可以獲得到20個問題的鏈接,之後就是對每個問題的處理:

知乎人均985?Python爬50W數據,BI做出可視化後,我有了答案

三、用BI進行數據可視化分析知乎人均985?Python爬50W數據,BI做出可視化後,我有了答案

首先在官網下載FineBI,雖說是企業級的數據分析平台,但是它對于個人是永久免費的,文末給大家准備了下載鏈接~

然後直接通過FineBI提供的數據配置端的功能,添加SQL數據集(或者直接添加表也行),查看和驗證剛剛爬取並且入庫的數據是否已經真正成功入庫到MySQL中了。

知乎人均985?Python爬50W數據,BI做出可視化後,我有了答案

知乎人均985?Python爬50W數據,BI做出可視化後,我有了答案

1、哪個城市的知乎用戶最多?

知乎人均985?Python爬50W數據,BI做出可視化後,我有了答案

杭州處在第三名了,果然互聯網的發源之地之一不是吹的,阿裏網易起到了很大的作用,爲什麽這麽說?等你看到職業就明白了。

2、他們都是哪些學校的?

知乎人均985?Python爬50W數據,BI做出可視化後,我有了答案

不過也不奇怪,知乎主打的就是高知識份子的聚集地,而且學生比起上班族,有更多的時間玩手機。

既然分析到學校了,我們肯定要來看看各個高校上玩知乎的男女比例:

知乎人均985?Python爬50W數據,BI做出可視化後,我有了答案

別說了,知乎人均985實錘了,我流下了羨慕的淚水,我想請問同學,是怎麽做到玩和學習同時兼顧的?你如果教教我,我高考距離清華的錄取分數線可能就更近一點了….

3、知乎的職業比例

除去學生之後,我們發現知乎的人都是….

知乎人均985?Python爬50W數據,BI做出可視化後,我有了答案

可以看到,除了一些互聯網公司的常見職位外,教師和律師用戶在知乎中也占據不小的比重。

我們再用一張熱力圖來觀察知乎主流職業(前四名)在各個地區的分布情況,顔色越深,代表該職業在該地區的人數越多:

相關文章:

  • 5G還很遠?體驗完1999元的Redmi K30 5G版後,我有了答案
  • 新加坡國慶節折扣來啦!旅行景點折扣和餐飲代金券總有一款適合你!
  • 新加坡國慶節折扣來啦!旅行景點折扣和餐飲代金券總有一款適合你
  • 友情提醒:考試成績即將公布,你准備好查分了嗎
  • 全場低至2折+額外8折!還有夏日美妝盛宴,瘋狂吧女人們,本周從頭到腳都要被美羅承包了
  • [10月28日出發] 相約新加坡+民丹島 6天5晚品質遊
故事

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

©2026 快讀 | 服務協議 | DMCA | 聯繫我們