Menu
快讀
  • 旅遊
  • 生活
    • 美食
    • 寵物
    • 養生
    • 親子
  • 娛樂
    • 動漫
  • 時尚
  • 社會
  • 探索
  • 故事
  • 科技
  • 軍事
  • 国际
快讀

GitHub中文趨勢榜第一!「2020新冠肺炎記憶」項目已獲4.9K星標

2020 年 2 月 10 日 SegmentFault

GitHub中文趨勢榜第一!「2020新冠肺炎記憶」項目已獲4.9K星標

這兩天,又一個關于新冠肺炎的 GitHub 登上了中文趨勢榜的首位,截至目前,已經收獲近 5K Star,600+ Fork。

項目介紹

nCovMemory 項目的中文名稱是「2020新冠肺炎記憶:報道、非虛構與個人敘述」,創立該項目的目的是爲研究人士提供方便自然語言處理、疫情防治取用相關資料的資料庫。

資料庫中收錄了 2020 年新型冠狀病毒感染的肺炎相關媒體報道、非虛構作品和親曆者個人敘述。所有的內容均來源于網絡,一個完整的條目從可信的信源收錄內容,包括日期、標題、原始 URL、截圖、archive 等要素,並且暫時不收錄評論、分析、科普等類別的作品。

GitHub中文趨勢榜第一!「2020新冠肺炎記憶」項目已獲4.9K星標

項目的具體結構如下:

├─archive                          文章的存檔,目前提供jpg格式
│  └─jpg
│    ├─1.jpg
│    └─...
├─data                             csv格式的文章數據
│  └─data.csv
├─docs                             一個用于展示README的github page
├─gh-page
├─template                         README模板
│  └─README.handlebars
├─utils                            構建README的工具
│  ├─generateReadmeFromCsv.js
│  └─...
└─README.md                        主文檔

項目意義何在?

毫無疑問,這次的疫情已經成爲了一場全民戰爭。從最開始的武漢加油到現在的中國加油,我們不停的討論著疫情的發展。

我們會爲在疫情中失去生命的人員痛惜,爲醫護人員、抗疫一線人員的奉獻精神所感動;我們會自我隔離、隨時佩戴戴口罩,這些都是我們力所能及的小事兒,但我們每一個人都在爲抗疫勝利而努力。

但不管最終結果如何、疫情何時結束,這都是一段在我們心中無法忘卻的曆史,而我們能做的,就是通過記錄完整的事件曆程,通過大數據分析來得出一些相關結論,避免悲劇的再次發生。這也是大數據給我們帶來的價值之一。

我們前幾日推送的文章《數據模型分析告訴你,現在還不是出門的時候》中,作者用數據分析告訴來我們,控制人口流動對疫情防治的重要性。

而 GitHub 上的這個項目,憑我個人的理解,可以利用 AI 來分析網站、新聞報道和社交媒體中關于新型冠狀肺炎的報道,通過自然語言處理來解析社交媒體上發布的文本,根據新聞發生的先後順序,來分析真新聞、假新聞,分析事件之間直接或間接的聯系,從而得出一些結論和歸因。

我相信這些信息對于專業的認識和團隊一定有更多、更大的用途。

對于這次疫情控制工作,相關的信息已經變得越來越透明,我們期待看到更多的好消息和正面消息,但對于事件中那些可能做的不好的地方,我們記錄下來的初心也是爲了讓這個國家更好、讓人民更幸福。

「2020新冠肺炎記憶:報道、非虛構與個人敘述」GitHub 項目地址: https://github.com/2019ncovmemory/nCovMemory

更多人在行動

除了「nCovMemory」之外,其實還有很多項目值得我們關注和 Star。我司技術大大 @joyqi 就用公開數據記錄了疫情的發展趨勢,來便于自己和大家從中分析更多有價值的信息:

項目地址:https://github.com/joyqi/ncov2019

許多網友也在做報道、個體敘述、網上輿論的整理和記錄,如:

1.2020 Wuhan Individual Stories

https://github.com/jiayiliujiayi/2020nCov_individual_archives

備份普通人在疫情期間的記錄,主要來自豆瓣,未來可能有所擴增。

2.疫情之下的勞動者——中文媒體報道收集(持續更新)

https://note.youdao.com/ynoteshare1/index.html?id=eee7c8c3d7b8b054dc94d8abd1a211d8&type=note

整理了勞動者們在疫情中的所作所爲。按行業編排。

3.疫情與輿情:武漢新冠肺炎時間線TIMELINE

https://github.com/Pratitya/wuhan2020-timeline

記錄自2019年12月起武漢新冠肺炎疫情進展的時間線。以社會學年鑒模式編撰。

4.Academic2019-nCoV

https://github.com/Academic-nCoV/2019-nCoV

每日發布疫情相關的海外學術、非學術信息。


此次武漢疫情通報所帶來的恐懼,遠比通報本身的內容蔓延得更快。多個城市陸續通報新型冠狀病毒的病例數據,使大家對各種預防方法越來越關注。

但是,很多不正確的預防方法,也在這種時候混淆視聽,甚至使人忽視了正確的應對方法。

SegmentFault 思否 CEO @高陽Sunny:在全民事件面前,雖然我們 SegmentFault 是一個開發者社區,但是每天能覆蓋數百萬開發者的訪問,所以我們覺得有必要整理篩選一些有價值的內容,引起社區開發者的注意,認真且理性的對待和重視,做好防護,保護好自己和家人!在此 SegmentFault 編輯爲社區數百萬開發者整理出了關于新型肺炎的防護措施、方法以及最新動態,希望大家不信謠、不傳謠,相信科學,相信醫務人員的努力與奉獻,更爲關鍵的是自身養成良好的健康生活習慣,加強鍛煉、注意身心健康、做好疫情的防護。

GitHub中文趨勢榜第一!「2020新冠肺炎記憶」項目已獲4.9K星標

相關文章:

  • 你居然是這麼矛盾的新加坡!?
  • 讓你的Linux命令騷起來
  • 高空俯瞰無敵海景房?新加坡濱海灣十一大酒店全方面指南
  • 什麽,你只知道金沙的無邊泳池?這才是新加坡最贊的十間酒店泳池!
  • 辣媽吐血整理泰國旅遊攻略:泰國曼谷/清邁/拜縣親子遊(多圖)
  • Chinatown在新加坡有個怪名叫牛車水 — 盤點新加坡牛車水十大酒店
科技

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

©2025 快讀 | 服務協議 | DMCA | 聯繫我們