Python3簡單分析高考數(shù)據(jù)

2018-10-09 15:12 更新
本文轉(zhuǎn)載至知乎ID:Charles(白露未晞)知乎個人專欄
下載W3Cschool手機(jī)App,0基礎(chǔ)隨時隨地學(xué)編程>>戳此了解

導(dǎo)語

不像考卷,現(xiàn)實(shí)生活中,有些事永遠(yuǎn)沒有答案。

簡單且隨意地分析一下高考的一些數(shù)據(jù)~~~

讓我們愉快地開始吧~~~

相關(guān)文件

相關(guān)文件

網(wǎng)盤下載鏈接: https://pan.baidu.com/s/1zvVTTxfjmrTxjjX_M_DoEA 

密碼: 9jyd

相關(guān)文件中包含本文所涉及到的所有源代碼和數(shù)據(jù)。

數(shù)據(jù)源于網(wǎng)絡(luò),不保證其完全可靠。

開發(fā)工具

Python版本:3.6.4

相關(guān)模塊:pyecharts模塊;以及一些Python自帶的模塊。

環(huán)境搭建

安裝Python并添加到環(huán)境變量,pip安裝需要的相關(guān)模塊即可。

pyecharts模塊的安裝可參考:

安裝Python并添加到環(huán)境變量,pip安裝需要的相關(guān)模塊即可。

額外說明:

pyecharts模塊安裝時請依次執(zhí)行以下命令:

pip install echarts-countries-pypkg

pip install echarts-china-provinces-pypkg

pip install echarts-china-cities-pypkg

pip install pyecharts

若安裝過程中出現(xiàn):

'utf-8' codec can't decode byte 0xb6

或者類似的編碼錯誤提示。

可嘗試修改Python安裝文件夾下如下圖所示路徑下的__init__.py文件的第75行代碼:

修改為下圖所示內(nèi)容:

“一本正經(jīng)的分析”

開始分析

首先讓我們來看看從恢復(fù)高考(1977年)開始高考報(bào)名、最終錄取的總?cè)藬?shù)走勢吧:

T_T看來學(xué)生黨確實(shí)是越來越多了。

不過這樣似乎并不能很直觀地看出每年的錄取比例?Ok,讓我們直觀地看看吧:

看來上大學(xué)越來越“容易”之說不是空穴來風(fēng)的,總錄取比例高的可怕~~~

那么各省的情況呢?

由于各省高考最終錄取人數(shù)的統(tǒng)計(jì)標(biāo)準(zhǔn)不一樣,有些是只統(tǒng)計(jì)本科,有些是都統(tǒng)計(jì)的,為了避免統(tǒng)計(jì)標(biāo)準(zhǔn)不一而帶來的不公平對比,我們只分析各省的高考報(bào)考人數(shù)。

從2010年開始到今年(2018年)各省份高考考生數(shù)量的分布圖如下:

T_T河南的高考考生人數(shù)真是一枝獨(dú)秀。

那么各省的大學(xué)數(shù)量又是如何分布的呢?以公辦本科大學(xué)數(shù)量作為統(tǒng)計(jì)標(biāo)準(zhǔn),其分布圖大概是這樣的:

Emmm。北京和江蘇分別位居第一和第二名。想想也是必然T_T

那么985&211高校的分布又如何呢?

“那就這樣吧,再愛都曲終人散了?!笨吹竭@個默默不說話了。

以省份為x軸,年份為y軸,該年該省報(bào)考的考生人數(shù)為z軸來更直觀地看看各省每年的高考考生數(shù)量變化情況吧:

上圖中省份的順序是這樣的:

北京、四川、陜西、江西、吉林、寧夏、廣西、內(nèi)蒙古、甘肅、西藏、福建、上海、廣東、山東、浙江、河南、安徽、江蘇、河北、黑龍江、湖南、湖北、山西、云南、貴州、海南、遼寧、重慶、天津、青海、新疆,臺灣因?yàn)闆]有數(shù)據(jù),所以沒有加入。

T_T河南的高考考生數(shù)量真的恐怖。

Emmm,因?yàn)榭捎玫臄?shù)據(jù)不多,再分析下去大概就是花式的做圖游戲了,想想還是算了吧。至于個人觀點(diǎn),還是不發(fā)表為好。畢竟,大家的“哈姆雷特”都不一樣。

更多

相關(guān)文件中包含了本文所涉及到的所有源代碼、數(shù)據(jù)和結(jié)果,其中,數(shù)據(jù)來源網(wǎng)絡(luò),本人不保證其可靠性。

運(yùn)行源代碼前需將對應(yīng)的注釋去除。

以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號