您的位置:新文秘網(wǎng)>>干部/組織講話/黨會報告/學習體會/學習材料/政府/政府報告/>>正文

干部學習講稿:基于大數(shù)據(jù)的政府決策支持(上)

發(fā)表時間:2017/1/8 8:19:50
目錄/提綱:……
一、背景:新趨勢,新路徑
(一)大數(shù)據(jù)的概念
(二)大數(shù)據(jù)的特征
(三)非結(jié)構(gòu)化數(shù)據(jù)與政府治理決策
(四)國家對大數(shù)據(jù)的支持
二、布局:國內(nèi)外,兩平臺
(一)提前布局,創(chuàng)新機制
(二)國內(nèi)布局——國家發(fā)改委互聯(lián)網(wǎng)大數(shù)據(jù)分析中心
(三)全球布局——國家信息中心“一帶一路”大數(shù)據(jù)中心
……
干部學習講稿:基于大數(shù)據(jù)的政府決策支持(上)
楊道玲
國家信息中心信息化研究部電子政務研究室副處長

課程前言
各位學員大家上午好!非常高興有機會和大家做一個交流,今天交流的題目叫“基于大數(shù)據(jù)的政府決策支持”。關(guān)于大數(shù)據(jù),可能各地的同志們、領(lǐng)導們已經(jīng)有了比較充分的了解。今天不講大數(shù)據(jù)學術(shù)概念,也不講大數(shù)據(jù)理論,想結(jié)合近一兩年來,國家發(fā)改委圍繞大數(shù)據(jù)方面做的一些工作實踐,總結(jié)一些大數(shù)據(jù)對政府決策支持的套路和方法。
今天講的內(nèi)容包括四個方面:
第一,先簡要的介紹一下當前大數(shù)據(jù)面臨新趨勢、新形勢是什么。政府的決策到底需要什么樣的數(shù)據(jù)決策支持?
第二,目前大數(shù)據(jù)在對國家發(fā)改委,對政府決策支持方面都有什么樣的措施和做法?這些做法哪些可以應用到地方各級政府決策支持中去?
第三,通過五到六個具體的案例給大家介紹一下,大數(shù)據(jù)在支撐政府的決策支持和支撐政府的治理創(chuàng)新方面,一些新的方法、新的理念和新的模式。
第四,對大數(shù)據(jù)大應用簡要的展望和小結(jié)。大概這么四個方面的內(nèi)容。
一、背景:新趨勢,新路徑
先講第一個方面,當前大數(shù)據(jù)成為國家戰(zhàn)略,而且大數(shù)據(jù)在國外、全球也是風起云涌,很多國家都開始應用大數(shù)據(jù),推行政府數(shù)據(jù)開放和大數(shù)據(jù)促進政府治理創(chuàng)新。大數(shù)據(jù)到底是一個什么樣的態(tài)勢?先給大家做一個背景性的介紹。
(一)大數(shù)據(jù)的概念
關(guān)于大數(shù)據(jù)的概念,我這里不去做學術(shù)性的闡釋,在2015年的時候,國務院發(fā)了三個技術(shù)性的文件,這三個文件分別是2015年年初的云計算,大概是7月份,促進互聯(lián)網(wǎng)+的一個文件,緊接著有一個促
……(新文秘網(wǎng)http://m.jey722.cn省略1078字,正式會員可完整閱讀)…… 
。
(二)大數(shù)據(jù)的特征
大數(shù)據(jù)到底有多大?我左邊有一張圖,有一個表,左邊是麥肯錫預測的。說到2020年,從2009年的2020年,十年了,數(shù)據(jù)量有可能翻44倍到35個ZB,大家可能不清楚,35個ZB到底是多大?我右邊有一個表,這是我今天早上截圖截下來的。大家看二進制的換算,1KB等于1024,B2的十次方,從KB到MB到GB,我們現(xiàn)在硬盤用的是GB,有的大的存儲的器是TB,TB下面是PB,每一個等級之間是1024倍,就是2的十次方倍,到PB下面是EB、ZB,最大的現(xiàn)在是YB。這個是在大概的進率換算單位。如果按照十次分的換算,我們把1024簡單的理解為十的三次方就是1000,按照1000來算,ZB就是十的21次方,就是這么大的數(shù)據(jù)量。應該可以說叫超級海量的數(shù)據(jù)。
IDC國際數(shù)據(jù)公司,它的預測跟麥肯錫的預測基本上是類似的,他們有三個結(jié)論。第一,說當前數(shù)據(jù)增長進入了爆發(fā)期。2011年,全球數(shù)據(jù)總量是1.8個ZB,大家看ZB是我們現(xiàn)在倒數(shù)第二大的單位,1.8個ZB。預計2020年是40個ZB,十年他認為增長超過20倍。不管超過20倍也好,40倍也好,表明了我們在未來的十年,現(xiàn)在沒有十年了,未來的四年,我們數(shù)據(jù)量比2010年相比,是要至少翻一番以上。應該不是翻一番,翻幾十倍以上。
第二個結(jié)論是美國和中國是最大的兩個增長極,目前它認為大數(shù)據(jù)資源美國占了32%,歐洲是19%,中國是13%,到2020年中國要上升為21%,處于世界第二位。這個可能大家對數(shù)據(jù)概念沒有感覺,但是我們自己生活中,這種數(shù)據(jù)量不斷地增加、不斷地擴充,呈現(xiàn)出幾何基數(shù)的增長,這個咱們可能是有非常深刻體驗的。90年代時候用的是普通的小型的3.5存盤,那個盤是1.44個MB,1.44兆,后來用了光盤,現(xiàn)在用了硬盤,硬盤開始是40個G,現(xiàn)在是幾百個G,現(xiàn)在甚至有上T的硬盤,就是我們普通個人使用的。存儲密度的增加,表明數(shù)據(jù)量容量是不斷擴充的,表明需求是不斷增加的。
第三個特征,非結(jié)構(gòu)化的數(shù)據(jù)占比比較大。這里涉及一個概念叫非結(jié)構(gòu)化和結(jié)構(gòu)化.現(xiàn)在認為非結(jié)構(gòu)化數(shù)據(jù)占75%,什么叫非結(jié)構(gòu)化?我們先看看什么結(jié)構(gòu)化。
這兩張表我相信很多同志都見過,而且我們第一張表,個人經(jīng)歷,可能一生中無數(shù)時期填這樣一個表。但這個表很有特點,就是字段數(shù)相對比較固定的,比如說姓名,你這個名字是三個字符還是幾個字符,它是固定的。第二,性別,是男是女,就兩個選項。身高,它是數(shù)字,結(jié)尾是米或者厘米。所有這一系列的字段都是可以經(jīng)過機器處理,而且都是可以直接導入數(shù)據(jù)庫進行處理的。
還有右邊的圖,我們舉個例子,某某縣,人口經(jīng)濟構(gòu)成統(tǒng)計表,這個表咱們也可能經(jīng)常見到,這種也是可以直接導入經(jīng)濟計算的。這種信息我們稱之為叫結(jié)構(gòu)化信息,因為它們在數(shù)據(jù)庫里面是一塊塊的模塊完全對應起來。
(三)非結(jié)構(gòu)化數(shù)據(jù)與政府治理決策
1、非結(jié)構(gòu)化數(shù)據(jù)主體
什么是非結(jié)構(gòu)化?最主要這五類,大家看想想生活中是不是這五類信息反而比統(tǒng)計性信息要多?
第一類,是搜索引擎,這個都用過,每天在百度上輸入的時候,輸入搜索詞,我們的搜索詞都是非標準的。每個人,比如說我們搜索一個事情的話,每個人用的詞可能都不一樣,全屬于人工的或者自然的語言。這個量是非常大的,百度就此做了搜索引擎,抓取信息,然后通過我們搜索詞,構(gòu)建出搜索的熱度,能夠反而向你推送各種相關(guān)的信息,靠什么?就靠這種分析。還有以前吵過的競價排名,競價排名排的是什么?也是搜索詞。這些東西它都可能是各方面的語言進行組配,非標準語言,非結(jié)構(gòu)化的。
第二類,社交媒體,咱們可能都用過,論壇、微博、微信,包括QQ很多的及時通訊,還有貼吧。這里面發(fā)各類的帖子它都不是結(jié)構(gòu)化的。我們隨機的一句話,隨意的一篇文章,可長可短等等,段落等等,都是根據(jù)我們發(fā)布者主體意識進行決定的。
第三類,視頻或音頻,這個不展開了,這個大家都非常熟悉。包括我們今天用的是視頻,視頻肯定是比音頻數(shù)據(jù)要大,我一個視頻包含的數(shù)據(jù)量可能是我們文字信息的N多次方倍。
第四類,位置服務,很多地圖,在地圖上進行疊加了若干個圖層,這種位置信息,查找一個線路,包括現(xiàn)在滴滴打車,查找餐館等等,這都用了位置服務。所有位置服務在地圖上產(chǎn)生的數(shù)據(jù)量非常大,而且是隨機的,不同的用戶可能使用不同的服務。但是這是數(shù)據(jù)累積起來之后,就是發(fā)現(xiàn)很多規(guī)律,比如說在今天有多少用戶搜索了某某個產(chǎn)品,通過時間序列累積之后就發(fā)現(xiàn)很多趨勢,這個趨勢里面反過來推,搜索這類產(chǎn)品和這個地方的人都可能是哪些類型的用戶,做用戶畫像往回推,這可能形成一個針對性的服務,這對商家來說它就非常需要,想知道我的用戶到底是誰,他們有什么樣的需求,他是什么樣的特征,是男是女的,年齡段、學歷層次,他們平時還有其他什么樣的購物愛好,或者體驗愛好等等。圖像信息,圖片圖像這個也很多。這是非結(jié)構(gòu)化的數(shù)據(jù)。
2、非結(jié)構(gòu)化數(shù)據(jù)對政府決策的要求
這些大量的數(shù)據(jù),特別是大量的非結(jié)構(gòu)化數(shù)據(jù),互聯(lián)網(wǎng)的數(shù)據(jù)產(chǎn)生之后,到底對我們政府決策帶來什么樣一些沖擊或者問題?面臨什么樣的挑戰(zhàn)?當前新形勢下,我們提出要政府的治理,治理體系和治理能力現(xiàn)代化。這個治理能力、治理體系現(xiàn)代化對我們政府治理提出了新的要求,要求什么?決策要快速、要及時。第二,不能再拍腦袋出臺政策,要基于大量的用戶調(diào)查,這個大量是多大的量?我們以前是做問卷調(diào)查,或者找?guī)讉聽政的方式,找?guī)讉代表,現(xiàn)在可能不夠了。第三,新的業(yè)態(tài)、新的應用在不斷地產(chǎn)生,如果政府的治理跟不上新形勢,就會很被動。所以我們現(xiàn)在治理的現(xiàn)代化,對我們要求是全方位掌握信息、全樣本的了解信息。
3、非結(jié)構(gòu)化數(shù)據(jù)下傳統(tǒng)政府治理的缺點
而傳統(tǒng)的政府治理的缺點,我 ……(未完,全文共12732字,當前僅顯示3029字,請閱讀下面提示信息。收藏《干部學習講稿:基于大數(shù)據(jù)的政府決策支持(上)》