大數據時代心得體會(范例十八篇)
發表時間:2022-11-18大數據時代心得體會(范例十八篇)。
? 大數據時代心得體會 ?
這么多年來,看了很多東西,如今回過頭來發現,好像什么都忘了,真是悲劇,所謂讀書破萬卷,下筆如有神或許是不對的,還是需要下筆勤快,所以決定從這里開始。
這些年對于技術的發展,我是沒有跟上,如今發現即便是對于投資,技術對于我們生活的改變太大,而自己身在這個技術浪潮的前沿,還是需要跟上步伐?!??
大數據這個概念已經提了很久,我也一直疏忽了對于它的理解。看完《大數據時代》,再結合如果工作上對于大數據的理解,頓時發現數據的重要性,以前在這方面的確沒有足夠的思想意識。
整本書來說,我覺得最關鍵的三個點是前面幾個章節:
1、要總體,不要隨機樣本:從小對于統計學相關的學習,基本都是從樣本出發,理論的基礎在于如何隨機的足夠分散的選取樣本,這可是技術活加直覺。而對于大數據來說,要的就是總體,本質上來說,總體樣本的確更能準確找到結果。但是對于統計來說,總體的分析增加了數據分析的難度,不僅數據核對不好進行,一旦出現數據污染,準確度就會大打折扣,而且進行數據回溯的時候,也無法準確確認問題,而這一點也是后面相關性上問題;
2、要混亂,而不是精確:這里主要想說明的是希望數據的多樣性,盡量將相關數據都收集起來,不管是結構化的還是非結構化的。這樣就不可避免的最終結果的不準確性。大數據更多的是從一個總體數據中說明以后概率事件,既然是概率,也就可以理解無法精確。這里有個點的說明,我覺得需要提一下,大數據算法更傾向于“簡單”,而不是復雜,這個倒是出乎我的意外。
3、要相關性,而不是因果:從我對于知識獲取的過程來說,我是不同意這個觀點,從人體對于知識的理解,還是要從因果論出發,沒有因果論,就會變成瞎子。而作者的觀點上來說,原因可能還是從大數據本身的非準確性,一旦找到合適的算法,找到相關性,向上追述原因本身就很難。但是從舉的示例上看,相關性的確認是一個非常大的工程,基本就是使用排舉法,一個一個試。
所以,對于大數據來說,最重要的三點是:
1、數據——得到更多數據;
2、算法——建立更快的算法體系;
3、思維——尋找數據間更多的相關性。
對于數據最終的走向,我同意書中所提到的政府管理的觀點,既然都是以“石油”的標準來看待數據,政府統一管理也就是必然的了。而且對于政府來說,掌握更多數據也有利于其管理及維護社會的穩定性。而對于社會道德方面的論述,我不想多說什么,時代發展是不會被道德綁架的。
所以最后,想要建立對于大數據的思維,《大數據時代》還是值得一讀,里面的很多示例也非常不錯。如人際關系這一塊,也是出乎我的意料。
? 大數據時代心得體會 ?
這本書里主要介紹的是大數據在現代商業運作上的應用,以及它對現代商業運作的影響。
《大數據時代》這本書的結構框架遵從了學術性書籍的普遍方式。也既,從現象入手,繼而通過對現象的解剖提出對這一現象的解釋。然后在通過解釋在對未來進行預測,并對未來可能出現的問題提出自己看法與對策。
下面來重點介紹《大數據時代》這本書的主要內容。
《大數據時代》開篇就講了Google通過人們在搜索引擎上搜索關鍵字留下的數據提前成功的預測了20xx年美國的H1N1的爆發地與傳播方向以及可能的潛在患者的事情。Google的預測比政府提前將近一個月,相比之下政府只能夠在流感爆發一兩個周之后才可以弄到相關的數據。同時Google的預測與政府數據的相關性高達97%,這也就意味著Google預測數據的置信區間為3%,這個數字遠遠小于傳統統計學上的常規置信區間5%!而這個數字就是大數據時代預測結果的相對準確性與事件的可預測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數據時代“樣本=總體”的思想。我們都知道當樣本無限趨近于總體的時候,通過計算得到的描述性數據將無限的趨近于事件本身的性質。而之前采取的“樣本<總體”的做法很大程度上無法做到更進一步的描述事物,因為之前的時代數據的獲取與存儲處理本身有很大的難度只導致人們采取抽樣的方式來測量事物。而互聯網終端與計算機的出現使數據的獲取、存儲與處理難度大大降低,因而相對準確性更高的“樣本=總體”的測算方式將成為大數據時代的主流,同時大數據時代本身也是建立在大批量數據的存儲與處理的基礎之上的。
接下來,維克多又通過了IBM追求高精確性的電腦翻譯計劃的失敗與Google只是將所有出現過的相應的文字語句掃描并儲存在詞庫中,所以無論需要翻譯什么,只要有聯系Google詞庫就會出現翻譯,雖然有的時候的翻譯很無厘頭,但是大多數時候還是正確的,所以Google的電腦翻譯的計劃的成功,表明大數據時代對準確性的追求并不是特別明顯,但是相反大數據時代是建立在大數據的基礎住上的,所以大數據時代追求的是全方位覆蓋的數字測度而不管其準確性到底有多高,因為大量的數據會湮埋少數有問題的數據所帶來的影響。同時大量的數據也會無限的逼近事物的原貌。
之后,維克托又預測了一個在大數據時代催生的重要職業——數據科學家,這是一群數學家、統計學與編程家的綜合體,這一群人將能夠從獲取的數據中得到任何他們想要的結果。換言之,只要數據充足我們的一切外在的與內在的我們不想讓他人知道的東西都見會在這一群家伙的面前展現得淋漓盡致。所以為了避免個人隱私在大數據時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數據為商業部門服務,而另一群人則負責審查這一些人是否合法的獲得與應用數據,是否侵犯了個人隱私。
無論如何,大數據時代將會到來,不管我們接受還是不接受!
我覺得《大數據時代》這本書寫的很好,很值得一讀。因為會給我們很多啟發,比如你在相關的社交網站發表的言論或者照片都很有可能被“數據科學家”們利用,從而再將相關數據賣給各大網店。不過,事實就是我們將會成為被預測被引誘的對象。所以說,小心你在網上留下的痕跡。
我喜歡這本書是因為它給我展現了一個新的世界。
? 大數據時代心得體會 ?
利用周末,一口氣讀完了涂子沛的大作《大數據》。這本書很好看,行文如流水,引人入勝。書中,你讀到的不是大數據技術,更多是與大數據相關的美國政治、經濟、社會和文化的演進。作為一名信息化從業者,讀完全書,我深刻感受到了在信息化方面中國與美國的各自特色,也看到了我們與美國的差距。有幾個方面的體會,但窺一斑基本能見全貌。
一是政府業務數據庫公開的廣度和深度。近年來,隨著我國信息公開工作的推進,各級政府都在通過政府門戶網站建設積極推進網上政務信息公開,但我們的信息公開,現階段還主要是政府的政策、法律法規、標準、公文通告、工作職責、辦事指南、工作動態、人事任免等行政事務性信息的公開。當然,實時的政府業務數據庫公開也已經取得很大進步。在中國政府門戶網,可以查詢一些公益數據庫,如國家統計局的經濟統計數據、環保部數據中心提供的全國空氣、水文等數據,氣象總局提供的全國氣象數據,民航總局提供的全國航班信息等;訪問各個部委的網站,也能查到很多業務數據,如發改委的項目立項庫、工商局的企業信用庫、國土資源部的土地證庫、國家安監總局的煤礦安全預警信息庫、各類工程招標信息庫等等。這是一個非常大的進步,也是這么多年電子政務建設所取得的成效和價值!但是,政務業務數據庫中的很多數據目前還沒有實現公開,很多數據因為部門利益和“保密”等因素,還僅限于部門內部人員使用,沒有公開給公眾;已經公開的數據也僅限于一部分基本信息和統計信息,更多數據還沒有被公開。從《大數據》一書中記錄的美國數據公開的實踐來看,美國在數據公開的廣度和深度都比較大。美國人認為“用納稅人的錢收集的數據應該免費提供給納稅人使用”,盡管美國政府事實上對數據的公開也有抵觸,但民愿不可違,美國政府的業務數據越來越公開,尤其是在奧巴馬政府簽署《透明和開放的政府》文件后,開放力度更加大。是美國聯盟政府新建設的統一的數據開放門戶網站,網站按照原始數據、地理數據和數據應用工具來組織開放的各類數據,累積開放個原始和地理數據集。在中國尚沒有這樣的數據開放的網站。另外,由于制度的不同,美國業務信息公開的深度也很大,例如,網上公布的美國總統“白宮訪客記錄”公布的甚至是造訪白宮的各類人員的相關信息;美國的xxxxxxxxxxxxxxxx網站,能夠逐條跟蹤、記錄、分析聯邦政府每一筆財政支出。這在中國,目前應該還沒有實現。
三是關于個人數據的隱私。在美國,公民的隱私和自有不可侵犯,美國沒有個人身份證,也不能建立基于個人身份證號碼的個人信息的關聯,建立“中央數據銀行”的提案也一再被否決。這一點,在中國不是問題,每個公民有唯一的身份信息,通過身份證信息,可以獲取公民的基本信息。今后,隨著國家人口基礎數據庫等基礎資源庫的建設,公民的社保、醫療等其他相關信息也能方便獲取,當然信息還是限于政府部門使用,但很難完全保證整合起來的這些個人信息不被泄露或者利用。
數據是信息化建設的基礎,兩個大國在大數據領域的互相學習和借鑒,取長補短,將推進世界進入信息時代。我欣喜地看到,美國政府20xx年啟動了“大數據研發計劃”,投資2億美元,推動大數據提取、存儲、分析、共享、可視化等領域的研究,并將其與超級計算和互聯網投資相提并論。同年,中國政府20xx年也批復了“十二五國家政務信息化建設工程規劃”,總投資額估計在幾百億,專門有人口、法人、空間、宏觀經濟和文化等五大資源庫的五大建設工程。開放、共享和智能的大數據的時代已經來臨!
? 大數據時代心得體會 ?
近幾年, “大數據”這個詞頻繁地出現在人們的視野當中,它不僅被寫入阿里巴巴、 谷歌等互聯網公司的戰略規劃中, 同時在我國國務院和其他國家的**報告中也被多次提及,甚至在我的家鄉內蒙古自治區,烏蘭察布市集寧區也已經耗資15億建成了華為云大數據中心,將來還要發展成內蒙古的大數據中心。這些改變都使我對大數據產生濃厚的興趣。 因此通過多方途徑了解后,最終決定以《大數據時代》一書,作為我進一步了解大數據的入門書籍。
《大數據時代》一書是由英國作者維克托邁爾舍恩伯格所著。 主要描述了大數據對21世紀人們生活、工作與思維各方面所做出的重大變革。
這本書的作者舍恩伯格是大數據領域最受尊敬的權威演講者之一。 他二十多年來一直致力于網絡經濟、 信息與創新、 信息監管、 網絡規范與戰略管理方面的研究, 從維也納大學到哈佛大學, 從新加坡國立大學到牛津大學, 很多世界上著名的互聯網研究學府都留下了他的足跡。他寬廣的學術視野和系統的學術造詣,使他不斷為企業和企業應用提供強有力的理論支持。
他的咨詢客戶包括微軟、 惠普、 ibm 、亞馬遜、 facebook 、 twitter 、 visa 等大數據先鋒們,所以在《大數據時代》一書中, 他將掌握的最前沿的大數據應用案例給予充分的分析, 并對大數據的價值鏈與角色定位給予清晰的預見。
首先,舍恩伯格明確闡述了大數據的基本概念和特點,并列舉了清晰的觀點。 不管對于產業實踐者, 還是對于**和公眾機構, 都非常具有價值。作者將本書分為3個部分。
第一部分提出大數據時代數據處理觀念的三大變化:不是隨機樣本,而是全部數據;不是準確性,而是雜合性;不是因果關系,而是相關性;
第二部分作者從萬事萬物數據化和數據交叉復用的巨大商業價值兩個方面, 講述大數據最核心的模塊:一切皆可數據化,并闡釋了數據的新價值和其運用方法;
第三部分闡述了大數據的出現可能引起的關注和隱患,包括產業生態環境、數據安全與隱私、信息公平與公開等。
剛看到第一部分時,作者便向我們闡述了一個奇妙的“云時代” 。他認為在抽樣研究調查的時期, 由于研究的條件欠缺, 只能以少量的數據獲取最大的信息,而在現在,無論是計算量還是計算速度,我們都達到了一個比較好的高度,我們可以在很短的時間內獲取到海量的數據。因此如果我們以更多甚至是與之相關的全部數據去分析一個事物,就可以讓我們更清楚地看到以前無法揭示的細節信息。
我看過一個管理方面的例子,從大數據分析得出結論:一般來說,我周末去超市購物
嬰兒用品的父親通常去啤酒區買啤酒,而其他產品很少出現在他們的購物車上。通過這一分析,超市管理者將嬰兒用品和啤酒分別放在最遠的距離區域,消費者會注意到來回中間的商品,從而增加了購物量和超市的利潤。而如果只是分析抽樣數據的話,我們就無法確定購買嬰兒用品的人與父親們與啤酒之間的這種關聯,自然也就不會做出將嬰兒用品和啤酒分開放在了相距最遠距離的區域這樣的舉動了。
同時,筆者也指出,隨著數據使用量的不斷增加,結果并不一定更加準確,特別是在大數據時代,各種結構化和非結構化的數據必然會導致不準確的結果。大數據時代要求我們重新審視準確性的優缺點。作者特別舉了谷歌翻譯成功的例子。
google translate優于ibm的candide系統,并不是因為它有更好的算法機制。 和微軟的班科和布里爾一樣,谷歌翻譯增加了各種各樣的數據,并且接受了有錯誤的數據。 (其語庫來自于未經過濾的網頁內容, 會包含一些不完整的句子、 拼寫錯誤、 語法錯誤以及其他各種錯誤)。
不是因果關系,而是相互關系的一章。
作者指出,在大數據時代,了解大數據時什么比為什么會出現更現實。作者列舉了林登亞馬遜推薦系統的成功案例,證實了大數據在相關性分析和銷售成功方面的優勢。 沃爾瑪也是充分利用并挖掘各類數據信息的先鋒和代表, 和我剛才所介紹的啤酒與嬰兒用品的案例, 以及作者舉的有關蛋撻和颶風天氣的案例, 都說明了掌握了相關關系對于其策略的幫助。
基于相關性分析的**是大數據的核心。aviva insurance利用數百種生活方式的數據,如興趣愛好和長時間的網絡瀏覽,間接確定誰更容易患高血壓、糖尿病和抑郁癥。 ups 國家快遞公司通過使用**性分析檢測其全美 6萬輛車隊。
進行防御性的修理,節約巨大得的成本。這些都充分顯示了**大數據的優勢。
接下來的第二部分,作者講的是大數據時代的商業變革。
作者用莫里繪制導航圖的例子告訴我們, 遠在信息數字化之前, 對數據的運用就已經開始了。莫里用大量的人力分析了他保存多年的航海記錄,從這些大量的數據中獲得了新的利用價值。繪制的圖表幫助商人節約一大筆錢, 使年輕的海員們間接獲取了成千上萬名經驗豐富的航海家的指導。
日本先進工業技術研究所崇臣教授通過安裝壓力傳感器,將人體臀部特征數字化,進而形成乘客身份識別。這項技術為汽車防盜系統提供了方案。 mastercardd.
顧問部分析了210個國家15億信用卡用戶的650億筆交易
易記錄,分析得出商業發展和客戶消費趨勢, 如通過分析發現如果一個人下午四點左右給汽車加油的話, 他很可能在接下來的一個小時內去購物或者去餐館吃飯 ,且在這一小時里大約花費 35到 40美元。 商家正可以利用這個分析結果, 在加油的小票背面附加上附近商店的優惠券。這些例子證明了大數據具有巨大的商業價值。
大數據價值鏈根據**提供價值的不同分為三個部分。 包括第一種是基于數據本身的公司。這些公司擁有大量數據,或者至少可以收集大量數據,但他們不一定具備從數據中提取價值或利用數據產生創新想法的技能。
第二種是基于技能的公司。它們通常是咨詢公司、技術**商或分析公司。 它們掌握了專業技能但并不一定擁有數據或者提出數據創性用途的才能。
例如,沃爾瑪和波普餡餅是兩家通過對天睿公司的分析來獲得營銷理念的零售商。天睿是一家大數據分析公司。 第三種是基于思維的公司。皮特 .
華登, jetpac 的聯合創始人,就是通過想法獲得價值的一個例子, 他通過用戶分享到網上的旅行**來為人們推薦下一次旅行目的地。 對于某些公司來說, 數據和技能并不是成功的關鍵。挖掘數據的新價值的創新思維才是這些公司脫穎而出的優勢所在。
這就意味著,在現在這個時代,掌握了大數據就相當于掌握了與其他企業競爭的競爭力。如何更快更廉價的提取、保存數據,如何正確的利用數據成為了當今企業需要關注的一個重點。一旦成功的掌握了大數據,不但可以超過現有的對手,甚至可以遙遙領先。
本文的第三部分講了大數據帶來無數好處的同時帶來的不良影響以及如何面對這些影響。包括如數據的收益的處理問題以及數據中用戶資料的隱私和決策過程帶來的影響。
舉個最近的例子,阿里巴巴的大數據處理能力在**這一款電商軟件上體現的淋漓盡致。通過分析大數據很多情況下都會推送到你想要購買的商品以及最合適的**,為我們帶來了很多的便利。但同時支付寶的隱私門丑聞,偷偷調用攝像頭錄像偷偷調用麥克風錄音的行為,被爆出之后也讓我們心有余悸。
然而這僅僅是個典型案例。
真正被別人翻遍隱私卻茫然不知的例子太多了。比如網易郵箱,去年被烏云爆出被拖庫,幾億用戶密碼密保問題泄露,然后大家一陣嘩然。實際上圈里人都知道,網易郵箱這些年被拖庫就像月經一樣,根本就是公開的秘密。
2011年出現過一個新聞,一款叫做ciq的預置在所有蘋果手機和運營商定制的安卓手機中的app,會竊取用戶隱私數據,包括聯系人、短信等,每隔72小時就會發送一次數據到位于美國的服務器。
而作者在保護個人隱私方面提出了幾種想法。 一種是使用數據時征詢數據所有個人的知曉和授權。 第二個技術途徑就是匿名化。
作者同時也指出了這兩種方式的難度。一方面收集到的數據可能會被后續的多次利用。另一方面, 匿名化會在數據收集越來越多和數據的相互結合關聯使用時變得無效。
作者列列舉電影 《少數派報告》 的情節說明越來越依賴數據時, 大數據可能將我們禁錮在可能性之中。當然通過分析犯罪的常發地與常發時間, 合理安排警力會對治安防范提供不小的幫助。
盡管如此,我們也必須要知道, 大數據在給我們生活提供便利的同時, 也讓隱私保護的法律手段失去了作用。我們必須杜絕對大數據的過分依賴,作者也在文章的結尾提到了大數據提供給人們的只是參***, 我們在利用這個工具時要銘記人類的作用是無法完全替代的。
大數據是時代發展的必然趨勢,在讀完本書后更加確信了這一點,但在運用大數據的同時,我們也要深知大數據為我們提供的不是最終答案,只是參***,而更好的方法和答案還在不久的未來。我們還需要不斷的學***索。
? 大數據時代心得體會 ?
大數據與小生活
--讀《大數據時代》有感
施佳奇不知道什么時候開始,“大數據”已經悄然成為我們的常用詞匯;我們不知道什么時候進入了“大數據時代”。那么大數據時代是什么樣的時代呢?英國"大數據時代的預言家"維克托邁爾·舍恩伯格和肯尼思庫克耶的《大數據時代》對此有著詳細而深刻的洞見。
一、什么是大數據?
根據《大數據時代》中所說,"大數據是人們在大規模數據的基礎上可以做到的事情,而這些事情在小規模數據的基礎上是無法完成的。大數據是人們獲得新認知、創造新價值的源泉。大數據也有助于改變市場、組織以及**與公民之間的關系。大數據是一種新功能:
以前所未有的方式,通過對海量數據的分析,我們可以獲得具有巨大價值的產品和服務,或者說是深刻的見解?!按髷祿袃蓪雍x。一是大數據是一個總結性的概念,是海量數據的總稱;書中指出的第二種意義是一種新的能力和方式。區別于小規模數據時代的抽樣分析,大數據時代,分析的樣本不再需要經過抽樣,直接將全體數據進行更快更準確地分析。
二、大數據的核心是什么?
大數據的核心應該是減少冗余,提高資源配置效率。根據收集到的數據分析,挖掘出一個龐大數據庫的獨**值,以便介入或提供相應的資源和服務。自古以來,人類社會的發展便是資源配置不斷優化的過程,大數據作為一種新型的生產工具,它能讓我們通過分析海量的數據,得知該如何更有效地分配稀缺的資源。
如醫院通過對某個病人病史、生活習慣、衣食住行、工作娛樂情況等進行全方位分析,便可以準確了解病人的生活情況與生活環境,精確地指出癥結引起原因所在,只要建議病人針對引起病源的因素做出調整或進行醫學干預,便可以了,避免了對病人過多的用藥與過大范圍的盲目干預。
同樣的道理,如果銀行通過分析某一申請人的家庭情況、消費歷史、生活習慣、財務習慣、網頁瀏覽記錄等各方面的數據,便可以清晰了解此申請人各方面的情況,甚至可推測其內心的真實想法與將要采取的做法,從而判斷申請人的貸款申請資格,決定該不該授信,授信多少等內容,所有的信息在大數據時代,能在系統中搜索一下,幾分鐘便能全部收集完成。相比以前,申請人申請后,銀行得派出兩名客戶經理上門進行訪問、調查、收集電信、征信等多方面的信息,再進行人工分析、鑒別等過程,耗費的時間多不說,風險也相對更高。
可見,大數據的運用不但提高了工作效率,節省了機構與申請人的時間,更能基于精確的信息,確保風險可控,且保證了授信給該申請人的正確性,將有限的資金用在刀刃上,提高資源配置質量。
三、什么是大數據思維?
? 大數據時代心得體會 ?
讀完《大數據時代》這本經典書籍受到不少啟發,文中許多觀點值得我們深思。
大數據是指不用隨機分析法,而是采用分析所有數據的方法,分析樣本是全體數據。作者認為我們理解世界不再需要建立在假設的基礎上。在大數據時代,在混雜中尋找相關關系將替換目前在精確數據中尋找因果關系的傳統想法。大數據的相關關系分析法更準確、更快,而且不易受偏見的影響。但是在這一部分,我覺得作者太過于強調大數據帶來的相關關系分析,而拋棄對因果關系的探索。比如“如果得到超市用戶的購買數據發現下雨天太陽傘賣很好,那下雨天就多備太陽傘就好了,不要問為什么,混亂的數據不能告訴你為什么,但能告訴你怎么辦。”在我看來,是什么和為什么并不矛盾,大數據只是讓我們跨過目前還無力找到根源的理論進行相關關系分析,不要老為了強調相關性而否定因果。我認為利用這種相關關系分析的幫助,可以再反向論證,完善我們目前還未掌握的理論知識,將會極大地促進了科學的發展。甚至對社會學、統計學、人類學等學科的研究方法或許會要影響。
大數據的價值“取之不盡,用之不竭”。不同于物質性的東西,數據的價值不會隨著它的使用而減少,而是可以不斷地被處理。個人的使用不會妨礙其他人的使用,而且信息不會像其他物質產品一樣隨著使用而有所耗損。所以要深入挖掘大數據的價值。
大數據的未來將屬于三類公司,一是擁有數據的公司,二是數據分析公司或者技術公司,第三是能從龐大數據里發現關聯并創意性使用的個體或者群體。
當然大數據也會帶來風險,如信息過量、信息泄露、信息竊取、數據分析取代人工分析以及可能會造成倫理問題。但是技術是無罪的,如何讓大數據在人類的監管下更好地為我所用是對我們的考驗。書中也提到了掌控管理大數據的方法,比如隱私保護從個人許可到由數據使用者承擔責任,在使用預測分析時必須考慮個人動因,催生大數據審計以及防止對大數據的壟斷等。
大數據時代,人類還在摸索前進。在擁抱大數據時代的時候,也提醒我們在使用這個工具的時候,應當懷有謙恭之心,銘記人性之本。
? 大數據時代心得體會 ?
經過前期的MOOC課程自學和集中面授學習,我順利地通過選拔考試,獲得20xx年湖北xx“菁英計劃”人才培養第三階段大數據專業的培訓資格。11月12日至22日,我與省內其他24名學員一起,參加了在杭州華為全球培訓中心舉辦的“xx計劃”第三階段大數據專業培訓。與7月份開展的第二階段培訓相比,本次培訓在數學基礎知識、Python編程語言、數據挖掘模型與算法方面有了更深入的講解,同時新增了xx云機器學習服務MLS、大數據架構和大數據治理等內容,并強化了本課程的實驗教學。
本次培訓中,全體25名學員都表現出了積極端正的學習態度。在xxx老師的指導下,大家刻苦專研大數據挖掘知識,課上遇到問題主動向老師請教,課后積極復習消化新知識,基于自身學習情況及時與老師協商調整授課和學習方式。面對課程內容多、難度大而課時少的情況,大家都欣然接受由原來每周2次晚自習調整為每天上晚自習并且晚自習時間延長1小時的安排。培訓期間,大家仔細琢磨常見的分類、回歸和聚類算法,比較不同算法的優缺點;在理論學習的基礎上,大家通過上機實操對所學知識做進一步鞏固和強化;在實驗室搭建環節,雖然大家碰到了許多棘手問題,但通過老師的悉心點撥、學員間的激烈討論,所有問題逐一解決;面對課時緊、學習任務重的挑戰,大家自覺利用課余時間,針對課堂上未消化的內容自行查漏補缺。
本次培訓雖不能保證讓所有學員都成為大數據挖掘方面的專家,但它讓大家有機會更加深入地了解大數據挖掘這門技術,并且點燃了大家對大數據挖掘的學習熱情。面對課程龐大的知識架構和體系,大家紛紛表示,雖然很難在10天內對所有知識有充分的認識和掌握,但培訓結束后仍會卯足干勁,主動做到持續性學習,爭取在大數據挖掘道路上越走越遠。
? 大數據時代心得體會 ?
“大數據”概念早在1980年就有國外的學者提出,可是最近幾年才廣泛受到大家的關注。當“大數據”這個概念傳到中國的時候,瞬間引起了轟動。隨即,各種有關“大數據”的資料和書籍充斥的我們的視野。隨意打開某個電子商務平臺圖書類頁面,在搜索框中搜索“大數據”三個字,就會出現好多本有關“大數據”的書籍??墒?,有一個很有趣的現象就是:幾乎所有的平臺上,出現的第一本關于“大數據”的書籍一定是《大數據時代》。一點進去,這本書推薦欄里的第一句話就是:迄今為止全世界最好的一本大數據專著。同時,為這本書做推薦的都是各行業的精英領袖。所有“大數據”方面的書籍也是這本書銷量最高,評價最好。
我從來不會因為哪本書暢銷和很多人推薦就盲目跟風的去看一本書。因為我知道通常在這種情況下選擇一本書,整個閱讀的體會和感受是無法遵從自己的內心的,整個過程都很容易夾雜著別人對這本書的感受。所以通常我讀書的節奏大多都是跟不上“潮流”的,但往往經過風雨洗禮之后沉淀下來的都是精華。坦白講,閱讀這本書的初衷并不是因為我想從書中獲取到多少大數據方面的精華,只是很想知道對于這么一個很直白的名詞,作者是怎么寫出這么厚的一本書的。這種初衷或許很無知和幼稚,可就是這種“愚蠢”的好奇心,讓我更透徹的看到書中的精華。
在看《大數據時代》這本書之前,我的所有讀后感都是集中在書籍給了我什么思考。對于這本書的讀后感,除了觀點碰撞之外,我還會加上大部分個人看這本書的體會。因為這本書,已經完全讓我模糊了大多數人口中的“全世界最好的書”是一種什么標準。也許《大數據時代》真的無法承載那么高的贊美!
大數據時代的入門書
看完這本書,我隨意調查了一些閱讀過這本書并且給這本書絕對好評的朋友。詢問他們這本書好在哪里?大多數的回答是說《大數據時代》這本書讓對大數據一無所知的他們了解了大數據這個概念,同時通過很多案例說明原來大數據能有這么大的用處,影響會有這么大!僅此而已。我看完這本書最大的感受是這本書分為上、下兩部分。前120多頁為上部分,后120多頁為下部分。之所以說《大數據時代》是一本關于大數據的入門書,是因為這本書用了前面120多頁的篇幅反復的強調大數據的出現對社會發展影響很大,并且要人們轉變小數據時代慣有的思想。所以整本書的前半部分就強調大數據時代的三個轉變:1、大數據利用所有的數據,而不再僅僅依靠一小部分數據,不再依賴于隨機采樣。2、大數據數據多,不再熱衷于追求精確性,也不再期待精確性。3、大數據時代不再熱衷于尋找因果關系,而是追求相關關系。所以整個上半部分沒什么可詳說的。我們重點聊聊本書的后半部分。
既然一直都在強調大數據對我們的意義,總要有具體體現。整本書中,我感觸最大的一個案例就是某公司通過分析大數據發現:新品發布的時候,舊一代的產品可能會出現短暫的價格上漲。因為人們在心理上就認為新產品的推出,舊產品就會便宜,從而就會提高購買量。這個發現和我們平常的心理是完全違背的,而且如果不用數據來證明,直接講道理給大家可能還是無法相信。這就是大數據對我們很多傳統思維的顛覆。一旦涉及到思維的改變,往往就會引起整個社會的大變動。
大數據這個概念的出現,讓大數據逐漸發展形成一條價值鏈。在這條價值鏈上,數據本身、技能和思維是最重要的環節。隨著互聯網技術的發展,越來越多的公司都能收集到大量的數據,這些數據也會越來越公開??墒窃谶@些公司中,不是所有的公司都有從數據中提取價值或者用數據催生創新思想的技能。于是就會出現以下兩種公司,一種是掌握了專業技能但不一定擁有數據或者提出數據創新性用途才能的公司,另一種就是擁有超前思維,懂得怎樣挖掘數據的新價值的創新公司。短時間內,我們可能會感覺擁有創新思維,懂得挖掘出數據新價值的大數據思維是最重要的??墒堑鹊疆a業成熟之后,所有人都知曉了大數據的意義,所有人便開始挖掘自己的大數據思維。同時,隨著科技的進步,掌握大數據技術的也將成為常態。所以到后來,整個價值鏈的核心環節還是回到了數據本身。而到那時候,大數據的公開性也就越來越小。
在大談完大數據對人類發展的積極意義之后,作者也考慮到大數據時代的風險。這一部分是作者腦洞大開的精彩之處,同時也是最荒謬的一部分。書中說大數據時代將要懲罰未來犯罪,這樣可以在嫌疑人在可能犯罪之前就把犯罪行為給防止。這樣的社會,大數據儼然已經延伸到了我們每個人生活的點滴。幾乎我們在生活中所做的一切都在大數據的“監控”之下,我想到那時候,別說我們每個人的隱私已經沒有的了,嚴重一點可以說是我們可能連人都不算了。在我們人的社會屬性中,自由權利是一項很重要的指標。通過大數據懲罰人的未來犯罪已經否定了人的自由選擇能力和人的行為責任自負。同時,由于數據是永久保存,大數據預測也是通過每個人之前的數據來判斷,所以大數據同樣也否定了人的求善心理。還有,從現在各種大數據預測的結果來看,很多發言人都說大數據不是百分百的準確。所以利用大數據來判斷人的行為發展已經違背了大數據不追求精確性的特征,這也是書中自相矛盾的地方。
對于一個新事物,如果能讓大家了解這個事物并且對此產生興趣,這已經算是一本不錯的入門書了。
大數據時代的心靈雞湯
從小到大,雞湯對于我們來說一直都挺珍貴的。身體虛弱了,喝點雞湯能夠補充營養。心靈受傷了,看點心靈雞湯可以鼓舞人心。可是近幾年,人們生活水平提高了,營養富余,雞湯已經不是人們補營養的期待了。同樣,心靈雞湯也是如此。
心靈雞湯其實是一個很虛偽的東西。很多人都被心靈雞湯誘人的外表給迷惑。在我看來,心靈雞湯很大的一個特征就是:立人的志,但是就不告訴你實現志的方法。很多人每次在失意的時候就喜歡看心靈雞湯,希望能得到慰藉??赐旰笠灿X得醍醐灌頂,感覺整個世界都亮了。但又有幾個人想過喝完這些雞湯之后你除了看似重拾夢想,你還獲得了什么?你知道怎么去做嗎?《大數據時代》就是這樣一本書。整本書從頭到尾都在向讀者講述大數據的意義,當然期間也會用相應的案例來證明大數據確實有這樣的能力。但是,整本書從沒有涉及到技術層面的問題?;蛟S對于大數據這種依靠互聯網技術的新事物,即使向讀者講技術,也沒有幾個人看得懂,可是整本書沒有一點關于大數據思維的技能引導。給出的案例中只有少數案例向讀者講述了這個公司為什么要利用大數據來解決這種問題,大多數都只是告訴讀者國外某家公司運用大數據得出了某種結論。同時,在本書中文譯作者寫的序里,強調自己翻譯這本著作的一大優點是可以結合國內的案例來分析書中的理論,結果,看到最后一頁都沒有看到一個國內企業關于大數據運用的案例。
之所以我稱之為“心靈雞湯”,還有一個原因就是作者在書中大講特講的大數據的作用,事實上按照現在的經濟發展水平和社會文明發展程度是很難實現的。書中很多時候的理論都是要建立在社會各項文明都發展健全的基礎上才能實現。
大數據的“傳銷手冊”
看到這個標題,大家可能會覺得我夸大其詞,受到如此多人好評的書怎么是“傳銷手冊”呢?對于這個表達,我只想說兩點:1、此說法僅代表我個人觀點,是否認同是個人問題。2、此說法主要針對本書的上部分。
我們都知道傳銷組織在發展下線的前期是要花大力氣去培訓的,也就是洗腦。而對于一個陌生又很難以理解的事物,最好的“洗腦”方式就是重復?!洞髷祿r代》這本書就是運用這種方式,前半部分為了讓讀者能夠接受“大數據”這個概念,作者反反復復提醒讀者大數據不是隨機采樣、不追求精確和不尋找因果關系。同時用很多看似很通俗易懂其實看完后還是不知道說了什么的案例來讓人信服大數據的作用。書中的后半部分雖然也是用這種方式來感染讀者,可后半部分中作者的暢想和對大數據的威脅分析還是對讀者有一些實質意義的,所以后半部分的“傳銷”影響就不是很重要。
大數據時代是未來的趨勢,這誰都不會否認。大數據改造了我們的生活,改變著我們的世界。不管它是以一種什么樣的姿態面向世界,它都沒有錯,因為大數據只是一種工具。但當人類開始質疑甚至恐懼大數據的時候,人類就該思考自己是否利用好這個好工具了。
? 大數據時代心得體會 ?
victomer schenberg說,大數據發展的核心動力來自于人類測量、記錄和分析世界的愿望。大數據的出現,使得通過數據分析獲得知識、商機和社會服務的能力從以往學術圈擴大到了普通機構、企業和政府部門,大數據已逐漸成為現在社會基礎設施的一部分,如今適逢世界走向數據化,無論對個人、企業抑或社會和國家,都有認真理解、嚴肅決策的必要性和緊迫性。大數據正在改變我們的生活和我們了解世界的方式,成為新發明和新服務的來源。
大數據使人們的生活越來越便捷,我們可以根據大數據的分析預測下次流感來襲時間,可以預測幾天內航班的票價,可以得知現下流行趨勢并預知未來流行趨勢,大數據的核心就是預測,通常被視為人工智能的一部分,在不久的未來,世界上許多依靠人類判斷力的領域有可能會被計算機系統所取代。
recaptcha的故事強調了數據重用的重要性。隨著大數據的出現,數據的價值正在發生變化。然而隨著大量數據的被分析,大數據的價值不再單純的來源于它的基本用途,而更多源于它的二次利用,很多數據在收集的時候并無意用作其他用途,而最終卻產生了很多創新性的用途,于是我們的個人信息,我們的隱私也被二次利用,互聯網的出現使得“監視”變得更容易、成本更低廉也更有用處,像淘寶這樣的購物網站“監視”著我們的購物習慣,支付寶“監視”著我們的財務狀況,百度谷歌“監視”著我們的網頁瀏覽習慣,微博、qq似乎什么都知道,包括我們的社交關系網,甚至會幫忙找到可能認識的朋友,更有甚者,在網上報名考試留的電話,在報名完成的幾年時間里會源源不斷的接到各種讓你參加學習班或者發表論文甚至買賣答案等等的騷擾電話,繼而使得不斷有新聞播報某某地某某人被網絡詐騙,我們在互聯網輸入的個人信息并沒有得到有效的保護,正在逐漸的被某些不良用心的人或機構所利用,如果說互聯網時代我們的隱私受到了威脅,那么大數據會不會加深這種威脅呢?因此,如何保護用戶的隱私應該是下一個要突破的障礙。
? 大數據時代心得體會 ?
這么多年來,看了很多東西,如今回過頭來發現,好像什么都忘了,真是悲劇,所謂讀書破萬卷,下筆如有神或許是不對的,還是需要下筆勤快,所以決定從這里開始。
這些年對于技術的發展,我是沒有跟上,如今發現即便是對于投資,技術對于我們生活的改變太大,而自己身在這個技術浪潮的前沿,還是需要跟上步伐。
——前言
大數據的概念提了很久,我一直忽略了對它的理解。看完《大數據時代》,再結合如果工作上對于大數據的理解,頓時發現數據的重要性,以前在這方面的確沒有足夠的思想意識。
對于整本書,我認為三個要點是前幾章:
、要總體,不要隨機樣本:從小對于統計學相關的學習,基本都是從樣本出發,理論的基礎在于如何隨機的足夠分散的選取樣本,這可是技術活加直覺。對于大數據來說,這是一個整體。從本質上講,整個樣本可以更準確地找到結果。
但是對于統計來說,總體的分析增加了數據分析的難度,不僅數據核對不好進行,一旦出現數據污染,準確度就會大打折扣,而且進行數據回溯的時候,也無法準確確認問題,而這一點也是后面相關性上問題;
2、要混亂,而不是精確:這里主要想說明的是希望數據的多樣性,盡量將相關數據都收集起來,不管是結構化的還是非結構化的。這樣就不可避免的最終結果的不準確性。
大數據更多的是從一個總體數據中說明以后概率事,既然是概率,也就可以理解無法精確。這里有個點的說明,我覺得需要提一下,大數據算法更傾向于“簡單”,而不是復雜,這個倒是出乎我的意外。
3、要相關性,而不是因果:從我對于知識獲取的過程來說,我是不同意這個觀點,從人體對于知識的理解,還是要從因果論出發,沒有因果論,就會變成瞎子。而作者的觀點上來說,原因可能還是從大數據本身的非準確性,一旦找到合適的算法,找到相關性,向上追述原因本身就很難。
但是從舉的示例上看,相關性的確認是一個非常大的工程,基本就是使用排舉法,一個一個試。
? 大數據時代心得體會 ?
金融學院實驗班
王驍義***
《大數據時代》讀后感
這個學期伊始,在事實與政策老師的建議下我選擇閱讀了《大數據時代》,這本書主要描述的是大數據時代到臨人們生活、工作與思維各方面所遇到的重大變革。讀完這本書,我對書中描述的大數據時代有了更深的理解。
本文明確闡述了大數據的基本概念和特點,并列舉了清晰的觀點。不管對于產業實踐者,還是對于**和公眾機構,都非常具有價值。作者將本書分為3個部分。
第一部分提出了大數據時代處理數據理念上的三大轉變:抽樣等于全體;要效率不要絕對精確;要相關不要因果;第二部分作者從萬事萬物數據化和數據交叉復用的巨大價值兩個方面,講述驅動大數據戰車在材質和智力方面向前滾動的最根本動力;最后一部分,作者描繪了大數據帝國前夜的脆弱和不安,包括產業生態環境、數據安全隱私、信息公正公開等問題。
導言提出,大數據將給生活、工作和思維帶來巨大變化。一個例子是2009年h1n1流行病毒背景下谷歌通過檢測檢索詞條,處理了4.5億個不同的數據模型,通過**并與2007年、2008年美國疾控中心記錄的實際流感病例進行對比后,確定了45條檢索詞條組合,并將其用于一個特定的數學模型后,**的結果與官方數據的相關系數高達97%。
根據傳統的信息返回程序,新流感病毒病例的通知將延遲一至兩周。對于一種迅速蔓延的疾病,兩周的信息滯后是致命的。谷歌使用大數據技術,以前所未有的方式分析海量數據,找出流感傳播的范圍,這為全球的**流感提供了一個更快的工具。
此外,我聯想到原**董事長馬云通過大量數據分析得出2008年經濟疲弱,為其商家提前做好迎接經濟危機提供了時間緩沖。(補充并清晰描述詳細)關于大數據在商業領域的應用, farecast公司是一個成功的典型范例。該公司由oren ezioni創立,利用機票銷售數據**未來機票**,旨在幫助用戶在購買機票時**制作**,并將機票趨勢**的可信度標記出來,供消費者查詢。
farecast系統利用近十萬億條**記錄**的準確度達75%,使得使用farecast票價**工具購買機票的旅客,平均每張機票節約50美元。而處理如此多的數據離開了大數據技術將無法進行。
正是因為我們進入了一個前所未有的信息時代,人們擁有如此多的數據,我們才能利用大數據的分析和處理手段創造新的價值。也許有人以為我們大數據時代的還未來臨。事實上,大數據技術已經滲透到我們當中。它已應用于垃圾郵件過濾、新浪微博技術平臺、谷歌翻譯和輸入文本的自動糾錯。
本文提出的一點是**是大數據的核心。其實從過去的時代人們就利用掌握的數據進行各種分析,從而對經濟等各方面進行**、矯正。只是進入了大數據時代人們掌握的數據**性的速度在增長,從而數據的存儲和分析數據分方法成了釋放大數據能量的關鍵。
關于不是隨機樣本而是整體數據中。指出在小數據時代,隨機抽樣是用最少的數據獲得最大值的方法。作者使用大數據和喬布斯的癌癥**來說明使用所有數據而不是樣本的重要性。
喬布斯成為世界上第一個對他所有的dna和腫瘤dna進行測序的人。喬布斯曾開玩笑說“我要么是第一個通過這種方式戰勝癌癥的人,要么就是最后一個因為這種方式死于癌癥的人”。雖然他最終死于癌癥是不可避免的,但這種獲取所有數據而不是僅僅獲取樣本的方法延長了他幾年的壽命。
同樣,從事跨境匯款業務的xoom公司偵破一起犯罪集團的詐騙也是由于使用了整體數據。初此之外,他還列舉了日本“相撲”等來證明使用全體數據的重要性。
作者同時也指出隨著數據使用的越來越多,其得出的結果并一定能越來越精確,畢竟數據不能保證百分之百的正確,特別是大數據時代各種結構化與非結構化類型的數據聚集在一起難免導致結果的不太精確。大數據時代要求我們重新審視準確性的優缺點。作者特別舉了谷歌翻譯成功的例子。
google translate優于ibm的candide系統,并不是因為它有更好的算法機制。和微軟的班科和布里爾一樣,谷歌翻譯增加了各種各樣的數據,并且接受了有錯誤的數據。(它的語言庫來自未過濾的web內容,它將包含一些不完整的句子、拼寫錯誤、語法錯誤和各種其他錯誤。)
在不是因果關系,而是相關關系的篇章中。作者指出,在大數據時代,了解大數據時什么比為什么會出現更現實。作者列舉了林登亞馬遜推薦系統的成功案例,證實了大數據在相關性分析和銷售成功方面的優勢。
沃爾瑪也是充分利用并挖掘各類數據信息的先鋒和代表,從以前廣為人事的啤酒和尿布的案例,以及作者舉的有關蛋撻和颶風天氣的案例,都說明了掌握了相關關系對于其策略的幫助?;谙嚓P性分析的**是大數據的核心。aviva insurance利用數百種生活方式的數據,如興趣愛好和長時間的網絡瀏覽,間接確定誰更容易患高血壓、糖尿病和抑郁癥。
ups國家快遞公司通過使用**性分析檢測其全美6萬輛車隊。進行防御性的修理,節約巨大得的成本。這些都充分顯示了**大數據的優勢。
本書的第二部分是關于大數據時代的業務轉型。作者用莫里繪制導航圖的例子告訴我們,遠在信息數字化之前,對數據的運用就已經開始了。莫里用大量的人力分析了他保存多年的航海記錄,從這些大量的數據中獲得了新的利用價值。
繪制的圖表幫助商人節約一大筆錢,使年輕的海員們間接獲取了成千上萬名經驗豐富的航海家的指導。日本先進工業技術研究所崇臣教授通過安裝壓力傳感器,將人體臀部特征數字化,進而形成乘客身份識別。這項技術為汽車防盜系統提供了方案。
公司,致力于為顧客**商品的**,通過收集處理海量的**信息,**準確率高達77%,幫助顧客在購買一個產品時節約了大約100美元。mastercardd.advisor部門通過分析來自210個國家的15億信用卡用戶的650億條交易記錄,分析得出商業發展和客戶消費趨勢,如通過分析發現如果一個人下午四點左右給汽車加油的話,他很可能在接下來的一個小時內去購物或者去餐館吃飯,且在這一小時里大約花費35到40美元。
商家正可以利用這個分析結果,在加油的小票背面附加上附近商店的優惠券。
這些例子都證明了大數據蘊藏著巨大的商業價值。根據提供價值的不同**,大數據價值鏈包括三大構成部分。包括第一種是基于數據本身的公司。
這些公司擁有大量數據或者至少可以收集到大量數據,卻不一定有從數據中提取價值或者用數據催生創新思想的技能。第二種是基于技能的公司。它們通常是咨詢公司、技術**商或者分析公司。
它們掌握了專業技能但并不一定擁有數據或者提出數據創性用途的才能。比如說,沃爾瑪和pop-tarts這兩個零售商就是借助天睿公司的分析來獲得營銷點子,天睿就是一家大數據分析公司。第三種是基于思維的公司。
皮特.華登,jetpac的聯合創始人,就是通過想法獲得價值的一個例子,他通過用戶分享到網上的旅行**來為人們推薦下一次旅行目的地。對于某些公司來說,數據和技能并不是成功的關鍵。
挖掘數據的新價值的創新思維才是這些公司脫穎而出的優勢所在。
大數據成為許多公司競爭力的**,未來可能整個行業的結構會發生改變,大公司和小公司最有可能成為贏家。如今的核心競爭力在于快速而廉價地進行大量的數據存儲和處理。當然公司要根據自己的情況進行調整。
大數據向小數據時代的贏家以及那些線下大公司(如沃爾瑪、聯邦快遞、寶潔公司、雀巢公司、波音公司)提出了挑戰。同時,大數據也為小公司帶來了機遇。大數據也將會影響國家競爭力。
當制造業已經大幅轉向發展中國家,而大家都爭相發展創新行業的時候,工業化國家因為掌握了數據以及大數據技術,所以仍然在全球競爭中占據優勢,但這個優勢很難持續。隨著技術的發展,西方世界在大數據技術的優勢將會慢慢消失。對于大公司而言,好消息是大數據技術可以加劇優勝劣汰。
一旦公司掌握了大數據,它不但可能超過對手還可能遙遙領先。
文章第三部分講了大數據帶來無數好處的同時帶來的不良影響以及如何面對這些影響。包括如數據的收益的處理問題以及數據中用戶資料的隱私和決策過程帶來的影響。作者在保護個人隱私方面提出了幾種想法。
一種是使用數據時征詢數據所有個人的知曉和授權。第二個技術途徑就是匿名化。作者同時也指出了這兩種方式的難度。
一方面收集到的數據可能會被后續的多次利用。另一方面,匿名化會在數據收集越來越多和數據的相互結合關聯使用時變得無效。作者列列舉電影《少數派報告》的情節說明越來越依賴數據時,大數據可能將我們禁錮在可能性之中。
當然通過分析犯罪的常發地與常發時間,合理安排警力會對治安防范提供不小的幫助。作者還指出不能盡信數據的分析結果,因為不能保證獲取分析結果**的數據準確性。大數據在給我們生活提供便利的同時,也讓隱私保護的法律手段失去了作用。
我們必須杜絕對數據的過分依賴。
在高速邁進大數據時代的同時,人類信息管理準則需要重新定位,將帶動社會核心價值觀的轉變。大數據時代,對原有規范的修修補補已經不足以抑制大數據帶來的風險。保護個人隱私就需要對個人數據處理器對其政策和行為承擔更多責任。
同時必須重新定義公正的概念,以確保人類行為的自由。作者提出了解決這些問題的方向。如個人隱私保護方面,可以讓使用者承擔更多的社會責任。
將責任從民眾轉移到數據使用者有很多意義,也有充分的理由。因為他們更清楚將如何使用數據且是數據應用最大的受益者。關于公正方面簡單的講就是個人可以并應為他們的行為而非傾向負責。
就像公司有內部會計和外部審計人員一樣,大數據時代,公司將設置專門的人員--內部和外部算法師對大數據活動進行監督。還有可能出現第三方的機構對大數據行為進行監督和衡量。作者甚至考慮到對大數據存在的壟斷情況進行分析并在反壟斷反面給了建議。
最后結語中作者提出大數據提供給人們的只是參***,提醒我們在利用這個工具時要銘記人類的作用是無法完全替代的。
大數據時代是信息化社會發展必然趨勢,我們只有緊緊跟隨時代發展的潮流,在技術上、制度上、價值觀念上做出迅速調整并牢牢跟進,才能在接下來新一輪的國際競爭中擺脫受制于人的弱勢境地,才能把握發展的方向,沖破與西方國家的差距。對于一個國家如此,對于一個企業亦是如此。在如此快速的到來的大數據時代,我們還有很多知識需要學習,許多思維需要轉變,許多技術需要研究。
公司的規劃中,也需充分考慮到大數據對于公司的未來發展所帶來機遇和挑戰。對于掌握大量數據的公司,需要考慮有多少數字化的數據,又有哪些可以通過大數據的分析處理而帶來有價值的用途?比如國內目前的社交**,購物**等都掌握了用戶的大量的數據信息。
在大數據時代制勝的良藥也許是創新的點子,也許可以利用外部的數據,通過多維化、多層面的分析給其他企業或個人帶來價值。
? 大數據時代心得體會 ?
“除了上帝,任何人都必須用數據來說話?!薄@是《大數據》中出現的讓人印象深刻的一句話,也是全書力圖傳遞的信息。在數字信息時代,數據和空氣一樣遍布生活,對于有些人來說,數據無意義,而對于有些人來說,數據,即真相。
美國是《大數據》的主角,全書通過講述美國半個多世紀信息開放、技術創新的歷史,以別開生面的經典案例——奧巴ma建設“前所未有的開放政府”的雄心、公共財政透明的曲折、《數據質量法》背后的隱情、全民醫改法案的波瀾、統一身份證的百年糾結、街頭警察的創新傳奇、美國礦難的悲情歷史、商務智能的前世今生、數據開放運動的全球興起,以及云計算、Facebook和推特等社交媒體、Web3·0與下一代互聯網的未來圖景等等,為讀者一一細解數據創新給公民、政府、社會帶來的種種挑戰和變革。
透過全書,一個立體的美國及美國人民的思想呈現在我們面前——美國人民執著于個人隱私的保護,卻又不遺余力地推動著政府信息的透明與公開。
讀完此書,對生活中的數據及數據處理突然有了很大的興趣。如果有一天,處處以數據說話,那么,政治、制度、生活將更加清明,事故、腐朽將降到最低點。
作為信息技術教師,是有必要閱讀此書的!有慧根的教師將能從書中挖掘出信息技術特有的文化以及能用于教學的鮮活案例。
每天能用來閱讀的時間很少,總是要等到夜深疲倦時才有空打開書本,總是在眼睛極不舒服的情況下堅持閱讀,《大數據》就這樣在堅持中溶入我的思想……
? 大數據時代心得體會 ?
什么是小數據?小數據就是個體化的數據,是我們每個個體的數字化信息。比如我天天都喝一兩酒,突然有天喝完酒胃疼,我就想了,這天和之前有何不同?原來,這天喝的酒是個新牌子,可能就是喝了這個新牌子的酒所以胃疼。這就是我生活中的“小數據”,它不像大數據那樣浩瀚繁雜,卻對我自身至關重要。
第一個意識到“小數據”重要性的是美國康奈爾大學教授德波哈爾·艾斯汀。艾斯汀的父親去年去世了,而早在父親去世之前幾個月,這位計算機科學教授就注意到老人在數字社會脈動中的些許不同——他不再發送電子郵件,不去超級市場買菜,到附近散步的距離也越來越短。
然而,這種逐漸衰弱的狀態,真到醫院去檢查心電圖,卻不一定能看出來。到急診室檢查的時候,不管是測脈搏還是查病歷,這個90歲的老人都沒有表現出特別明顯的異常??墒聦嵣?,追蹤他每時每刻的個體化數據,他的生活其實已經明顯與之前不同。這種日常小數據帶來的生命訊息的警示和洞察,啟發了這位計算機科學教授——小數據可以看作是一種新的醫學證據,它是屬于你的數據。
人們愛說,大數據將改變當代醫學,譬如基因組學、蛋白質組學、代謝組學等等。不過由個人數字跟蹤驅動的小數據,也將有可能為個人醫療帶來變革,特別是當可穿戴設備更成熟后,移動技術將可以連續、安全、私人地收集并分析你的數據,這可能包括你的工作、購物、睡覺、吃飯、鍛煉和通訊,追蹤這些數據將得到一幅只屬于你的健康自畫像。
假設你是一名患者,這樣精確而個體化的小數據也許可以幫助你回答:我每次服藥應該用怎樣的劑量?當然了,藥物說明書上會有一個用藥指導,但那個數值是基于大量病人的海量數據統計分析得來的,它適不適合此時此刻的你呢?于是,你就需要了解關于你自己的小數據。
再比如癌癥治療。腫瘤細胞的DNA對不同的癌癥病人會引起不同變化。所以,對許多患者用同一個治療方法是不可能成功的。個性化或者說層次式的藥物治療是要按照特定患者的條件開出藥方——不是“對癥下藥”,而是“對人下藥”。這些個性化的治療都需要記錄和分析個人行為隨時間變化的規律。這就是小數據的意義。
當然,這并不是說大數據就不重要。從大數據中得到規律,再用小數據去匹配個人。
? 大數據時代心得體會 ?
未來的十年,將是大數據引領下的智慧科技時代。不管你是否意識到它的存在,大數據都將越來越快地改變我們這個時代,包括我們的生活方式。
維克托·邁爾-舍恩伯格是最早洞見大數據時代發展趨勢的數據科學家之一。他通過一個大家熟知的事例,來幫助我們理解“大數據”的潛在影響力,那就是四個世紀之前望遠鏡和顯微鏡的發明。望遠鏡能夠讓我們感受宇宙,顯微鏡能夠讓我們觀測微生物,它們都是收集海量數據的新工具,因為這種工具的發明,人們同步更新了分析數據的技術和方法,促進了人們對世界更好的理解。如果說望遠鏡和顯微鏡是測量領域中的一場革命,那么今天的數據測量就相當于是現代版的望遠鏡、顯微鏡。隨著社交網絡的逐漸成熟,移動帶寬迅速提升,云計算、物聯網應用更加豐富,以及更多的傳感設備、移動終端接入到網絡,由此產生的數據及數據的增長速度比歷史上的任何時期都要多、都要快。一個大數據的時代,不經意間順理成章地翩然而至。
一、什么是大數據?
大數據是當前最熱門的話題之一。但什么是大數據,人們尚未給出確切的定義。首先,“大數據”是相對過去小的、局部性的數據而言的;其次,利用大數據進行分析和工作時,所依據的關于此事盡可能完整的數據,從而“一覽眾山小”,而不是采用局部的小數據,從局部推斷整體。
維克托也并未直接給出大數據的定義。不過,他用三大轉變描述了大數據的特性:
轉變之一:在大數據時代,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不再依賴于隨機采樣。例如一項針對相撲比賽中非法操縱比賽結果的研究對64000場比賽進行了分析,這算不上一個很大的數字,但由于這是過去十年所有的比賽,所以它是大數據。
轉變之二:由于有了更多的數據,我們可以接受更多的混雜、更多數據上的不精確。如果我們對于一個事物只有50個數據點,那么每一個數據點都必須非常精確,因為每個數據點都是有用的;但是如果我們有5000萬個,去掉10個,甚至去掉1000個都沒有太大的問題。
轉變之三:不再探求難以捉摸的因果關系,轉而關注事物的相關關系。分析大數據主要為了預測未來“是什么”,而不是“為什么”。因為很多時候我們以為我們找到了事情背后的原因,實際上卻沒有找到。更多時候知道了“是什么”就足夠了。例如知道流感將會擴散到哪里就足夠了,我不需要知道為什么;知道什么時候在網上購買機票能夠獲得最優惠的價格就足夠了,我不需要知道為什么此時價格最低。
二、大數據帶來的變化
大數據從根本上改變我們認識世界和改變世界的方式。很多傳統的習慣將被顛覆,很多舊的制度將面臨挑戰。舉例來說:
第一,科學探究的思路和方式受到挑戰
探究是新課程改革中的一個熱詞,是促進學校教學與科學研究相融合的實踐舉措??茖W探究的基本路徑是:發現問題,提出假設,制定方案,實踐探究,分析數據,得出結論。之所以會梳理出這樣一個探究的路徑,與我們對問題知曉的信息過少有關。換句話說,對所要研究的事物,我們知道的數據很少,需要從這些很小的數據出發,通過猜想和假設,進行試探性的研究,如果研究得出的'結果和自己的假想是一致的,則說明我們的假說是正確的,這些假說會上升為對該事物描述的知識,我們掌握該事物的數據也隨之增加。
利用測量所獲得的點滴數據,從一個局部來推測世界是怎樣的,這是科學探究的基本思路和方式。長期以來,我們總是通過這樣的方式來認識世界,對其有宗教般的信仰。盡管我們知道,決策者總是先有了想法,才會提出假設。如果決策者自身對所研究的事情存在著偏見,所提出的假設就很難得到實證的支持,這往往會導致探究花費了很長的時間、很大的物力和財力,也常常勞而無功。但科學研究者還是堅定不移地沿著這條道路前行,學校在教學中也將其作為科學研究的基本規范來傳授。
在大數據時代,這樣的研究方式收到了極大的挑戰。先舉個事例來說吧。手機輻射是否能夠致癌?關于這個問題,無論我們的假設如何,實驗的設計都很難進行。首先,樣本選擇過少,沒有統計學上的意義;其次,不能拿人做研究對象;第三,短時間的研究很難觀察到變化。有了大數據之后,這樣的難題就可以迎刃而解了。前段時間,丹麥就進行了這樣的研究。丹麥擁有1985年手機推出以來所有手機用戶的數據庫。他們從這個數據庫中分析了1990年至2007年擁有手機的所用用戶的數據,同時,他們還收集了這一期間醫院收集的所有癌癥患者的數據,然后分析手機用戶是否比非手機用戶有更高的癌癥發病率。這兩個數據庫本身是完全獨立的,在作分析之前從來沒有想過可以做這樣的研究。結果表明,使用移動用戶和癌癥風險增加之間不存在任何關系。2011年10月,這一研究的結果發表在《英國醫學雜志》上。
上述的案例告訴我們,在獲得了大量的數據,能夠對事物的整體進行全面的認識之后,假想就沒有意義了,我們可以直接根據全面的數據做出結論。
? 大數據時代心得體會 ?
在學習數據庫和數據表創建和修改時,了解到表是建立關系數據庫的基本結構,用來存儲數據具有已定義的屬性,在表的操作過程中,有查看表信息、查看表屬性、修改表中的數據、刪除表中的數據及修改表和刪除表的操作。從課程中中讓我更明白一些知識,表是數據最重要的一個數據對象,表的創建好壞直接關系到數數據庫的成敗,表的`內容是越具體越好,但是也不能太繁瑣,以后在實際應用中多使用表,對表的規劃和理解就會越深刻。我們上機的另一個內容是數據庫的約束、視圖、查詢。從中我們了解到查詢語句的基本結構,和簡單select語句的使用,多表連接查詢。而在視圖的操作中,也了解到了視圖是常見的數據庫對象,是提供查看和存取數據的另一種途徑,對查詢執行的大部分操作,使用視圖一樣可以完成。使用視圖不僅可以簡化數據操作,還可以提高數據庫的安全性,不僅可以檢索數據,也可以通過視圖向基表中添加、修改和刪除數據。存儲過程、觸發器也是我們學習的內容之一,在操作中有建立存儲過程,執行存儲過程,及查看和修改存儲過程,這些都是非?;A的東西,但對用戶卻是非常重要的呢,只有熟悉了t_sql語言,才能更好的掌握更多的東西。我們還學習了,sql管理、數據的導入、導出、備份和還原。有sqlserver安全訪問控制;登錄賬戶的管理;數據庫角色的管理;用戶權限管理。維護數據庫的安全是確保數據庫正常運行的重要工作。數據的備份是對sqlserver數據事務日志進行拷貝,數據庫備份記錄了在進行備份操作的數據庫中所有數據的狀態。而數據的備份還分為數據庫完整備份、差異備份、事務日志備份、文件及文件組備份。做數據備份就是為了以后的數據庫恢復用。我們還做了倉庫管理數據庫,其中的要求包含了許多數據庫的對象,綜合了我們所學的許多知識,讓我們更努力的把所學到的東西運用上去。
? 大數據時代心得體會 ?
對于暢銷書、熱門話題、時尚科技,一直不是很感興趣。書刊,喜歡有一定年份的。話題,鐘情于務虛的觀點。
新奇的產品于我無緣,***用成熟的科技產品。它既不崇高也不冷漠。就是要與現實保持一定距離,留一點思考的空間。這一***近破了例。
由于工作的原因,耳濡目染,“大數據”這個新興概念開始頻繁步入我的視野。按捺不住內心的好奇,網購《大數據時代》,手不釋卷,三天讀完,頗有收獲。此書有如下特點。
首先,作者站在理論的制高點上,條理清楚地闡述了大數據對人類的工作、生活、思維帶來的革新,大數據時代的三種典型的商業模式,以及大數據時代對于個人隱私保護、公共安全提出的挑戰。其次,本文的例子貼近現實生活和時代,既給讀者留下深刻的印象,又能使讀者感同身受。此外,作者沒有使用很多專業術語,也沒有裝出專業的面孔。
縱觀全書,遣詞造句,均通俗易懂。
作者認為大數據時代具有三個顯著特點。
1、 當人們研究和分析一個現象時,他們將使用所有的數據而不是抽樣數據。
2、 在大數據時代,我們不應盲目追求數據的準確性,而應適應數據的多樣性、豐富性,甚至接受錯誤的數據。
3、 理解數據之間的相關性比探索因果關系要好?!笆鞘裁础北取盀槭裁础敝匾?。
作者指出,隨著技術的發展,數據存儲和處理的成本大大降低,人們現在已經有能力從零碎的、看似無關的數據渣中提取真實的知識。在大數據時代,三類公司將成為時代的寵兒。一是擁有大數據的公司與組織。
如**、銀行、電信公司、全球性互聯網公司(阿里巴巴、**網)。第二,擁有數據分析和處理技術的專業公司,如亞馬遜和谷歌。第三,具有創新思維的公司可能不掌握大數據,也不具備專業技術,但他們善于利用大數據,從大數據中找到自己的理想世界。
面對即將到來的大數據時代,個人將如何自由應對?這是個嚴肅的問題?!洞髷祿r代》讀后感2
去年的“云計算”炒得熱火朝天的,今年的“大數據”又突襲而來。仿佛一夜間,各廠商都紛紛改旗換幟,推起“大數據”來了。于是乎,各企業的cio也將熱度紛紛轉向關注“大數據”來了。
有一張來自《程序員》微博的漫畫很形象。我認為這幅圖真實地反映了當前中小企業云計算和大數據的現狀。
不過話又還得說回來,《大數據時代》是本好書。
當然,很多it知名人士也大力推薦,寫了好多讀后感來表述對這本書的喜歡沒看此書之前,對所謂大數據的概念基本上是一頭霧水,雖則有了解關注過現在也比較火熱的bi,覺得也差不多,可能就是更多的數據,更細致的數據分析與數據挖掘??催^此書后,感覺到之前的想法,只能算是中了一小半吧---巨量的數據,而另一前:著眼于數據關聯性,而非數據精確性,或許才是大數據與現時bi的不同,不僅僅是方法,更多的時思想方法。
不過坦白講,到底是數據的關聯性重佳,還是數據的精確性更好,還真的需要時間來檢驗一下,至少從現在的數據分析方法來論,更多的傾向于數據的精確性。
看完此書,我心中的一些問題:
1、什么是大數據?
查了查百度百科,是這樣定義的:大數據(bigdata),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的的資訊。大數據的4v特點:
volume、velocity、variety、veracity這個好像是ibm的定義吧。
從個人角度來看:海量數據和海量存儲是大數據的基本原型。
2、大數據適合什么樣的企業?
確實,大數據的前提是海量數據。只有擁有大量的數據資源,才能發現數據的相關性,通過專業化的處理,使其為企業創造價值。對于電信運營來說,像互聯網應用這樣擁有海量用戶數據的大企業在應用大數據的道路上也有著獨特的條件,但是對于中小企業來說呢?銷售訂單數據?
若非百年老店,估計數據也是少得可憐,能用的可能只有消費者數據了吧。貌似大多數廠商,用來舉例的也就是消費都購買行為分析為最多。
同樣,在公共事業類的**機構,大數據的作用也許也能很好的發揮。相反,大數據在大多數中小企業的應用似乎有點小題大做。書中說:
大數據是企業競爭力。誠然,數據是企業的核心無形資源(如果使用得當的話),但所有的數據,還是換句話說:所有的企業與大數據競爭真的合適嗎?
是否在中小企業中,會顯示得小題大做呢?
3、大數據帶來的影響
當一波又一波的it技術熱潮源源不斷地向我們鋪面而來的時候,你甚至都沒有做好準備,你都要開始迎接它所給你帶來的影響了。借助物聯網和云計算,大數據開始出現。但它到底給我們帶來了什么呢?
1)**未來書中以google成功**了未來可能發生流感的案例來開篇,表明通過大數據的應用,可以為我們的生活起一個保駕護航的指向標。實質很簡單,技術改變世界。
2)變革商業大數據所帶來的商機,同時會衍生出一系列與大數據相關的商業機遇與商業模式,數據的潛在價值會源源不斷地發揮作用可以容易想到的是未來有專門的數據收集,數據分析,數據生成的一條數據產業鏈產生。影響的,當然是it公司
3) 正如《變革思維》一書所述:因為有大量的數據作為基礎,在未來,我們可能會更加關注數據的相關性,而不是精確性。對這條,本人還是持保留意見的?!洞髷祿r代》讀后感3
現在說到新的**和互聯網,有必要提及大數據,而大數據似乎是不言而喻的。而且人云亦云的居多,不少談論者甚至還沒有認真讀過這方面的經典著作——舍恩佰格的《大數據時代》。維克托·邁爾舍恩伯格何許人也?
現任牛津大學網絡學院互聯網研究所治理與監管教授,曾任哈佛大學肯尼迪學院信息監管研究項目負責人。他的咨詢客戶包括微軟、惠普、ibm和其他全球企業。他是歐盟官方互聯網政策的真正制定者和參與者。他還曾擔任多國**的高級智囊團。這位被譽為:
大數據時代的預言家“的牛津教授真牛!那么,這位大師說的都是金科玉律嗎?并不一定,讀大師的作品一定要做些功課才好讀懂,才能能與之進行一場思想上的對話。
舍恩伯格從三個方面論述了大數據:思維變革、業務變革和管理變革。
在第一部分”大數據時代的思維變革“中,舍恩伯格旗幟鮮明的亮出他的三個觀點:
一、更多:不是隨機樣本,而是全體數據。
二、更雜:不是精確性,而是混雜性。
三、更好:不是因果關系,而是相關關系。對于第一個觀點,我不敢茍同。
一方面是對全體數據進行處理,在技術和設備上有相當高的難度。另一方面,是否有必要為簡單事實的數據分析收集所有數據?
我曾與香港城市大學的祝建華教授討論過。祝教授是通信科學研究方法和數據分析方面的專家。他認為,可以找到一種數理統計方法進行分析,并非所有的數據都是必要的。聯系到舍恩伯格第二個觀點中所說的相關關系,我理解他說的全體數據不是指數量而是指范圍,即大數據的隨機樣本不限于目標數據,還包括目標以外的所有數據。
我認為大數據分析不能排除隨機抽樣,但抽樣的方法和范圍應該擴大。
我同意舍恩伯格的第二觀點,我認為這是對他第一個觀點很好的補充,這也是對精準傳播和精準營銷的一種反思?!贝髷祿暮唵嗡惴ū刃祿膹碗s算法更有效?!案哂泻暧^視野和東方哲學思維。
對于舍恩伯格的第三個觀點,我也不能完全贊同?!辈皇且蚬P系,而是相關關系?!安恍枰馈睘槭裁础埃恍枰馈笔鞘裁础?。
傳播即數據,數據即關系。在小數據時代人們只關心因果關系,對相關關系認識不足,大數據時代相關關系舉足輕重,如何強調都不為過,但不應該完全排斥它。大數據從何而來?
為何而用?如果我們完全忽略因果關系,不知道大數據產生的前因后果,也就消解了大數據的人文價值。如今不少學者為了闡述和傳播其觀點往往語出驚人,對舊有觀念進行徹底的否定。
? 大數據時代心得體會 ?
1買回來看完的感覺是平平而已。個人看法,在五分制下,大概也就是最多打三分。這本書可以買來讀。比較完整全面。有很多情況。具有一定的參考意義。寫ppt和吹牛是有用得,但沒有什么重大意義。
很多觀點不能同意。
一、主要觀點上可以探討的地方
作者提出了關于大數據的“擲地有聲”的三個原則。這三個原則凡講大數據必被提及,很多人奉為圭臬。但是我覺得每一點都值得探討。
這三點是:不是隨機樣本,而是全部數據;不是準確性,而是混合性;不是因果關系,而是相關性。
看完之后感覺都有點不是那么回事。
1.不是隨機樣本,而是全體數據
這個說得好像人類從來就不知道使用全體數據可以得到更全面的結論,而非要去煞費苦心發展出一套抽樣技術一樣。人類早就知道處理全尺寸數據的好處,而進行抽樣分析的原因無非是兩個原因:一是處理能力跟不上數據采集能力。
作者認為人類之前主要受限于數據的處理能力而不去處理全量數據,但在目前機器處理能力有了巨大的提升的時代,限制絕大多數應用的瓶頸不是計算能力而是數據采集能力(不要去提那些極少數需要超級計算機的場合,那個和多數人無關、和本書的商業主題也無關)。但是即便如此,抽樣所要針對的很多應用場景是不太可能收集全量數據的情況。比如人口普查,不管計算機有多強大,目前仍有很多數據需要人工采集,所以這次人口普查仍需要抽樣進行。
有意思的是,作者用人口普查是抽樣分析來說明非“全量”時代我們被迫采用了抽樣,而最終也沒法說我們是否已經可以用全量數據來做人口普查了。事實上,至少就目前而言,抽樣仍是人口普查的必然選擇(好吧,你可以想象,未來每個人都會安裝芯片,你可以在ppt中告訴你的客戶和老板)。再比如我們統計里的經典問題:
怎么估算一批零件的使用壽命?怎么去分析一批奶品里的三聚氰胺?在過去,我們不能做一個完整的測試,因為這意味著這批零件將被丟棄,而這批牛奶將用于測試,所以測試結果是沒有意義的(嗯,你也可以說:
讓我們收集歷史上所有這些部分的用法,以便分析。。。。好吧,來吧,雄心勃勃的索年)?,F在呢,還是必須依賴抽樣。
即使沒有提到這些例子,也只是從邏輯上講:收集和處理數據本身的行為不斷地產生新的數據。我們又怎么證明這些數據不是你需要的“全量”的一部分呢?
作者的行文中,關于什么是“全量”,處于不斷的搖擺之中。有時指“我們需要的所有數據”,有時指“我們能收集到的所有數據”。作者舉了人口普查的例子,這個全量顯然指前者。
而在很多商業案例中,又顯然指后者。我們有能力處理越來越多的、在以前不敢想象的大量數據,但是至少目前看,我們還沒不可能說我們處理了“全量”。我們最多可以說我們能處理我們能搜集到的“全量”,但如果據此產生了我們已經沒有遺漏數據了的感覺,認為所有數據盡在掌握了,那我認為是一種很可能導致錯誤的錯覺。
2.不是精確性,而是混雜性
這個么,說得好像以前的人類在使用“抽樣”數據時竟然都認為取到的數據是“精確”的一樣。在使用采樣數據時,我們知道要容忍某些錯誤。我們甚至知道在就算取得了“全樣”數據的時候,也可能因為有各種原因而導致的不精確,統計實踐中對此有相當多的案例。
人類從來不指望我們通過數據分析得出的大多數結論是準確的。我們從來都要在信息混雜的情況下做出大多數的決策。
3.不是因果關系,而是相關關系
這是許多人(包括作者)認為的最有價值、最有意義的發現,但實際上也是最收批評的觀點。就連翻譯周濤教授也在前言中說,他不能繼續下去了。至于他,他認為如果他放棄因果關系的分析,那將是人類的墮落。我不想談這么高層次的哲學,只想從邏輯和技術的角度來討論。
計算機能給我們的結論(到目前為止,在可預見的將來)都是相關的。計算機從未提供過明確的因果關系給人類。因果關系是否是基于數據的人類判斷。
已經有相當多的應用,但也只是考慮相關性,而不是因果關系:確定因果關系需要更多的精力和投資。所以只看相關性而不看因果性也不是什么新的結論(實際上已經是個很舊的結論了)。
而這個相關性是不是可以作為決策的基礎呢?這個一樣離不開人的判斷。有一個這樣的故事:
通過大量的數據分析,慈善組織得出結論:一個國家、地區的電視機的普及率與發達富裕程度很有關系(冰箱、洗衣機、空調、高跟鞋、牛仔褲,etc.,也會和發達程度有這樣的相關性),于是他們就向貧困國家贈送了很多電視,認為此舉可以促進改過的經濟發展。
可以說,電視的普及與經濟、文化息息相關,但是實上,經濟的發展更可能導致電視的普及,反之亦然。所以,我們真的不需要因果分析嗎?說得玩笑一點:
這個世界真的不需要腦子了嗎?
作者舉了一個例子:google分析搜索關鍵字,以確定流行病可能發生在哪里。認為這就是利用了相關性而不是因果性。
這是沒有利用因果判斷嗎?現在,在投資巨大的機器資源進行分析之前,分析人師已經**,疾病的癥狀可能會導致人們上網搜索(影響搜索行為)。谷歌存儲的用戶上網信息肯定遠遠不止一個搜索關鍵字,分析師為何不開足馬力把“全量”數據、各個指標都分析一遍呢?
比如用戶上網地點?上網時間?上網頻率?
上網語言?瀏覽器版本?客戶端操作系統?
等。。。為什么它會像導彈一樣把機器資源放在關鍵詞上?
總之,為了展示新的思想,作者對這些原則過于絕對。而排除掉絕對的成分后,這些觀點也就不顯得是創新了。作者把三個數據分析人員一直秉持的原則,當做全新的東西講了出來。
時代在變,我們應該經常重新審視這些原則,以確定我們的思想是僵化的還是過時的。我同意作者重新審視這些觀點,但我認為沒有必要這么做。
二、細節論據上可以探討的地方
除了三大原則不夠令人信服外,在一些細節上,筆者的引用也不是很嚴謹。
如第51頁,對于拼寫檢查的算法的優化。作者提到,通過輸入大量的數據,四種常用的語法檢查算法的準確性有了很大的提高,說明大數據起到了一定的作用。這是一個很有啟發性的例子,可以進一步分析和研究,但是
僅僅4個例子,夠得出很有力的結論嗎?4個算法,作者沒注意到這是一個非常小的樣本嗎?不能因為這是4個用了大數據的采樣,就認為這是一個支持大數據的有力結論了吧。
(順便問一下,我想問他們:為什么不測試幾十個幾百個算法呢?是不是面對如此“大量”的計算,也只好折中選擇了一個抽樣的小樣本呢?
甚至連樣本數量是否合格都不顧上了嗎?)
三、這本書有什么用處?
對于這樣一本書,我不明白周濤教授為什么在前言中建議你每本買一本。為什么要買?難道作者理清自己腦子的過程很值得我們關注嗎?
譯序里說:“作者渴求立言立說的野心”,但是我恐怕作者是達不到這個目標的。關于作者的簡介為:
“《大數據時代》是國外大數據系統研究的先河之作,本書作者維克托·邁爾·舍恩伯格被譽為‘大數據商業應用第一人’,....早在2010年就在《經濟學人》上發布了長達14頁對大數據應用的前瞻性研究。”
總的感覺是作者有很多想法,看過很多案例(這些案例在書中有豐富的反映,也有參考價值)。但并不是一個人真的在與數據搏斗(這是我的猜測,我還沒有證實他的經驗)。請不要告訴考生他做過哪些咨詢案例,這遠沒有真正體驗到數據的折磨。
)。第183頁說道:“...執行官們信任自己的直覺,所以由著它做決定。
然而,隨著管理決策越來越受到**分析和大數據分析的影響和控制,依靠直覺決策的局面將徹底改變。..."真的會么?如果你面對某一家企業做咨詢,那可以這樣講。
采用一項新技術有可能大大提高企業的戰斗力,超越競爭對手。但作者是希望與業界對話的人。面對整個社會,我們這樣做并不嚴謹。引用一個例子:
在中國國際象棋學院的一次訓練會后,主教練馬曉春對第二天要去各自主隊參加圍攻的隊員們說:祝大家周末都能贏。棋手們笑了:
我們只有一半的人能贏啊。同樣,如果每個人都采用大數據技術,那么總會有企業在競爭中落后。而既然我們實際上無法真正分析“全量”數據,那ceo們還是會有很大的決策空間,哪怕很多決策實際上“不科學”。
最起碼,他們需要決定將有限的企業資源投入到對什么樣的大數據進行分析,并如何應用分析出來的結果。嗯....我認為,這多少還是要依賴一些直覺的。
那么大家是否應該看一下這本書呢?我的答案是應該看一看。既然大數據是當前的潮流、相關的研究/商務活動層出不窮,那么做it工作、數據工作的人對于“最好的”專著無論如何都必須看一下。
書中集中展示了很多案例,值得作為參考和啟發思維。此外,為了作為談資、為了在寫大數據ppt時有所依據,大家也得看看這本書。根據不同情況,可以對內容進行復制、粘貼、理解和重寫。
這些內容,我相信買一版也就夠了。需要提醒ppt人員的是,演示前請想清楚如何回答可能被提及的質疑。
2今天看完了舍恩伯格的《大數據時代》。如果拋開對翻譯人員的贊譽不談,我會說,這本定價50元、介紹互聯網前沿趨勢的書,價值不大,其中的一些例子在我看來不能完全歸因于大數據領域。
舍恩伯格提到的三個趨勢中的前兩個我倒是非常贊同:
1.樣本漸趨于總體;
2.精確讓位于模糊;
至于第三點,“關聯比因果更重要”,這與周濤教授的觀點是一致的,我不太同意。作為一個理工科學生,我相信一切事物背后都有原理,人類終究是要找到并且搞明白世界之所以如此運行的原因的。否則,科技發展到后來,豈非變成了巫術一般的存在?
當然作者在文中提到了人類有急于尋找因果性的沖動,而有時候找到的所謂「因果」也并非真正的因果。表面理性的人常常被非理性所迷惑,滿足于想當然的解釋。在這種情況下,片面甚至錯誤的因果性還真的沒有相關性靠譜。
但我們也不可忘了,相關性始終只是暫時的途徑,我們的終極目標還是因果性,否則,人之為人的一項根本屬性就不存在了。
這本書的另一個值得稱贊的地方就在于作者作為大數據的倡導者,并沒有一味大加褒揚,而是深刻洞察到了新的技術趨勢會帶來哪些問題。諸如個人隱私和數據**等在數據主導時代可能發生的嚴重后果,作者都給予了足夠的考慮。并且難能可貴的是,針對未來可能出現的危機,舍恩伯格還給出了具有建設性的應對之道——看了他的個人履歷后,你不得不佩服這樣一位在技術和公共政策都具有獨到見地的跨領域專家。
3兩年前,還是社會學專業的我最喜歡翹的課叫做”社會統計學”,與其聽著傳統死板的抽樣調查與回歸分析,我更喜歡和一個做數據挖掘的數學系同學四處溜達。“數據挖掘(data mining)是什么?”她跟我舉了一個最簡單的例子:
“沃爾瑪通過對超市里人們購買行為的大量數據分析,發現男人們來買啤酒的時候,通常也會買尿布。這樣的發現就讓超市將尿布和啤酒擺放在一起出售,從而提高利潤?!?/p>
“嚴謹的社會學訓練”讓我幾乎在當時就開始思考“為什么?”“尿布和啤酒的銷售量為什么會有關聯呢?是因為男人們買啤酒的時候,會‘順便’購買尿布?
還是因為買“尿布”的時候會聯想到‘’啤酒’?”——這使我立刻意識到在社會科學的學習中,因果關系已經成為了一種極其普遍的范式——甚至夸張一點說,所有社會科學的研究都只是為了解答一個問題——“為什么?”它面向過去,面向所有已經發生的事實,試圖通過信息收集和邏輯假設來說明一個道理:
”人類社會中**事情的發生,是因為**及**因素的作用。“
我意識到,這與《大數據時代》中所提出的”大數據思維“的三個層面正好截然相反:
1、不是因果關系,而是相關性。大數據思維只關注”相關性“,而不再關注因果關系。也就是說,沃爾瑪知道尿布和啤酒、手電筒與pop-tarts蛋撻的銷量具有正相關性,就足夠做出將兩個物品擺放在一起銷售的決策了。
它并不需要去分析原因,因為只要知道這件事情”正在發生“或者”即將發生“,企業就完全能夠做出正確的決定。
2、“樣本=全部”——不是隨即樣本,而是全部數據?!洞髷祿r代》也對傳統意義上的統計學構成了沖擊。在這樣一個我們有足夠強大的數據搜集和數據處理能力的時代,樣本不再是萬分之一,而轉變成了”樣本=全部“,樣本,就是萬分之一萬。
傳統意義上的統計學的隨機抽樣方法中有一條極其明智的真理:”采樣分析的精確性隨著采樣隨機性的增加而大幅提高,但與樣本數量的增加關系不大?!笨梢哉f,“樣本分析”奠定了絕大多數科學研究的基礎。
而大數據時代,全數據分析的模式將全面替代“樣本分析方式”。正如《魔鬼經濟學》(freakonomics)中,作者關于相撲運動員的研究,其創造性的觀點正式通過使用了11年中超過64000場摔跤比賽的全數據記錄來尋找到了異常性。這樣的洞見,恰恰是樣本分析所無法提供的。
3、不是精確性——而是混雜性。數據量的顯著增大也必然會讓我們付出一些代價——一些不準確的數據會混入數據庫,結果也可能不準確。這就是大數據時代的另一種思維——“不是精確性,而是混雜性”。
對“小數據”而言,最重要的要求就是減少錯誤。而在大數據的采集里,在技術尚未達到完美無缺之前,混亂是無可避的。雖然我們得到的信息不再那么準確,但收集到的數量龐大的信息讓我們放棄嚴格精確的選擇變的更為劃算。
從谷歌翻譯系統中可以看到,它收集了上萬億的語料庫,來自未經過濾的網頁內容,可能會含有不準確的用法、語病,未必每一條語料庫都非?!熬_”,然而這個語料庫是布朗語料庫的幾百萬倍大,這樣的龐大規模優勢完全掩蓋了它的缺點。也就是“大數據的簡單算法,比小數據的復雜算法,更加有效”。
總體而言,大數據時代透露出三個特征——更多、更雜與更好。它面向未來,要做的事情是關于“**”。正如作者所說"大數據要求我們有所改變,我們必須能夠接受混亂和不確定性。
精確性似乎一直是我們生活的支撐,就像我們常說的‘釘是釘,鉚是鉚’,但認為每個問題只有一個答案的想法是站不住腳的,不管我們承不承認。一旦我們承認了這個事實,甚至擁護這個事實的話,我們離真相又近了一步?!?/p>
當我們用”物聯網“去開始測量、記錄、分析,世界,并將我們的世界”數字化“的時候,information technology,信息技術的變革,就將聚光燈轉向了information的身上。
從三千多年前會計學的誕生開始,人們將大量的經濟活動”數字化“。然而,”數字化“只是為”數據化”拉開序幕。
在google的數字圖書館中,”文字“也已經被“數據化”,人們可以檢索、對比、發現不同的詞組在幾十年來中含義和運用的沿革。人可以閱讀,機器也可以分析。
在foursquare和街旁網中,“方位”也已經被“數據化”,在我們喜愛的地方”check-in“,我們通過忠誠度計劃、酒店推薦和其他計劃得到好處。
在facebook或twitter的里,"溝通"也已經被“數據化”,倫敦的金融公司通過分析每天的twitter的大量數據,以作為股市的投資信號。
而更令人興奮的是,”數據"作為一種資源,本身是一種非競爭性的資源,它的價值并不會因為被使用而減少,相反,它可能被通過不斷地重復使用而產生出更高的價值。數據本身的價值,是它所有能夠產生的可能選擇的價值的總和。書中提到了幾種數據創新:
1、數據再利用。數據的運用者常常不是那些擁有大量數據的機構,卻是那些恰好可以用這些數據來支持其商業模式的機構,這就是“再利用”
2、重組數據:將多個數據集的總和重組在一起時,充足總和本身的價值也比單個的總更大。丹麥的癌癥研究就是將所有的癌癥患者和手機用戶的數據結合起來,從而揭示兩者是否有關聯性——幸運的是,全數據顯示并無關聯。
3、可擴展數據。譬如,零售在店內安裝的監控攝像頭,不僅能認出把手,也能跟蹤經過商店的客戶流和他們停留的位置。
4、數據的折舊值:隨著時間的退役,大部分的數據都會失去一部分基本用途。然而,即使數據用于基本用途的價值會減少,但選擇的價值卻依然強大。
從這個角度,組織機構應收集盡可能多的使用數據,并保存盡可能長的時間,同時也應當與第三方分享數據,保留所謂的“延展性”權利。
5、數據廢氣:在拼寫檢查中,用戶會有大量的錯誤拼寫。這些數據看起來是廢品,但收集在一起卻能夠鍛造成一塊閃亮的金元寶。
例如,當couresa這樣的網絡平臺中一個班級數量超過萬人時,教授發現2000個學生在作業中犯了同樣的一個錯誤。修正后,系統將會提醒以后犯同樣錯誤的學生。通過這些’錯誤“,我們改變了教育的方式。
6、開放數據:**只是收集信息的托管人,而數據應當對全球開放。
在大數據價值鏈上,會有三種不同的大數據公司,第一種是基于數據本身的公司,第二種是基于技能,第三種則是基于思維。從我的理解來看,第一種人,擁有金礦的礦山。第二種就是數據分析師,也可以說,擁有開采、提煉金礦的技術。
第三種則是加工金礦的人,把金礦做成金元寶、首飾,通過創新思維讓數據具有商業價值。在大數據時代的早期,思維和技能是最有價值的,但作者認為,最終,大部分的價值還是必須從數據本身來挖掘,也就是說——金礦本身才是最值錢的。
然而,大數據背后帶來的也是重重隱憂——從我們的隱私不斷暴露,個人在網絡上留下的千絲萬縷的蹤跡似乎讓人們又回到了”老大哥在看著你“的那種擔憂?!薄皵祿y治”的登峰造極從哲學上會抹殺人的自由意志和選擇的可能性,正如,基于你以前的各類數據分析,陪審團斷定你以后將會犯罪。那將是人性面對技術的一次潰敗。
閱讀《大數據時代》的過程,總是讓我不斷地想起庫恩《科學革命的結構和范式》。毫無疑問,大數據帶來的是思維范式的根本性變革——我們將不再沉湎于歷史和過去,試圖解釋某種聯系,而是更好地覺知當下,與正在發聲的未來。
4大數據這個概念現在可說是紅得發紫,有謠傳說連**的大領導們都上了大數據的賊船,尋思著要從維克托邁爾舍恩伯格的《大數據時代》中學習如何治國理政。
筆者卻對大數據充滿了吐槽的欲望,部分是因為筆者曾經遇到過一位大數據的狂熱鼓吹者,名言是“是不是科學就看有沒有大數據,有大數據就是科學,沒有大數據就不是科學,”以及“我覺得宇宙應該是什么什么樣的,這樣比較符合我的審美?!惫P者覺得此人實在是個妄人,手里有把錘子就把一切都當成釘子……
筆者也讀過維克托邁爾舍恩伯格的《大數據時代》,也并不認為大數據全都是胡扯——大數據肯定是有用的,不過有些鼓吹者恐怕吹得有點過了。而且,大數據還是個出現沒兩年的新領域,今天認為確鑿無疑的東西明天也許就會被發現是錯誤的。
筆者也讀過一些吐槽大數據的文章,比如紐約時報專欄作者大衛布魯克斯(david brooks)的《大數據不能做什么?》大衛布魯克斯說,大數據不懂社交。數據分析擅長于分析社會關系的數量而非質量。
社交網絡的數據科學家可以分辨出6個你的同事,你一天中有76%的時間會見他們。而卻很難發現你一個一年只見兩次面的童年伙伴。更別說發現像但丁對貝特麗絲的愛情那樣,只見過兩次面就深愛上對方的情況了。
這說明并非所有的信息都能被大數據所利用。大數據會忽略很多信息,有時還是十分重要的信息。
與之類似的是,大數據不懂得背景。我們說一句話究竟是認真的還是開玩笑,是為了表達憤怒還是善意,這些都要放在復雜的背景中來理解,數據分析很難搞清楚這些。
第三,大數據會帶來大量毫無意義的偽相關。有人說,現有的數據,多的可以讓你想要分析出什么結果,就能分析出什么結果。想像一下,如果領導們發現冰激凌的銷量和****件的數量呈正相關會怎么樣?
隨著數據的增長,這種偽相關將呈指數級增長。
第四,大數據不能處理真正的大問題。大衛布魯克斯說,如果你想看一下哪些郵件對推廣活動最有效,你可以進行隨機抽取對比組樣本。進行比較。
可是,如果我們想模擬一個衰退期的經濟體。我們沒辦法去找這樣的一個對比組。我們經常會看到人們爭論什么是最好的經濟刺激政策。
而我從來沒有看到爭論的雙方能夠用數據分析說服另外一方的。而治理國家所面對的恰恰是這些大問題。另一方面,大數據也不擅長**小概率事件,像**什么時候會發生**,什么時候會發生恐怖襲擊,什么時候會發生革命這種事,數據分析是無能為力的。
第五,數據偏愛潮流,忽視創新——這對領導們來說倒是無所謂的,因為領導們本來就不想要創新。創新對官僚體制來說是件很糟糕的事,有創造力的官僚體制往往會把自己搞垮掉。
最后,原始數據其實并不原始,原始數據往往會被扭曲。對領導們來說,他們所面對的一大問題就是:他們不可能一邊封網一邊還能收集到真實客觀的原始數據。
封網和收集真實數據是彼此矛盾的。封網本來是想欺騙別人,最后卻可能只是騙了自己。
上面是大衛布魯克斯的吐槽和筆者的評論。筆者也有自己的話要說,主要是關于大數據中不管因果只看相關的數據分析方法。
《大數據時代》說,我們知道什么藥能治什么病就足夠了,不必知道為什么。從這句話中,我們可以看出該書的作者對因果關系的理解有誤:統計學上說知道因果關系是指我們高度確定(>95%)某一件事導致了另一件事的發生,而不是說我們知道這種關系背后的原理。
換句話說,我們說某藥能治某病,這本身就是一種因果關系,無論我們是否知道治病的原理。如果二者之間只有相關關系,我們恐怕就只能說些類似“某種藥物的攝入量與某種疾病的發病率之間存在負相關”的話。
因果關系還是相關關系,對我們來說有什么區別嗎?區別就在于如果我們只知道兩組數據(例如冰激凌銷量和****件數量)之間存在相關,那么我們或許可以利用這種相關(例如一旦發生****件就趕緊推車上街賣冰激凌),但是如果想要改變現狀,恐怕還是需要知道因果關系才行(禁止冰激凌就能夠把****件消滅在萌芽狀態嗎?誰知道?!
只知道相關關系并不能保證這一點)。企業一般只需做到前者就能賺到錢,可是想要管理社會的話,只知道相關大概是不夠的。
說到底,大數據是一座礦山,我們能夠從中挖到些什么東西是不確定的。對企業來說,只要挖到了東西,賺到了錢,它們也就滿意了;如果什么都挖不到,它們也只能怪自己運氣不好。但是如果**想要大數據給它提供“不發生任何意外事件”的安全保證,那么這種保證恐怕是大數據無法提供的。
另一方面,大數據也解決不了官僚體制內部溝通不暢、派系斗爭和動機缺乏等等問題。
最根本的問題恐怕還在于**的脆弱性:**想要穩定,因為變化幾乎肯定會對它有害;而市場擁抱變化,因為它總是能夠從變化中獲益。這兩種不同的心態或許決定了數據所能給它們帶來的意義。
5 第一部分:精彩句子賞析
第1句:世界的本質就是數據。(pⅴ)
感悟及喜歡的原因:現今的我們正處于一個時代轉型中,有誰會想到富士、柯達膠卷這樣的百年企業會被時代所淘汰,因為科技的發展與互聯網的日益強大,數據將逐步取代舊事物,創造出新事物。
第2句:這是當今社會所獨有的一種新型能力:以一種前所未有的方式,通過對海量數據進行分析,獲得巨大價值的產品和服務,或深刻的洞見。(p4)
感悟及喜歡的原因:數據可以反映出很多項指標,特別是海量數據的處理下,如何挖掘獲得價值更是需要一種具有新型的復合能力人才,而得以用數據改變對世界的認知、改變市場、改變關系。
第3句:大數據的核心就是**。(p16)
感悟及喜歡的原因:以前單純依靠人類判斷力的領域都會被計算機系統所改變甚至取代,運用大數據的處理與分析,為我們的生活創造出前所未有的可量化的維度。
第4句:大數據是指不用隨機分析法這樣的捷徑,而采用所有數據的方法。(p39)
感悟及喜歡的原因:“總體=樣本”以前是做不到的,現在對于數據的儲存、處理能力、統計技術與數據資源等各方面都有了飛速的發展,信息總量的變化也導致量變到質變的飛躍,并在其中去捕捉隨機抽樣所無法揭示的細節。
第5句:要想獲得大規模數據帶來的好處,混亂應該是一種標準途徑,而不應該是竭力避免的。(p60)
感悟及喜歡的原因:處理海量數據會不可避免地導致部分信息的缺失,錯誤并不是大數據固有的特性,而是一個亟需我們去處理的現實問題。目前,我們正經歷著從數據的精準性到總體即樣本的關注焦點轉變,分析其多樣式與相關關系是這種缺陷的彌補方法。
第6句:局限于狹隘的小數據中,我們可以自豪于對精確性的追求,但是就算我們可以分析得到細節中的細節,也依然會錯過事物的全貌。(p66)
感悟及喜歡的原因:尋找數據間的關聯并利用,才是大數據超過小數據時代的真正價值。
第7句:大數據的相關關系分析法更準確、更快、而且不易受偏見的影響。建立在相關關系分析法基礎上的**是大數據的核心。(p75)
感悟及喜歡的原因:只用知道是什么,不用知道為什么,相關關系幫助我們更快、更好地了解了這個世界。
第8句:數據化是指一種把現象轉變為可制表分析的量化形式的過程。數字化指的是把模擬數據轉換成用0和1表示的二進制碼。(p104)
感悟及喜歡的原因:計量和記錄一起促成了數據的誕生,它們是數據化最早的根基。數字化帶來了數據化,但是數字化無法取代數據化,因為數字化是把模擬數據變成計算機可讀、可處理的數據,和數據化有本質上的不同。
第9句:**給我們知識,而知識賦予我們智慧和洞見。(p117)
感悟及喜歡的原因:雖然數據的使用還遠未成熟,但是從潛在的數據中挖掘出巨大的價值,然后揭示出新的深刻洞見,是我們思維方式的發展,同時也是智慧的開啟。
第10句:“現實挖掘”這里指的是通過處理大量來自手機的數據,發現和**人類行為。(p118)
感悟及喜歡的原因:麻省理工學院**實驗室通過分析每個人去了哪里、見了誰,成功地區分出了感染了流感的人群,而且在感染者還完全不知道自己已經患病之前就做出了區分。比如,伊格爾通過研究關注家庭主婦平均每周去幾次洗衣店,來試圖回答疾病如何傳播和城市如何繁榮。
再比如twitter通過創新,讓人們能輕易記錄以及分享他們零散的想法從而使情緒數據化得以實現。這種種都說明,通過讀取、分析數據,我們可以找出很多相關關系,讓我們對世界、對生活有更深刻的理解。
第11句:將世界看作信息,看作可以理解的數據的海洋,為我們提供了一個從未有過的審視現實的視角。它是一種可以滲透到所有生活領域的世界觀。(p126)
感悟及喜歡的原因:隨著時代的發展,數據逐漸可以量化一切。數據的價值也從最基本的用途轉變為未來的潛在用途。
另外數據不同于物質性的東西,它的價值不會隨著它的使用而減少,而是可以不斷地被處理、再利用,挖掘出更大的未來價值。
第12句:數據的潛在價值有三種最為常見的釋放方式:基本再利用、數據集整合和尋找“一份錢兩份貨”。而數據的折舊值、數據廢氣和開放數據則是更為獨特的方式。(p135)
感悟及喜歡的原因:通過數據處理、創新再利用來發揮出現實價值,如搜索關鍵詞、推薦引擎、**住宅的價值、設計店面的最佳布局、判斷營銷活動的有效性等等,從戰爭中學習戰爭,從數據中學習數據。
第13句:他們思考的只有可能,而不考慮所謂的可行。(p166)
感悟及喜歡的原因:內行與外行最大的區別在于思維不受限,它讓思維方式有更好的延展性、多樣性與豐富性。
第14句:一旦得以有效利用,大數據就可以變革公司的贏利模式和傳統交流方式。(p170)
感悟及喜歡的原因:大數據的利用,可以重新定位生產商與供應商的關系;可以通過商品本身收集數據并傳回制造商進行研究與開發;可以通過用戶交互提高服務;當文字變成數據,不僅人可以用之閱讀,機器也可用之分析……充分說明,第一,個人也好,公司也好,都需要與時俱進;第二,大數據的多樣性有待于更全面的開發,更好地服務于人們的生活。
第15句:大數據公司的多樣性表明了數據價值的轉移。(p176)
感悟及喜歡的原因:隨著數據價值轉移到數據擁有者手上,傳統的商業模式同時也被顛覆了。數據不僅能夠優化生活和服務,甚至還能催生新的行業,催生新時代的人才。
第16句:行業專家和技術專家的光芒都會因為統計學家和數據分析家的出現而變暗,因為后者不受舊觀念的影響,能夠聆聽數據發出的聲音。(p180)
感悟及喜歡的原因:學會聆聽數據發出的聲音,第一需要與時俱進,跟上時代進步的步伐。第二改變了我們怎樣看待知識的價值。
第三了解到,如今不只是專業技能的深度很重要,大數據的廣度也變得很重要。
第17句:卓越的才華并不依賴于數據。(p212)
感悟及喜歡的原因:大數據的風險是數據主宰一切的隱憂,但是個人的直覺、對市場的敏銳度等獨特個體所展現出來的才華同樣重要,它所呈現出來的強有力的創造力不亞于大數據。
第18句:變革并不止于規范。(p219)
感悟及喜歡的原因:大數據的運作是在一個超出我們正常理解的范圍之上的。大數據需要被監測并保持透明度,加上使這兩項得以實現的新型專業技術和機構。
我們要發展,就必須先有其規模,在規模中去尋找規范的操作手法,才能讓變革立于不敗之地。
第19句:莎士比亞曾寫道:“凡是過去,皆為序曲?!保╬244)
感悟及喜歡的原因:過去的每一點每一滴是為明天的開始打下堅實的基礎,一貫如是地堅持下去才有效力。
第20句:大數據提供的不是最終答案,只是參***,為我們提供暫時的幫助,以便等待更好的方法和答案出現。(p247)
感悟及喜歡的原因:大數據是一種資源,也是一種工具,這里引用一句話“混亂構成了世界的本質,也構成了人腦的本質,而無論是世界的混亂還是人腦的混亂,學會接受和應用它們才能得益?!?/p>
第二部分:讀后感
這本書解釋了我們正處于大規模生產、分享和應用數據的時代,告訴我們如何科學的應用大數據,開啟新的思維模式,新的生活方式與新的工作形態,以應對正在發生著的利益與風險。
★大數據開啟了一次重大的時代轉型。
? 大數據時代心得體會 ?
很榮幸在學校田主任的帶領下參加了奎屯教育局舉辦的班主任技能大賽。雖然活動已經告一段落,但那一幕幕精彩的畫面至今讓我不能忘懷。感謝學校給我提供這個學習、交流的機會。本次大賽分為三個部分:一是教育故事敘說;二是情景答辯;三是才藝展示。
通過觀看,我發現班主任技能大賽中的每一個環節大家都精心的準備了很多遍,每一個環節的內容都令我回味無窮。給我印象最深的是第一環節,教育故事的敘說,聽著大家講述著各自的教育經歷,感受著她們的喜怒哀樂,我都被深深的感動著。我想比賽的結果已經不是那么重要了,班主任的工作有時用語言是無法言表的,作為班主任我們都能感受到彼此的辛苦和甜蜜!
選手僅僅用10分鐘的時間將自己的教學故事敘述出來,他們的教育智慧就在這短短的一刻時間里,體現的淋漓盡致,把會場的氣氛帶到了一個情感的世界里,選手們把自己在教育過程中那感人的故事,用準確的語言逼真的講述著,從非常鮮明和細微之處把感情色彩演繹的既通俗又不失幽默。
在情景答辯的過程中,我感動優秀班主任教育能力的高強,字字句句又體現了他們對教育事業的愛、對孩子們愛,對生活的愛。而賽場本身就充滿著和諧關愛??吹贸鏊麄儗Π嘀魅喂ぷ鞯氖炀毘潭?,根據所抽到的具體內容,進行主題分析,學情分析、確立活動目標、重難點等,后預設達到的效果。各種主題的答辯都很貼近學生的生活、學習和不同年級學生的心理特點;充分體現民主、平等、融洽和諧的人文氣息,重視對學生動機、興趣、習慣、信心、等非智力因素的培養,有一定的感召力和感染力。優秀的班主任都能用有節奏感的,清晰簡捷的語言把答辯設計流暢的、整的敘述出來,真是讓我贊嘆不已。
優秀的班主任大多是多才多藝,或琴棋書畫,或說唱彈跳;裝扮或高雅、或活潑,總能讓美在學生中間閃耀。他們懂得生活,熱愛生活,他們勇敢,且堅韌不拔,他們懂得用智慧武裝自己,他們不會放過任何一個推銷自己,鍛煉自己,充實自己的機會。學生喜歡和崇拜這樣的麻辣老師,就自然地親其師信其教。給我印象較為深刻的是模仿電影“一個都不能少”的那個老師的語言能力和有感情的朗讀的能力,真是我學習的楷模。
本次比賽自己收獲很大:老師們的從容、淡定、睿智讓我明白成功來源于多年的積累和準備,老師們多才多藝的一面更讓我懂得“厚積薄發”的道理——有厚積才有薄發。同時也讓我明白新時期的班主任們,既然選擇了這份職業,就要風雨兼程,疲倦了但不懈怠,讓智慧和堅強伴隨著大家在教育這片廣袤的沃土中徜徉!
-
更多精彩大數據時代心得體會內容,請訪問我們為您準備的專題:大數據時代心得體會
