《數據分析簡史∶從概率到大數據》 項亦子 著 上海科技教育出版社出版
■項亦子
“數據是21世紀的石油,而分析則是內燃機。”這是Gartner研究院高級副總裁彼得·桑德加在一次報告上的講話觀點。沒有內燃機,石油也僅是埋在地下的一堆烴化物;沒有分析,數據也就是磁盤中的二進制。數據分析作為一個日益重要的科學領域,成為了人工智能時代的基石。如今大紅大紫的人工智能ChatGPT其基本算法來自于深度學習和強化學習,而ChatGPT的訓練則是用了大數據和大算力。科學家司馬賀曾給出如下定義:“如果一個系統能夠通過執行某個過程改進它的性能,這就是學習。”而所謂“訓練”則是為了讓人工智能歸納出模型而提供大量的數據讓它學習。總的來說,人類創造的人工智能如今能達到這個地步,與數據分析學科的一步步進階是分不開的。要想在AI領域有所建樹,學習數據分析是必由之路。
數據分析不僅僅是人工智能的基礎,它現在還被運用于各個領域。我們正一腳跨入的這個人工智能時代,數據無處不在,不僅僅科技領域帶來了大數據,商務世界也每天都在產生海量數據——金融領域利用數據對風險進行管控,外貿領域利用數據對買方賣方信用度進行考察。日常生活中處處有數據,刷手機時有大數據推送,上網買書時有網站的推薦系統,看足球比賽時有實時數據統計。了解數據分析的簡要歷史,能讓你輕松愉快地走近數據分析的世界。
數據分析和科學是分不開的,它一直輔佐著科學的發展,伴隨科學成長。我們回顧歷史,人類科學史上歷經了三個階段:被動地接受大自然賜予的一切并且探索客觀規律;研究信息并且用仿真模擬探索自然;研究主觀世界和人工智能。這三個階段科學和數據分析是保持同步的。
統計學家拉奧曾經說過:“在終極的分析中,一切知識都是歷史;在抽象的意義下,一切科學都是數學;在理性的世界里,所有的判斷都是統計學。”對于數據分析的重要組成部分——統計學,《數據分析簡史》一書將數據科學三個最重要的歷史階段和兩次統計學革命娓娓道來。從文藝復興起在距今500多年的歷程里,數據科學領域出現了一個接一個的才俊,從天文學家開普勒、神秘的牧師貝葉斯,到模糊數學開創者扎德、分形幾何大師芒德布羅,他們所開創的天文數據統計、主觀概率、分形統計……從不同角度對標準統計學作出了突破。最后就到了如今的時代,統計學習刮起了統計學革命的風暴,和大數據一起為即將到來的人工智能時代打下了基礎。
《數據分析簡史》中所舉的例子多是輕松的話題,比如世界杯、房價、股市、旅游、婚戀等。書的正文以故事為主,數學概念和公式集中放在了每章末尾的注釋中。沒有專業數學知識背景的讀者可以選擇跳過注釋部分,輕松讀懂本書,而對具體數學推導過程有興趣的讀者,又可以在注釋中解惑。
近年來,互聯網、大數據、云計算、人工智能、區塊鏈等技術加速創新,日益融入經濟社會發展各領域全過程,各國競相制定數字經濟發展戰略,出臺鼓勵政策。數字經濟發展速度之快、輻射范圍之廣、影響程度之深前所未有,正在成為重組全球要素資源、重塑全球經濟結構、改變全球競爭格局的關鍵力量。
《數據分析簡史》在此時問世,也算是做了一點微末的科學普及的貢獻。
- 2023-08-01《中國共產黨軍事工作重要文獻選編》出版發行
- 2023-08-01第31屆全國圖書交易博覽會在山東舉辦
- 2023-08-01【動態】文學評論專著《時空印記》出版
- 2023-08-01探索新時代軍人心靈秘密