Julia資料科學與科學計算
作  者╱
杜岳華、胡筱薇
出版社別╱
五南
出版日期╱
2019/12/01   (1版 1刷)
  
即日起五南舊官網僅提供書籍查詢,如欲購書,請至五南新官網 https://www.wunan.com.tw/
I  S  B  N ╱
978-957-763-731-4
書  號╱
1HAH
頁  數╱
336
開  數╱
20K
定  價╱
480

※書籍推薦人
R社群主持人、微軟最有價值專家 孫玉峰   專文推薦
LinkedIn 大數據總監 管其毅    齊聲推薦
※推薦文
在這個日常生活幾乎離不開各種軟體的時代,一波學習程式的熱潮正在展開;而學習程式最好的方式之一,就是參與技術社群:除了在各個社群中常常會舉辦各種程式相關的教學及分享以外,跟技術開發者們交流的機會是能夠讓人學習到最多的。
在這些年主持以及參與了這麼多社群活動之後,相較於台灣大多數的技術社群,由岳華發起的 Julia Taiwan 特別有股親切感。可能是因為跟我們 Taiwan R User Group 一樣,在被應用的領域和早期使用者的組成都有著比起其他程式語言更多元、更不「資工本科」的味道;同樣的,在東吳大學積極推動巨量資料以及資料科學人才培育的筱薇老師,也帶領更多非資訊本科系的學子們認識資料科學的價值。
在這樣龐大的熱情以及專業下所誕生的這本教材,相信能延續《Julia程式設計:新世代資料科學與數值運算語言》的優點,成為深入學習Julia 這個新興語言的最佳利器:不管是基礎的資料科學概論、轉換與計數,到進一步的資料處理、決策、科學運算和最近的熱門主題「機器學習」,本書可說是無所不包。一起來體驗「如 Python 般的程式撰寫,如C 般的運算效能」的 Julia 吧!

Taiwan R User Group 社群主持人
Microsoft Most Valuable Professional 微軟最有價值專家
現任 MoMagic 資深資料科學家
孫玉峰

杜岳華

Julia Taiwan 發起人,陽明大學生物醫學資訊所碩士,成功大學醫學檢驗生物技術學系及資訊工程學系雙主修,工研院人才培訓中心機器學習課程講師。熱愛數學、電腦科學及自然科學,希望成為計算生物學家,為開源軟體貢獻者。

胡筱薇

基督徒,Data Lab 創辦人,為中央大學資訊管理所博士,美國普渡大學克蘭納特管理學院訪問學者;現為東吳大學巨量資料管理學院副教授,且擔任台灣人工智慧學校講座師資;機器學習、資料探勘、社群網路、智慧商業為主要研究項目;近年來,致力於協助企業建立數據團隊並培育資料科學人才。

推薦序
作者序一
作者序二

PART 1 資料科學基礎
Chapter 1. 資料科學概論
Chapter 2. 玩轉資料
Chapter 3. 認識資料
Chapter 4. 看看資料
Chapter 5. 資料轉換與計數
Chapter 6. 了解資料的意義

PART 2 從資料到模型
Chapter 7. 進一步的資料處理
Chapter 8. 用資料做決策
Chapter 9. 科學運算:由已知關係求解
Chapter 10. 機器學習:由雜訊資料建立關係

PART 3 進階方法
Chapter 11. 模型的最佳化方法
Chapter 12. CUDA 程式設計

論文統計分析實
務:JASP的
運用
質性研究的五種
取徑
選擇權商品模型
化導論:使用P
ython語言
(附光碟)
NVivo 1
1與網路質性研
究方法論
用JASP完成
論文分析與寫作
(完整版)
財務管理與Py
thon實現




工業時代的科學基礎強調的是確定性和可預測性的機械論。但是從20世紀初開始,我們逐漸從工業時代進入資訊科技時代,再由資訊科技時代邁入資料科技時代(IT to DT),物理學家們意識到不連續性、不確定性是我們這個世界的本質,如果依然使用傳統機械論的方法解決問題,不僅會遇到各種限制,而且可能會出現認知偏差,。如果問你DT時代最顯著的特徵是什麼?你可能會說是計算機、智慧裝置、訊息過載、大數據、人工智慧等等,這些都沒有錯,但這些都是表象!其實,DT時代的最大特徵就是不確定性。如果工業時代的科學基礎強調的是確定性和可預測性的機械論,那麼在DT時代的科學基礎強調的是不確定性的資訊理論 (information theory)。資訊理論就是這半個世紀以來,人類對抗不確定性,最重要和有效的方法論。如同騰訊前副總裁、Google研究員吳軍博士吳軍老師說的,今天的人,已經無法通過掌握幾條不變的規律,工作一輩子;也難以通過理解幾條簡單的人生智慧,活好一輩子,一個通用規律就能解決一切問題,一個標準答案就能讓人一勞永逸的時代,一去不復返了。例如我們今天很多大學生畢業後不知道自己該繼續年研究所,還是去工作,又該選擇什麼樣的工作,好像之前校園裡教的經驗正在逐漸失效,這是因為,我們所處的時代充滿了不確定性。除了年輕人的學業和畢業的不確定性,對比我們這一代人的生活和上一代人父輩的生活,我們必須承認今天各種的不確定性大了很多。就拿理財來說,上一代人父輩們只要把錢存到銀行吃利息就可以了,它的收益非常確定,但是今天這顯然不是好的做法,而投資到任何地方都顯得非常不確定。當然有人會說過去也在變,但是牛頓時代大家看到的變化是連續的,而今天經歷的常常是非連續的,或者說是跳躍性的變化。不確定性加上跳躍式變化,才讓大家感到格外焦慮。

那對付不確定性的方法是什麼呢?
20世紀初機率論和統計學的成熟,使人們得以把握隨機性。而在1948年,另一位科學天才克勞德·香農(Claude Shannon)發表了論文《通信的數學原理》,他是資訊理論的創始人,資訊理論就是通信的理論,也是一種方法論。我們今天常說的大數據思維,其科學基礎就是資訊理論。我們知道,對於一個你一無所知的黑盒子,要想了解裡面的狀態,就需要資訊(Information),這是資訊理論最基本的思想。用比較專業一點的話講,叫做消除不確定性。今天人工智慧是一個熱門話題,其實就是在利用更多資訊,消除不確定性。計算機的智能是如何產生的?它在機理上其實和人類的智能沒有半點關係。

事實上,今天的計算機只是在那些能夠利用數據消除不確定性的問題上,表現得比比人類優異。例如大家所熟悉的應用「下圍棋」,對計算機來說,就是在最多361個點位選擇一個地方落子,是一個361選1的問題;而對於語音識別,就是在多個發音相似的單詞中選一個最相似的,人臉識別呢,則是在幾百萬人的頭像中選一個最相似的。至於新聞的推薦,也是從若干篇新聞中匹配一些你感興趣的。這些難題的答案其實都是從資訊理論中來的。上個世紀70—80年代,作為資訊理論專家Frederick Jelinek和他的同事們提出了數據驅動的解決人工智慧問題的方法,並且在識別語音、翻譯語言等領域獲得了巨大的成功。

當Dr. Claude Shannon找到了不確定性和信息的關係,從此為人類找到了面對不確定性世界時的方法論,也就是利用資訊消除不確定性,這是DT時代下最重要的方法論,是資料科學中最重要的理論之一,我們今天講的大數據思維,從本質上講,就是這種方法論的應用。在此基礎下,當我們回溯歷史,就可以理解數字和文字的誕生其實就是對資訊編碼的過程,而在今日充滿不確定性的時代中,當面對多條訊息猶豫不決時,其實是我們需要的是有效找出不同維度的資訊,以及組合優化的方法,而這也就是資料科學的核心。