|
踏上生成式AI自學之路:從底層技術、程式實作到企業應用
|
|
|
作 者╱
|
曾瀚平
|
出版社別╱
|
五南
|
出版日期╱
|
2025/04/22
(1版 1刷)
|
|
I
S B N ╱
|
978-626-423-168-8
|
書 號╱
|
1F0K
|
頁 數╱
|
240
|
開 數╱
|
20K
|
定 價╱
|
520
|
|
|
|
 曾瀚平
學歷 國立陽明交通大學 資訊管理所 博士生 國立中央大學 資訊管理所 碩士
經歷 東吳大學 資料科學系 兼任講師 工業技術研究院 網路流量分析顧問 國家科學及技術委員會 專題研究計畫助理 國家科學及技術委員會 千里馬計畫訪問學者
專長領域 資料科學、AIoT、電子商務、網路流量分析
著作 《指尖下的大數據:運用Google Analytics發掘行動裝置裡的無限商機》 《Google Analytics 疑難雜症大解惑:讓你恍然大悟的37個必備祕訣》
獲獎 2024 台北大眾捷運股份有限公司 捷運盃黑客松競賽──黑捷客獎 2020 聯發科技 智在家鄉數位社會創新競賽──潛力獎、最佳地氣獎 2017 行政院農委會農業創新黑客松競賽──農友好神獎
|
序言
1從AI 到生成式AI 1-1 生成式AI 的演進 1-2 生成式AI 的應用 1-3 生成式AI 的挑戰
2生成式AI 先備知識 2-1 機器學習 2-2 深度學習 2-3 自然語言處理與理解 2-4 文字轉向量 2-5 大型語言模型 2-6 RNN 遞迴神經網路 2-7 LSTM 長短期記憶模型 2-8 GAN 生成對抗網路
3 Transformer 深入淺出 3-1 Transformer 簡介 3-2 Transformer 輸入 3-3 Transformer 編碼器 3-4 Transformer 解碼器 3-5 Transformer 輸出 3-6 Google Titans 模型 3-7 DeepSeek R1 模型
4提示工程 4-1 提示工程簡介 4-2 指令微調(Prompt-Tuning) 4-3 上下文學習(In-Context Learning) 4-4 大模型微調(Fine-Tuning) 4-5 思維鏈(Chain of Thought) 4-6 客製化指令
5實作檢索增強生成 5-1 前置作業 5-2 準備目標檔案 5-3 切割目標檔案 5-4 建立向量資料庫 5-5 檢索合適的回答 5-6 問答 5-7 聊天
6實作網站智能客服 6-1 工具準備 6-2 建立主機空間 6-3 建立網站 6-4 編輯網頁 6-5 網站上網 6-6 建立系統後端 6-7 建立系統前端
7企業導入生成式AI 7-1 人工智慧原則 7-2 企業面臨的挑戰 7-3 生成式AI 的導入流程 7-4 未來趨勢—AI 代理
結語
|
|
|
|
 1-1生成式AI 的演進 「人工智慧(Artificial Intelligence, AI)」一詞,最早可追溯至1950 年英國數學家艾倫.圖靈發表的論文Computing Machinery and Intelligence。在這篇論文中,圖靈提出機器具備思考能力的可能性,開啟了人類對智慧機器的無限想像。然而,這一概念在當時並未受到廣泛關注。直至1956 年,美國新罕布夏州的一場「達特茅斯會議」上,「人工智慧」一詞才被正式確立,標誌著AI 革命的開端。隨後,全球學者紛紛投入研究,探索如何讓機器模擬人類的思維與行為,以解決現實問題。因此,1956 年也被公認為人工智慧的元年。
到了1970 年代,人工智慧的研究遭遇重大挫折,人們逐漸意識到機器在解決問題上的能力存在極大限制。以史上首個聊天機器人「Eliza」為例,雖然它號稱能夠與人類交流,但實際上並無法在互動中學習新知識。Eliza 只能依照一套固定規則,根據人類輸入的文字訊息進行簡單的排列組合,再產生回應,從而營造出機器能夠理解對話的假象。當時的困難主要源於電腦運算能力不足,導致資料處理速度過慢,進而限制了AI 的發展。此外,數據資源與先進演算法的缺乏也使人工智慧的進步步履維艱。正因如此,1970 年代成為人工智慧領域的第一個寒冬期。
1980 年,隨著專家系統(Expert System) 的出現,人們對人工智慧研究的熱情再度被點燃。專家系統是一種模擬專家決策的AI 應用,旨在幫助機器處理特定領域的決策問題。人類史上第一套專家系統「DENDRAL」應用於化學領域,可以根據質譜數據快速推斷並識別化合物的結構。DENDRAL 主要由「知識庫」和「推理演算法」兩大部分構成。知識庫就像是一個龐大的資料庫,內含人類所有已知的化學知識,建置過程需耗費大量的人力和資源;推理演算法則是一套模擬專家思維的運算邏輯,用來執行推理與決策。然而,當時的數據收集和計算成本極為昂貴,專家系統在短期內無法產生顯著的經濟效益。最終,這種高昂的投入與有限的回報導致人工智慧領域再度陷入低潮,進入第二波寒冬期。
隨著時間推移,硬體與軟體技術的迅速進步讓電腦運算速度大幅提升、成本顯著下降,並且配合演算法領域的卓越研究成果,人工智慧領域逐漸走出低潮,迎來第三波熱潮。1997 年,IBM 公司推出的西洋棋專用超級電腦Deep Blue 成為焦點。Deep Blue 每秒可計算高達2 億步棋步,並根據當前局勢預測未來12 步棋的勝率,動態調整策略,最終擊敗了當時的西洋棋世界冠軍,轟動一時。2014 年,Google DeepMind 則選擇挑戰複雜度更高的圍棋,開發出名為AlphaGo 的AI 圍棋軟體,並準備與人類頂尖棋手對決。
雖然AlphaGo 在初期的勝率不低,但仍難以穩定擊敗人類。然而,隨著AlphaGo 的學習能力持續提升,它在2017 年最終戰勝所有人類對手,登上圍棋世界的頂峰。無論是Deep Blue 還是AlphaGo 的成就,都讓人類開始對人工智慧充滿無限的想像,甚至產生疑慮:人工智慧是否有朝一日將威脅到人類的生存?
到了2022 年,人工智慧已不再是遙不可及的夢想,也不僅限於學界或業界的概念性產品。2022 年11 月30 日,OpenAI 正式推出了一款人人可用的AI 應用:ChatGPT,一個真正的「殺手級」應用。相信許多讀者都有使用ChatGPT 的經驗,並在首次互動中對它的智能應答感到驚豔。簡單來說,ChatGPT 能夠根據人類的提問生成符合情境、有意義的回應,彷彿具備了「意識」般的互動能力。
這種便捷、自然的互動模式,讓人們在短時間內切身感受到人工智慧的強大,因此在上線後短短五天內便引發轟動,吸引了超過100 萬人註冊。更令人驚嘆的是,僅僅兩個月後的2023 年1 月,其月活躍使用者人數突破1億人次。這一現象標誌著人工智慧應用的進化,生成式AI的時代正式到來!
1-2 生成式AI的應用 生成式AI(Generative AI, GenAI)是人工智慧的一個重要分支,能依據指令生成各種內容形式,包括文字、圖片、影像和聲音等,這些生成的內容即稱為AIGC(AI Generated Content)。例如大家熟悉的ChatGPT便是以生成文字內容為主的GenAI應用,其產出的文字內容即屬於AIGC。隨著2024年開源模型的廣泛使用,GenAI的應用開啟無限可能,成為各行各業關注的焦點。在本章節中,筆者將依序從商業、教育、醫療等不同面向,探討GenAI的實際應用。
一、商業 在商業領域,GenAI已展現出高度價值。例如,工藝品零售商Michaels Stores推出了一個GenAI平台,可根據不同的客群生成客製化的產品資訊,提升顧客互動並推動合適的銷售策略。這項創新使推播活動的個性化程度從20%躍升至95%,同時讓簡訊和電子郵件活動的點擊率分別提升了41%和25%。
旅遊平台Expedia Group也將GenAI整合至應用程式中,為旅客提供類似旅行專員的服務體驗。不僅搜尋航班和住宿更加便捷,旅客還能直接向AI助手請求旅行建議,從航班到酒店和景點推薦,一應俱全。Expedia更對AI進行額外訓練,結合平台上的航班數據,動態追蹤價格變化,幫助旅客在最佳時機完成機票預訂,進一步提升消費的價值感受。
世界最大的零售企業Walmart則在其網站上建立了基於GenAI的新型搜尋引擎,讓消費者透過情境描述即可快速找到所需產品。假設消費者希望為熱愛小熊維尼的朋友舉辦生日派對,GenAI便能依據描述呈現相關商品清單,例如小熊維尼的氣球、派對套裝和主題音樂,甚至會根據預算篩選出最佳組合。這種由「滾動搜尋」轉為「目標搜尋」的方式,為消費者帶來了全新的購物體驗。
美國二手車零售商CarMax 則運用GenAI 優化消費者評論的閱讀體驗。對於一款擁有數萬則評論的車型,消費者通常難以迅速掌握要點,透過GenAI 技術,這些評論可被精簡為數句關鍵摘要。若以傳統方式處理,CarMax 預估此任務需耗時11 年,但有了GenAI,僅需幾個月即可完成,而且生成內容的品質還超乎預期。
二、教育 GenAI 也對教育領域帶來顯著變革。對學生而言,GenAI 能提升閱讀文獻的效率,幫助他們從大數據中提取關鍵數據和重點,並克服語言障礙。此外,GenAI 可以從不同層面和觀點分析相同問題,激發學生的創意思考,並輔助偵錯和潤飾報告,提高報告品質。更重要的是,GenAI 能根據學生的學習能力和進度提供個性化的學習建議,因此,對於自主學習者來說,GenAI 是一項珍貴的資源。對於教師而言,GenAI 同樣具有極大幫助。它可以協助在課前生成授課計畫、教學簡報或測驗,並在課後幫助審閱和評分學生的作業或測驗。這樣一來,教師可以將更多時間投入到課程準備和與學生的互動中,從而進一步提升教學品質。
三、醫療 在醫療領域,GenAI 的崛起帶來了顯著的影響。令人驚訝的是,ChatGPT 在2023 年未經額外訓練的情況下,成功通過了挑戰性十足的美國執業醫師資格考試(USMLE),這一成就引起了學界和業界的廣泛關注。隨著GenAI 技術的進步,各種實務應用相繼問世。
例如,AI 醫療新創公司Navina 開發了一款GenAI 助理,旨在提升醫師處理行政事務的效率。這款工具能夠分析病人的電子健康記錄、保險理賠文件等資料,監控健康狀況,並根據病情向醫師推薦治療方案。除此之外,它還能回答醫生的各種問題,並自動生成轉診信和病情記錄等文書。Navina至今已成功籌集了4,400萬美元,顯示醫療界對GenAI應用的高度關注與支持。
美國醫療科技公司Medtronic則開發了一款AI智慧大腸鏡檢查工具,能在檢查過程中即時分析大腸影像,並辨識惡性組織。進一步地,這項技術結合GenAI來改善影像品質,並根據綜合健康資訊制定個人化治療計畫。
在藥物研究領域,美國人工智慧新創公司Atomwise利用GenAI高效分析大量生物和化學數據,取得了突破性進展。GenAI能快速識別出潛在對多種疾病有效的化合物,大幅加速藥物篩選。僅在6小時內,它便提出了40,000種潛在化合物,為後續的研究提供了寶貴的資料。
此外,雪梨科技大學的GrapheneX-UTS人工智慧研究中心開發了一項技術,能將癱瘓患者的思想轉化為文字,幫助他們重新獲得溝通能力。這項技術對於因疾病或受傷而喪失說話能力的患者,帶來了重大的生活變革。 |
|
|
|