• 財經、商管、統計-統計-統計軟體應用
  • Python網路文字探勘入門到上手(附光碟)
    10堂基礎+5場實戰,搞定網路爬蟲、文本分析的淘金指南
  • 作  者:陳寬裕
  • 出版社別:五南
  • 出版日期:2020/01/07(1版1刷)
  • ISBN:978-957-763-700-0
  • 書  號:1H2D
  • 頁  數:372
  • 開  數:20K
  • 定  價:450元
  • 優惠價格:356元
主題書展 2022五南官網週年慶【理科必買】/單書79折、二本以上75折
滿額優惠折扣 5/5~6/30週年慶全館滿599打95折
  • 投影片(請電洽,僅供老師索取)
    自 序
    Chapter 01 Python 簡介
    1-1 何謂程式設計
    1-2 Python 程式設計的特點
    1-3 選擇 Python 作為第一種程式語言的理由
    1-4 安裝Python 與環境設定
    1-5 安裝編輯器:Visual Studio Code
    1-6 建置Anaconda 開發環境

    Chapter 02 資料型態
    2-1 Python 處理的資料類型
    2-2 數值型態
    2-3 字串型態
    2-4 變數
    2-5 數值和字串間型態的轉換

    Chapter 03 流程控制
    3-1 流程控制的構成要素
    3-2 條件分岐
    3-3 input 函式
    3-4 條件運算式的組成
    3-5 多向的條件分岐

    Chapter 04 串列與迴圈
    4-1 串列的意義與操作
    4-2 for 迴圈
    4-3 for 迴圈和if 敘述的組合運用
    4-4 range() 函式
    4-5 亂數的運用
    4-6 break 及continue 命令
    4-7 while 迴圈
    4-8 進階串列操作

    Chapter 05 元組、字典與集合
    5-1 元組
    5-2 字典
    5-3 集合

    Chapter 06 函式
    6-1 函式的意義
    6-2 函式的參數
    6-3 函式與變數的作用範圍

    Chapter 07 錯誤與例外
    7-1 錯誤的型態
    7-2 例外
    7-3 例外處理
    7-4 錯誤的種類

    Chapter 08 網頁爬蟲的簡單範例
    8-1 網頁爬蟲(Web Scraping)
    8-2 網路爬蟲的執行步驟
    8-3 向網路伺服器發送請求服務的訊息
    8-4 解析網頁資訊
    8-5  BeautifulSoup 的運用:於自由時報電子報網站進行爬蟲

    Chapter 09 向伺服器發送請求的方式
    9-1 網頁爬蟲的基本步驟
    9-2 送出簡單的GET 請求
    9-3 送出帶有參數的GET 請求
    9-4 送出帶有參數的GET 請求至Ajax 網頁
    9-5 送出帶有Cookie 的GET 請求
    9-6 送出帶有Headers 的GET 請求
    9-7 以form 形式發送POST 請求
    9-8 送出帶有登入Cookie 的POST 請求
    9-9 模擬登入

    Chapter 10 萃取有用資訊
    10-1 網頁萃取的工作內容
    10-2 本章所使用的範例網頁
    10-3 走訪DOM 文件樹
    10-4 搜尋DOM 文件樹
    10-5 CSS 選擇器

    Chapter 11 爬取「PChome 24h 購物」的商品資料
    11-1 PChome 24h 購物網站
    11-2 確認標的網站的URL 網址
    11-3 送出 HTTP 請求,取得頁面資料(JSON 格式)
    11-4 解析結果頁面資料,獲取商品資訊
    11-5 將商品詳細資料,存入Excel 檔案中
    11-6 建立主程式

    Chapter 12 爬取「Google 學術搜尋」的論文資料
    12-1 確認標的網站的URL 網址
    12-2 送出HTTP 請求,取得搜尋結果頁面資料
    12-3 取得各分頁的連結url
    12-4 解析分頁資料,獲取分頁內的論文資料
    12-5 彙總所有分頁的論文資料
    12-6 將論文詳細資料,存入Excel 檔案中
    12-7 建立主程式
    12-8 執行爬蟲程式
    12-9 使用平行處理技術
    12-10 有關爬取Google 學術搜尋的結語

    Chapter 13 爬取「PTT 八卦版」的PO 文資料
    13-1 確認標的網站的URL 網址
    13-2 送出HTTP 請求,取得頁面資料
    13-3 取得八卦版目前總頁數
    13-4 取得各分頁的連結url
    13-5 取得各分頁中的PO 文標題
    13-6 彙總所有分頁的PO 文標題
    13-7 取得每篇PO 文之發言內容
    13-8 彙整所有PO 文的相關資訊
    13-9 將PO 文的詳細資料,存入Excel 檔案中
    13-10 建立主程式

    Chapter 14 書籍比價爬蟲
    14-1 確認標的網站的URL 網址
    14-2 送出HTTP 請求,取得頁面資料
    14-3 取得搜尋結果的總頁數
    14-4 取得各分頁的連結
    14-5 取得每本書的詳細資料
    14-6 取得每本書於誠品、金石堂的價格
    14-7 取得分頁中各書籍的其它基本資料與比價資料
    14-8 彙整所有書籍資料
    14-9 將書籍比價資料,存入Excel 檔案中
    14-10 建立主程式

    Chapter 15 製作文字雲
    15-1 簡介
    15-2 建立主程式
    15-3 取得所有PO 文的發言內容
    15-4 繪製文字雲
    15-5 繪製長條圖
圖片待上傳
圖片待上傳
圖片待上傳