課程簡介
本課程將透過 requests、selenium 等工具與網頁元素進行互動,並取得資料。
課前先備知識(上課前一定要會的東西):
1. Python 基礎語法
- 條件判斷、迴圈、檔案讀寫、函式,以及 list、dict、tuple、set 等使用經驗
2. 認識 HTML 標籤、CSS Selector 選擇器
- 很重要!課堂上不會說明,請先行自主學習,以降低課程學習門檻
主要範例說明:
1. LINE 官方貼圖
2. YouTube 影音平臺
3. 氣象資料開放平臺(需要申請帳號)
4. 金庸小說
其它範例說明(網路因素造成無法瀏覽時,該範例會略過):
1. 臺灣證券交易所(取得買賣超彙總表)
2. Instagram(需要申請帳號)
3. Wine Searcher
4. 嘖嘖群募平臺
2022年新增範例(視課程進度決定是否說明):
1. 太鼓達人
2. Free Proxy Pool
課程大綱
- 開發環境:Anaconda、Jupyter 及爬蟲專案實務
- 字串格式化
- 正規表達式(Regular Expression)
- 請求(request)與回應(response)
- 套件 Requests
- 套件 Beautiful Soup 4
- 套件 Selenium(包括 Action Chains)
- 套件 PyAutoGUI
- 實務範例說明
- 其它課堂補充
以上課程會依據上課情形而進行調整。
課程資訊
授課教師:楊德倫
上課教室:遠距授課
上課時數:30小時
招生名額:40人
收費金額:
校內費用:2200元
校外費用:2700元
上課時間:
2022/06/20上午09:10到12:00
2022/06/20下午13:30到16:20
2022/06/27上午09:10到12:00
2022/06/27下午13:30到16:20
2022/07/04上午09:10到12:00
2022/07/04下午13:30到16:20
2022/07/11上午09:10到12:00
2022/07/11下午13:30到16:20
2022/07/18上午09:10到12:00
2022/07/18下午13:30到16:20
講師介紹:
楊德倫 https://github.com/telunyang
▣國立臺灣大學計算機中心資訊課程講師
▣資展國際股份有限公司資訊課程講師
▣資策會數位教育所數位人才培育中心講師
上課須知:
▣Python 基礎語法
- 條件判斷、迴圈、檔案讀寫、函式,以及 list、dict、tuple、set 等使用經驗
▣認識 HTML 標籤、CSS Selector 選擇器
- 很重要!課堂上不會說明,請先行自主學習,以降低課程學習門檻
▣本課程於111年4月25日開放報名。
▣招生人數:40人(人數未達12人不開班)
▣若報名額滿,計資中心將依身份別、報名與繳費順序決定錄取名單。
▣因疫情關係授課方式遵循學校之規定。
-----------------------------------------------------------------------
➤建議設備:
1.穩定之網路頻寬。建議頻寬下載速度(Download Speed)為10 Mbps以上、上傳速度(Upload Speed)為2 Mbps以上。【請先進行頻寬測試: https://www.speedtest.net/】
2.設備以平板、NB效果最佳,手機和PC效果次之。