【機器學習】想要快速上手「機器學習」,先從架構流程7步驟 ...
文章推薦指數: 80 %
機器學習的7大步驟 · 逐一說明. 收集資料; 準備數據; 選擇模型; 訓練機器; 評估分析; 調整參數; 預測推論 · 結論 ... 關於陳陳的嘉理 聯絡陳陳的嘉理 Home 程式交易機器學習 【機器學習】想要快速上手「機器學習」,先從架構流程7步驟學起 機器學習 【機器學習】想要快速上手「機器學習」,先從架構流程7步驟學起 by陳陳 65月,2021 writtenby陳陳 65月,2021 在上一篇機器學習的介紹中,我們了解了何謂人工智慧、機器學習以及深度學習,但在開始程式教學前,我們必須先從機器學習的整個架構流程開始教起,不然在撰寫程式時,一定會不知道接下來該進行哪一個步驟,這樣就大大降低了學習的功效,也無法確保模型的正確性,那我們就開始今天的解說吧!! 內容目錄 機器學習的7大步驟逐一說明收集資料準備數據選擇模型訓練機器評估分析調整參數預測推論結論 機器學習的7大步驟 只要是建立於機器學習之中的,包括深度學習,其架構流程都是依照這7大步驟下去運行,唯有每一步驟都做得確實,程式的運行才會成功,所以這7大步驟相當之重要,缺一不可 逐一說明 收集資料 首先,收集資料就是將我們與目標相關聯的資料做一個抓取,以預測股市股價來說,我們所需的資料當然就是開高低收、技術指標、財務指標、籌碼指標等等,根據你所要分析的目標是長中短期,去加入你所需要的數值,這就是收集資料 準備數據 當然,資料收集好後,沒那麼簡單就可以拿給機器做學習,我們還需要進行數據的整理,篩選重要的特徵值,分割成訓練集跟測試集,如果每個指標的數值範圍都不一,我們還需要進行正規化,正規化又分成了「max-min法(最大最小正規化)」、「z-score法」等等方式 選擇模型 當數據都進行整理後,接下來就是要選擇訓練用的模型,像是決策樹、LSTM、RNN等等都是機器學習中常使用的訓練模型,其中目前較常拿來訓練股市的是「LSTM」,中文叫做長短期記憶,是屬於深度學習中的一個模型 訓練機器 選擇好訓練模型後,當然就是要將訓練集資料丟進去模型中做訓練拉,比如說LSTM,我們需要設多少神經元、要跑幾層等等都會影響模型訓練出來的結果,這部分只能靠經驗跟不度嘗試去學習了,或是上網多爬文看別人怎麼撰寫訓練模型 評估分析 當模型訓練完成後,接下來就是判斷該模型是否有過度擬合(overfitting),這裡就是帶入測試集的資料進行評估,也可以嘗試利用交叉驗證的方式進行模型的擬合性判斷,以及利用RESM、MSE等統計計算來判斷模型的準確度 調整參數 到這大致上模型已經完成了90%,最後的一步就是進行參數的微調,我們也稱為「超參數(Hyperparamters)」,讓整個模型更加的精準,但也不能過度的調整,因為會造成overfitting的結果,這個取捨就只能依照無窮盡的反覆迭帶去尋找了,這部分也是相對較耗時間的地方 預測推論 到此,模型已經正式完成,但對於全新沒影響過的數據則是一個未知數,由於在上方訓練模型中,我們不論是訓練集或是測試集都是被模型所影響過的,如果過度擬合,那麼未來丟入新的資料就很可能無法那麼精準,這部分就只能不斷丟入新資料來推論我們模型的預測能力是否有泛化 結論 今天稍微介紹了一下機器學習整個流程的大綱,但實際做起來絕非三言兩語能夠完成,或許你對今天介紹中的專有名詞感到相當陌生,但沒關係,這部份我們往後介紹時會一一做說明,在這只需要先了解,我們機器學習的這7大步驟是缺一不可,缺少其中一步的話,我們就無法保證我們訓練模型的正確性,對於重要研究或報告來說,正確性往往比準確性來的重要 以上為個人觀點,如有不對可提出糾正,如有更多看法的也能留言一起討論喔!! 如果想定期收到我最新文章的資訊可以追蹤我的FB粉絲專頁: https://www.facebook.com/adsads023023 分享此文:TwitterFacebookTelegram電子郵件 架構流程機器學習正確性深度學習 0則留言 0 FacebookTwitterPinterestEmail 陳陳 你可能會喜歡的文章 【kaggle實戰】房價預測(二)(... 188月,2021 【kaggle實戰】房價預測(一)(... 168月,2021 【機器學習】1分鐘快速了解什麼是機器... 53月,2021 上一篇 【高雄楠梓】高CP值獨特絕妙湯頭「蓋火鍋」,白飯、飲料、冰沙、爆米花、冰淇淋無限量 下一篇 【高雄三民】盛夏饗樂時尚新菜色登場,高雄人最愛的日本料理吃到飽「SOTO日本家庭料理」 發佈留言 取消回覆 關於我 本身是金融系畢業,從20歲就踏入股市投資,我熱愛與人分享跟切磋,不論是在股市或是旅遊、美食方面,希望能夠互相學習增強投資實力與生活的樂趣 高雄美食地圖分類 好書推薦(7) 好物推薦(3) 就愛去旅遊(1) 高雄景點(1) 就是愛理財(6) 存錢比投資重要(2) 小資族理財法寶(4) 程式交易(26) python教學(21) 機器學習(4) 程式交易入門必知(1) 美食愛分享(56) 台南美食(3) 嘉義美食(2) 高雄美食(51) 股市報你知(62) ETF小教室(6) 股票分析(5) 股票小學堂(51) FB粉絲專頁 陳陳的嘉理 愛食記 熱門文章 1 不知道吃什麼?高雄美食地圖懶人包(行政區篇),讓我推薦給你吃(更新:2022/2/14) 232月,2021 2 善用EXCEL,5分鐘輕鬆預估年度EPS,提早抓住獲利的腳步 271月,2021 3 股東會紀念品全攻略,1分鐘學會如何「永久補單」 301月,2021 4 【python】透過程式簡單選股與回測(part3):抓取Goodinfo!台灣股市資訊網的資料 151月,2021 5 【python】透過程式簡單選股與回測(part1):自動抓取台股上市每日資料 2512月,2020 6 【python】教你簡單爬取全球指數股價(part1):練習抓取個股資料 3010月,2020 參訪人氣線上使用者:1今日瀏覽次數:13總瀏覽次數:274,815 關於陳陳 理財為我鋪上通往財富自由的路,美食是我路途中的補給能量,向前行就會留下腳步的印記,唯有紀錄才能告訴我是如何走來,要避開錯誤只能學會錯誤,而錯誤就存在於我們的腳下 Facebook Instagram Email Bloglovin LINE 最新文章 不知道吃什麼?高雄美食地圖懶人包(行政區篇),讓我推薦給你吃(更新:2022/2/14) 232月,2021 多檔ETF殖利率高達5%?2022年ETF殖利率大比拚-老牌ETF大統計(下) 215月,2022 多檔ETF殖利率高達5%?2022年ETF殖利率大比拚-老牌ETF大統計(上) 75月,2022 想了解總體經濟?就從PMI採購經理人指數開始了解 174月,2022 精選文章 想了解總體經濟?就從PMI採購經理人指數開始了解 174月,2022 睽違10年的突然升息,究竟對台股是好還是壞呢? 94月,2022 5分鐘解析FED聯準會從降息到升息前政策對股市的影響(下) 93月,2022 陳陳的嘉理chenchenhouse.comCopyright2020-AllRightReserved|by陳陳的嘉理|此網站使用Bluehost主機 傳送到電子郵件地址 你的姓名 你的電子郵件地址 取消 文章未送出─請檢查你的電子郵件地址! 電子郵件地址檢查失敗,請再試一次 抱歉,你的網誌無法透過電子郵件分享
延伸文章資訊
- 1【機器學習】想要快速上手「機器學習」,先從架構流程7步驟 ...
機器學習的7大步驟 · 逐一說明. 收集資料; 準備數據; 選擇模型; 訓練機器; 評估分析; 調整參數; 預測推論 · 結論 ...
- 2機器學習步驟及分類器選擇及機器學習演算法
由上圖所示:機器學習分為四大塊: classification (分類), clustering (聚類), regression (回歸), dimensionality reduction ...
- 3機器學習是什麼、有何應用?和深度學習的差異 - ALPHA Camp
機器學習會運用不同類型的學習方式,根據資料的性質和希望獲得的結果,主要分為四類方法:監督式學習、非監督式學習、強化學習和半監督式學習。 監督式 ...
- 4初學者碰上「機器學習」的第一道關卡:我應該使用哪種算法?
文:大數據文摘bigdatadigest. 如果你是一個初學/中等程度的數據科學家/分析師,並且想要將機器學習的算法運用到解決你關心的問題的上,那麼這篇文章 ...
- 5機器學習的專業能做哪些工作?了解機器學習在業界的4大學習 ...
機器學習包含做主要的4種不同類型的學習模式,並且使用各種演算的技術,根據資料的性質和期望結果,採用監督式(supervised)、非監督式(unsupervised)、半 ...