監督式學習:「分類」和「迴歸」的介紹與比較 - iKala Cloud
文章推薦指數: 80 %
監督式學習的目標,就是藉由已知的訓練資料,找到最適合的w 來寫出這個方程式,讓未來我們匯入一筆資料的屬性x1、x2、…xn時,機器就能預測模擬出目標y。
在 ...
Skiptocontent
技術部落格
集結國內外精選文章,掌握最新雲端技術新知與應用
首頁
/
AI與機器學習
/
監督式學習:「分類」和「迴歸」的介紹與比較–機器學習兩大學習方法(一)
a
監督式學習:「分類」和「迴歸」的介紹與比較–機器學習兩大學習方法(一)
2021/11/09
類別:
AI與機器學習
作者:
iKalaCloud
之前的文章簡介了AI、機器學習與深度學習。
接下來我們會以生活化的情境說明傳統機器學習的方法。
本篇首先介紹傳統機器學習中的「監督式學習」。
回顧之前文章提到的監督式與非監督式學習,兩者最大的差異在於資料是否預先被標註;如果有,則可說這個題目屬於監督式學習。
演算法會由標註好的訓練資料學習並建構模型,以確定該給測試資料哪種標記。
如GCP專門家開發的柴犬秋田辨識器,就是藉由已標記的資料去訓練模型。
監督式學習:迴歸vs分類
監督式學習最常處理的兩個問題:迴歸、分類。
當你預測的目標為連續的數值,我們稱其為迴歸;若目標為離散的,稱其為分類。
我們用一點簡單的數學說明兩者的差異。
假設有一個方程式:y=iwixi+b 能夠用來表達我們資料集內的資料分布狀況;y是我們要預測模擬的結果,又稱為依變數,x是我們拿來做預測的屬性,又稱為自變數。
監督式學習的目標,就是藉由已知的訓練資料,找到最適合的w來寫出這個方程式,讓未來我們匯入一筆資料的屬性x1、x2、…xn時,機器就能預測模擬出目標y。
在迴歸問題裡,就是要畫出一條能夠預測y值的線(或超平面),在分類問題中,y值則為某個類別的機率值,藉由這個值去判定資料屬於哪一個類別。
假設你經營某個社群網站,迴歸能處理的問題如:根據過去app的DAU(dailyactiveusers)、MAU(monthlyactiveusers)等數據預估下一個月的DAU/MAU。
而分類處理的問題則像是:藉由會員性別年齡、好友數、使用頻率等變數,預測用戶是否會流失,每筆訓練資料標記了「已流失與否」,模型則可能產出每筆資料「流失的機率」,假設這個機率值大於50%我們就視為「會流失」,藉此處理分類的問題。
迴歸
「畫出一條盡量通過這些點的線」
今天常見的迴歸分析常納入時間的變數做分析。
應用領域如:股票走勢預測、不同時段的交通狀況、原物料價格變化對消費的影響…等。
另外,自台灣電商提供24小時到貨服務開始,陸續引進AI改善進銷庫存,iKala的ML團隊也協助電子商務導入這種銷售量預測,協助商品採購、品項管理單位做決策。
常見的演算法:線性迴歸、多項式迴歸
分類
「把資料分到我指定的幾個類別中」
前段提到的流失預測屬於簡單的二分法;流失預測常用於獲客成本較高、需要深度經營客戶關係的產業,如:電信、金融業。
金融業也常透過分類機制去決定核貸與否、放款的金額與利率等;藉由年齡、年收入、教育程度、還款紀錄等作為變數,以預測存戶的信用評等。
另外,行銷或公關部門也常會藉語意分析的結果掌握輿情,其技術就是蒐集網路文章、站上評價等,經過斷字處理,再將文章做正負面的分類。
其他常見應用如:垃圾郵件偵測、文章分類、語種偵測。
常見的演算法:決策樹、邏輯迴歸、SVM(支援向量機)、樸素貝葉斯、kNN
不同的演算法各有優缺點與適合的應用情境,關於監督式學習的演算法,詳見此文。
AI
分享本文:
Prev上一篇[懶人包]常見監督式機器學習演算法–機器學習兩大學習方法(二)
下一篇資深Googler告訴你:資料分析和人工智慧如何改變企業Next
文章分類
分類
AI與機器學習(43)
LINE獨家選文(1)
基礎架構(61)
應用程式現代化(28)
最新消息與洞察(65)
生產力與協作(6)
產業解決方案(60)
資料管理與分析(45)
資訊安全(28)
近期文章
AmazonEC2X2idn和X2iedn提升網路頻寬,可用於記憶體密集型工作負載
2022/05/16
【手把手教學】如何透過HAVPN連接GCP和AWSVPC
2022/05/12
[Hybrid]用ClassicVPN靜態路由連接AWS和GCP的VPC
2022/05/12
使用CloudSpanner開發多人遊戲,以提供玩家優質體驗
2022/05/06
BigQueryOmni現在可用於AWS和Azure來進行跨雲數據分析
2022/05/03
標籤雲
標籤AI
Anthos
API
Apigee
APIM
AutoML
AWS
Azure
BigQuery
Bigtable
CloudArmor
CloudFunctions
CloudMonitoring
CloudPub/Sub
CloudStorage
Dataflow
DNS
Firebase
GAE
GCE
GCP
GKE
GoogleAnalytics
GoogleCloud
GoogleKubernetesEngine
GoogleMeet
GSuite
Kubernetes
Loadbalancing
Migration
ML
NetworkIntelligenceCenter
Security
Stackdriver
Tensorflow
VPC
安全
機房
權限
製造
資料倉儲
資料分析
遊戲
金融
電商
iKalaCloud
回到頂端
繁體中文
English
日本語
Thissiteisregisteredonwpml.orgasadevelopmentsite.
延伸文章資訊
- 1機器學習易混淆名詞/演算法比較 - HackMD
機器學習(Machine Learning, ML) ; 分類/分群, 分類(二元樹), 分群(距離、相似特徵) ; 資料型態, 結構化資料, 結構化資料.
- 2機器學習- 維基百科,自由的百科全書 - Wikipedia
機器學習理論主要是設計和分析一些讓電腦可以自動「學習」的演算法。機器學習演算法是一類從資料中自動分析獲得規律,並利用規律對未知資料進行預測的演算法。因為學習演算 ...
- 3【機器學習懶人包】從數據分析到模型整合,各種好用的演算法 ...
【為什麼我們要挑選這篇文章】機器學習是人工智慧背後的基礎技術,透過 ... 一起來透過這篇文章,回顧一下機器學習分類演算法吧(本文適合已有機器 ...
- 4機器學習任務:分類!迴歸!分群! - Medium
機器學習任務:分類!迴歸!分群! <說說5分鐘>第6說:機器學習的任務種類classification, regression, clustering ...
- 5你知道機器學習(Machine Learning),有幾種學習方式嗎?