大數據建模需要學習什么?. - Medium

文章推薦指數: 80 %
投票人數:10人

大數據一般指在資料量在10TB以上的資料集, 通常有以下5個特點(5V):簡單說來,大數據建模就是指利用相關的計算機技術從大數據中挖掘資料特徵,並用量化理論數學化資料特徵關係以描述業務需求和模式的一種方法體系。

必須掌握和了解:建模資料的抽取,清洗和加工以及建模演算法的訓練和優化會涉及大量的計算機語言和技術。

比如:資料查詢語言SQL;資料環境Hadoop和Spark;資料作業系統Linux; 資料分析軟體R、Python、SAS、Matlab等。

特徵工程涉及到統計/數學/資訊理論/計量等學科的基本概念。<



請為這篇文章評分?