資料的整理與分組@ Simple R :: 隨意窩Xuite日誌
文章推薦指數: 80 %
資料的整理與分組資料的輸入與處理,在學習任何一套統計軟體前(EXCEL、SAS、R…),總是有數堂課或是整個學期都在練習如何將資料輸入,煩悶與無趣,是每個學習者必經之 ...
SimpleR-SimpleR-一個-簡單R-的教學分享交流BOLG免費的資料統計分析及繪圖工具歡迎志同道合的你來參與!!日誌相簿影音好友名片關鍵字
全部展開|全部收合
關於我加入好友我的相簿我的影音
yearend's新文章好消息~~~Rcmdr有官方的中文化囉!!R_2.13.1Rcmdr中文化~~新發表R存活分析方法(使用Rcmdr)R2.9.2Rcmdr中文版多因子變異數分析!!來也~~資料的整理與分組EXCEL資料匯入單因子變異數分析(OneWayANOVA)來個直線迴歸吧!!無師自通R-掌握Rhelp再也不用求救
yearend's新回應沒有新回應!
SimpleR
我的相簿
200802201140資料的整理與分組?未分類資料的整理與分組資料的輸入與處理,在學習任何一套統計軟體前(EXCEL、SAS、R…),總是有數堂課或是整個學期都在練習如何將資料輸入,煩悶與無趣,是每個學習者必經之路,不過這些技巧,一定會符合”書到了用時,方恨少”,老是有一種感覺,像是自己得了失意症,”ㄟ……好想學過(老師有教過)”,接著開始研究考古學,翻遍自己的所有筆記,古今中外所有的典籍,花了好一功夫,放棄是一個途徑,另外一個就是在書本豪不起眼的最前面幾章找到了所需要的功能,呵呵!!(筆者似乎也常發生這樣的事情)。
不過還好,科技始終來自於人性,現在輸入的介面受到M$的EXCEL所制約,所以除了一大堆格子的輸入方式外,其他都是很難的輸入方法,就算有充足的資料,用R的互動式輸入,光是建入data資料->動作資料->動作資料中的變數,這個指令了解所匯入資料的變數有些,按下這個指令後在輸出視窗中會出現[1]"grader_1""grader_2""grader_3"的字樣(圖3),這是我們所匯入資料中所含的三個變數。
當然我們也可以進一步的對資料進行編輯、儲存、輸出與移除缺失值(removemissingvalues)(圖4)。
資料的儲存就不說了,這選項會存成R的專案檔(*.rda),輸出的指令,可以將目前的動作資料,儲存成存文字檔(*.txt),按下輸出的指令,彈出輸出的視窗(圖5),選擇好所需的輸出選項設定,按下OK鍵就會彈出檔案儲存視窗,自己決定你要放的檔案位置吧。
移除缺失值的指令,是用來移除資料內的缺失值資料使用(這句還真是繞舌)。
圖1、R與Rcmdr。
圖2、指令集->資料->動作資料->動作資料中的變數。
圖3、匯入資料中所含的三個變數。
圖4、對資料進行編輯、儲存、輸出與移除缺失值。
圖5、輸出指令視窗。
接著我們來說命令列->資料->動作資料->stackvariablesinactivedataset(圖6),這個指令的用途吧!!這個指令在單因子變異數分析(OneWayANOVA)中使用過,其實這指令是將資料從原本的個別單一物件(來記得R是以物件的方式來處理資料),集合成群組,並給予其新的組變數與因子名稱(圖7),將集成的資料集命名(Nameforstackeddataset)為new_dataset,變數名稱取名為values,因子(Nameforfactor)則叫做graders,然後還有一個重要的步驟,就是將變數grader_1、grader_2、grader_3,用滑鼠左鍵+鍵盤的Shift,同時選許取反藍(反藍的那些變數是你要擊成或群組的資料),來看一下兩個使用前後的差異吧!!再次選擇指令集->資料->動作資料->動作資料中的變數,此時輸出視窗中就會出現[1]"values""graders",這樣我們就將變數grader_1、grader_2、grader_3集成graders的分組(圖8),同時有產生了因子的ind物件,光看變數名稱是沒有太大的感觸,使用指令列->繪圖->鬚盒圖(圖9),彈出鬚盒圖的繪圖視窗(圖10),以分組繪圖(圖11,資料未集成前按了沒反應,不信你自己按按看),按下OK,然後再檢查以分組繪圖的按鈕就會變成藍色的字Plotby:ind,在按下OK,來畫個鬚盒圖就可以很容易了解其中的奧妙之處囉!!感受到了嗎?如果沒有將資料先集成,那你只能畫單一個資料的鬚盒圖,要不然就要使用R的指令去畫三個grader同時出現的圖囉。
圖6、命令列->資料->動作資料->stackvariablesinactivedataset。
圖7、將資料從原本的單一物件。
圖8、將資料從原本的三個單一物件集成graders與ind兩個物件。
圖9、指令列->繪圖->鬚盒圖。
圖10、彈出鬚盒圖的繪圖視窗,以分組繪圖(資料未集成前按了沒反應)。
圖11、變數群組的選項。
圖12、以分組繪圖的按鈕就會變成藍色的字Plotby:ind。
圖13、在R的視窗中就可看見以組別所畫出同時變數grader_1、grader_2、grader_3的鬚盒圖。
yearend Yearend/Xuite日誌/回應(6)/引用(1)/好文轉寄EXCEL資料匯入|日誌首頁|多因子變異數分析!!來也~~....上一篇EXCEL資料匯入下一篇多因子變異數分析!!來也~~...回應
延伸文章資訊
- 1R语言︱数据集分组、筛选(plit – apply – combine模式
R语言︱数据集分组大型数据集通常是高度结构化的,结构使得我们可以按不同的方式分组,有时候我们需要关注单个组的数据片断,有时需要聚合不同组内的 ...
- 2R 常用技巧 - HackMD
tags: `R` `Data Processing` `資料前處理` # R 常用技巧Other Reference: 1. ... 實現分組統計的一種簡便、直接的方式,且能同時指定多個函數;...
- 37 探索式資料分析| 資料科學與R語言 - Yi-Ju Tseng
量化分析方式的測量值大多可用R的內建函數完成計算,但是在探索式分析時,常常需要遇到資料分組的分析情形(如觀察男性和女性的血壓差異、A隊與B隊的三分球命中率 ...
- 46 資料處理利器:dplyr - 認識R 的美好
select(), 選擇變數. mutate(), 新增衍生變數. arrange(), 依照變數排序觀測值. summarise(), 聚合變數. group_by(), 依照類別變數分組,常...
- 5【R語言】dplyr對數據分組取各組前幾行 - 人人焦點
【R語言】dplyr對數據分組取各組前幾行 ... 下面這張表就是GO富集分析得到的結果,我們可以根據ONTOLOGY這一列來分組,就可以得到BP,CC和MF三個組。