R語言學習筆記(二):常用指令 - Yanwei Liu
文章推薦指數: 80 %
as.character(my_logical) # "TRUE"### R 語言基本的資料結構大致有五類。
... merge(data1, data2, all = FALSE)#grep, gsub搜尋與取代資料
GetunlimitedaccessOpeninappHomeNotificationsListsStoriesWriteR語言學習筆記(二):常用指令RStudio的快捷鍵#產生%#Pipe的指令由左到右執行install.packages("magrittr")library(magrittr)#解釋function(data)data%>%function()#使用%>%x%mean#透過%>%來執行平均值計算#使用傳統方法X%一行解決,就能比較容易理解z%>%is.na%>%sum#一個比較完整的範例首先,先import一個excel檔案到df變數,將它透過%>%傳到as_tibble()進行處理,再用select進行選擇,之後用mutate產生一個新變數,並且進行rename,最後print出這個資料df%as_tibble()%>%select(state_code,psychRegions,instagram:modernDance)%>%mutate(psychRegions=as.factor(psychRegions))%>%rename(y=psychRegions)%>%print()字串(可參考另一篇stringr)#查看字串長度nchar('string')#6個字母#查看向量長度length('string')#1個單字#連接字串paste('I','am','a','teacher')[1]"Iamateacher"paste('I','am','a','teacher',sep='-')[1]"I-am-a-teacher"#抓取字串substr('statistics',1,4)#抓取第一至第四個字母stat#取代字串sub(old,new,string)#替代第一個符合gsub(old,new,string)#替代所有符合#印出好看的Dataframeprint.data.frame(x)計算程式執行時間oldtimeBMIBMI(180,75)apply整批運算家族apply#將某運算整批套用在各列或各行apply(x,MARGIN,FUN)#x表示變數資料,MARGIN=1或2(1橫列,2直行),FUN為函數apply(x,2,mean)#針對X的每一直行進行平均數運算tapply#依照元素所屬的分類作整批運算tapply(x,INDEX,FUN)#x表示變數資料,INDEX為分組之向量或factor名稱,FUN為函數x1x2=as.factor(x1)t=tapply(x1,x2,length)lapply、sapply#對向量或List或Dataframe的每個元素作整批運算sapply(x,FUN)#sapply盡量傳回向量或矩陣,有時傳listsapply(df,typeof)#看df資料中所有的屬性(typeof)lapply(x,FUN)#只傳回listaggregate#依照兩個factor的分類組合作分群運算(向量、矩陣、Dataframe)aggregate(x,by,FUN)#x表示變數資料,by為1個或多個變數組成的list,FUN為函數常用函式#資料尺度(列數與欄數)dim(d)nrow(d)#有幾個觀測值ncol(d)#有幾個變數#資料的欄位名稱(columnnames)names(d)#資料型態typeof("abc")#最詳細typeof(123)#用Excel的表格來檢視資料View(d)#了解資料結構性質str(d)#快速統計資料(str和summary差別在於summary較詳細,str較粗糙)summary(d)#轉換資料格式d$title=60)subset(d,select=c(Gender,Science,.....,....)#查詢資料中有哪些變數(unique)unique(d)###函式####seq(產生一連串數字)>seq(1,6,by=3)[1]14>seq(5)[1]12345>seq(10,1)[1]10987654321#union(聯集)>union(x=1:3,y=2:5)[1]12345#intersect(交集)>intersect(x=c(1:5),y=c(2:5))[1]2345#setdiff(求向量X與向量Y中,不同的元素)>setdiff(x=1:4,y=2:3)[1]14#rep(產生重複數字)>rep(10,5)[1]1010101010#which(假如符合要求,傳回符合的數字)which((1:12)%%2==0)#1~12當中,哪些是偶數?[1]24681012#使用-刪除變數中的值或內容xsample(x=1:100,size=10)[1]74262019783975482894#head,tail(顯示前幾筆或後幾筆資料)>head(d,n=6)>tail(d,n=6)#order,sort,rev(排序資料)a[order(a,decreasing=TRUE)]#大到小sort(a,decreasing=TRUE)#大到小x=c(55,11,44,22,33)#將向量顛倒排序(從後往前排)rev(x)[1]3322441155#duplicated(重複值)dup_removed=dup[!duplicated(dup)]#縮寫變數abbreviate(x)#GUI編輯資料(跳出編輯室視窗)edit(data)#合併資料(rbind和cbind)colnames(A)=colnames(B)=c("id","val");rbind(A,B)#垂直合併(列資料)cbind(A,B)#水平合併(欄資料)#合併資料(共同欄位)(merge)#交集(未加參數預設為交集)merge(data1,data2,by='name')#合併data1和data2,name為兩者的共同欄位#聯集merge(data1,data2,all=FALSE)#grep,gsub搜尋與取代資料grep函數的括號,第一個東西要放你想找的關鍵字,;第二個要放的東西是你要搜尋的區域)grep("鄉",pop$區域別)#在pop資料的"區域別"變數中找所有包含"鄉"的字grep("鄉$",pop$區域別)#在pop資料的"區域別"變數中,只找以"鄉"為結尾的字pop$區域別%abline()###迴歸係數###coef(lm物件,...)plot(Literature~Science,data=d)abline(a=coef(fit)[1],b=coef(fit)[2],lty=3)###相關係數###cor.test(資料一,資料二)cor.test(d$Literature,d$Science)cor.test(~Literature+Science,data=d)cor(d[,c(2,4:6)])#比較所有特徵彼此間的相關係數GGally::ggpairs(d[,c(2,4:6))#進行相關係數繪圖R語言使用者的Python學習筆記::2017iT邦幫忙鐵人賽資料科學相關的論壇時不時會看到類似問題:我想要從事資料科學相關的工作,我知道R語言與Python各擅勝場,但我的時間只夠我先學一樣,請問各位大大推薦我先...ithelp.ithome.com.tw認識R的美好是郭耀仁,資料科學與推廣教育的愛好者,喜歡使用R語言與Python做資料科學應用,在台大資工系統訓練班開設多門R語言與Python的相關課程,亦與企業合作提供客製化的內訓課程;同時也是一個超棒的中文資料科學專欄…bookdown.orgR教學目錄R教學目錄*R教學第1堂:從安裝R到讀取資料*第0章:資料視覺化為什麼要學R?*第1章:安裝R和RStudio*第2章:現在就來寫Rcode吧!*第3章:R程式碼的基本文法*第4章:更多有用的函數*…dataman.tumblr.comMorefromYanweiLiuFollowMachineLearning|DeepLearning|https://linktr.ee/yanweiLovepodcastsoraudiobooks?Learnonthegowithournewapp.TryKnowableRecommendedfromMediumstephaneledorzeTheContravariantFunctor!UDSSystemsKnowledgeArticle:creatingareferencelibraryinDynamics365AkashPandeyHadoopClusteronAWSYogitaKumarinFAUNPublicationFlutter-Navigationusingpush(),pop()androutesPradyumnSharmaSetupSalesforceCI/CDPipelineUsingGitHubActionsKlaraOrbaninEncodeClubEncodexInternetComputer:DeepDiveIntoadAppBuiltinMotoko[Video+Slides]FruitGuruinCityStatesBringingBalancetoCS:M — AnInterviewWithSetra:CitystatesBalanceLeadIvySeoGenerateuniquefilename:UUID,PathAboutHelpTermsPrivacyGettheMediumappGetstartedYanweiLiu1.6KFollowersMachineLearning|DeepLearning|https://linktr.ee/yanweiFollowHelpStatusWritersBlogCareersPrivacyTermsAboutKnowable
延伸文章資訊
- 1R教學第9章:尋找和取代資料
下一篇教學,我們要教你如何把處理完畢的資料,輸出成一份CSV檔,以及把你寫的R script存成以後可以重複使用的程式檔。 sixToTen R r language data ...
- 2R語言學習筆記(二):常用指令 - Yanwei Liu
as.character(my_logical) # "TRUE"### R 語言基本的資料結構大致有五類。 ... merge(data1, data2, all = FALSE)#grep,...
- 3在R 中用0 代替NA | D棧
在本文中,你將瞭解兩種將資料框中的NA 值替換為零值的方法。其中一種使用Base R 子集重分配,而另一種則包含在dplyr 包中,執行速度快30%。
- 46 資料處理與清洗| 資料科學與R語言
介紹如何使用R語言完成資料讀取、處理、分析與呈現,以及大數據技術與R的整合. ... 在所有的程式語言中,只要用到字串比對與字串取代等字串相關功能,都會用到正規表示 ...
- 5Replace 取代· Begin to Learn R - begin4learn
如同在修訂文件時常用的取代功能,我們常需要在文字中將符合某些特徵或關鍵字的部分搜尋出來 ... R 語言中使用 ... 如何掌控資料:關於文字在Python 與R 語言處理文字 ...