半結構化資料(Semi-structured Data) - scrapbook
文章推薦指數: 80 %
所謂的結構化資料基本上就是定義精確的資料, 比方說在MySQL中建立了一張table, 我們通常都會為table中的各個欄位去做定義, 固定的欄位, 固定的格式, 固定的順序與固定 ...
📑📑📑📑scrapbookSearch…📑📑📑📑scrapbookIntroduction1.Concept1.1EAI1.2ESB1.3EAIv.s.ESB1.4SOA1.5RESTful1.6Microservices1.7Microservicev.s.SOA1.8MaintainHTTPState1.8.1Cookie1.8.2Session1.9Put,Add,andSet1.10PublicKey&PrivateKey1.11MessageDigest&HashFunction1.12Diffie-HellmanKeyExchange1.13AboutIoC1.14AboutAOP1.15Spring-ProsandCons1.16Spring-PrototypeinSingleton1.17HTTPv.s.SPDY1.18HTTP/21.19SecuringRESTServices1.20Conway'sLaw1.21大型網站架構演化發展歷程1.22JavaGenerics1.23MySQLHA經驗談2.Questions&Solutions2.1海底撈幾根針2.2塞不進去3.RelationalDatabase3.1SQLJoinType3.2SQLInjection3.3MySQLCHARv.s.VARCHAR4.NoSQL4.1CAPTheorem,ACIDv.s.BASE4.2Two-Phase-Commit4.3RDBv.s.NoSQL4.4Structured,UnstructuredandSemi-structuredData4.5Shardv.s.Replica4.6ArrayListv.s.LinkedList4.7HashSetv.s.TreeSet4.8HashMapv.s.TreeMap4.9ArrayListv.s.Vector4.10HashMapv.s.HashTable4.11Statement,PreparedStatementandCallableStatement4.12OverflowofDigitsX.JVMX.1JVMSystemThreadsX.2GarbageCollectionPoweredByGitBook4.4Structured,UnstructuredandSemi-structuredData結構化資料(StructuredData)所謂的結構化資料基本上就是定義精確的資料,比方說在MySQL中建立了一張table,我們通常都會為table中的各個欄位去做定義,固定的欄位,固定的格式,固定的順序與固定的佔用大小.這類資料基本上就是很有條理的,違規的資料基本上也進不了資料庫.好處就是資料的定義明瞭清晰,資料長相容易被預測.當然這也意味著資料分析跟處理都相對容易多了,這也是為什麼資料分析工具或是報表產生工具大多數都會優先採用結構化資料的原因之一.非結構化資料(UnstructuredData)上面結構化都講那麼清楚了,這邊就直接反過來就是了,就是資料比較亂,定義不明確的意思.像一段短片,一張圖片,一整坨純文字等等.這邊的差異基本上是在指"格式",不是資料的"用途".半結構化資料(Semi-structuredData)這就是在結構化與非結構化之間的另一種資料,你在這種資料裡面是看得到欄位的,所以還是可以透過欄位來查詢,但其並不保證一致性.譬如在使用者資料表裡面,可能只有某些資料才有"電話"這個欄位,但有些資料是沒有的.你可能會想到MySQL裡面設定成允許該欄位可以為Null,但這邊的意思其實是"不需要對結構做任何設定",因此就算使用者完全沒想過之後要加入什麼資料,也可以直接加入一筆"Jackey的鼻子有幾個"這種資料.可參考以下的XML:1
延伸文章資訊
- 1[瞭解資料特徵]Part1-結構化與非結構化資料
非結構化資料:形式自由且不遵循標準的格式規範,一團沒有組織的數據。非結構化數據的示例包括圖像,音頻,視頻,電子郵件,電子表格和文字處理文檔,實質上是存儲為文件 ...
- 2結構化資料vs. 非結構化資料
結構化資料的資訊內容有精確定義的模式。若要簡單定義,意即所有可以透過表單系統(如Google 試算表、Microsoft Excel)呈現出來的資料都是結構化資料。
- 3淺談資料格式— 結構化與非結構化資料 - Medium
SQL是Structured Query Language的縮寫,意指「結構化查詢語言」,其資料為結構化資料。結構化資料在資料庫裡意指:它擁有固定欄位、固定格式與順序…等。
- 4什麼是結構化資料?
結構化資料是指採用標準化格式、具有明確定義的結構、符合資料模型、遵循長久規範、容易被人類和程式存取的資料,這種資料類型通常儲存在資料庫中。
- 5有哪些不同資料類型- 常見問題 - Hitachi Vantara
結構化資料以數字資料為主,來源是交易系統和技術空具,例如企業資源規劃(ERP) 系統。 · 非結構化資料由隨機檔案類型組成— 包括影像、音訊/視訊錄製檔,以及Microsoft ...