有哪些不同資料類型- 常見問題 - Hitachi Vantara
文章推薦指數: 80 %
半結構化資料是指使用自我描述架構的任何資訊,例如,XML 或JSON。
這類型的資料具有開放式架構,可以實現應用程式資料的靈活性。
有時候,這種類型的資料與結構化資料結合, ...
Home
/
洞見
/
常見問題
/
有哪些不同類型的資料
zh_tw
資料類型常見問答集
全部展開
有哪些不同類型的資料?
數位革命和大數據的崛起為一般企業創造了相當龐大的資料。
IDC在2017年所做的「DataAge2025:TheEvolutionofDatatoLife-Critical」(數據時代2025:攸關生命的資料變革)這項研究中預測,到2025年,全球的資料容量將會增加到163ZB(皆位元組,相當於一兆GB)。
大數據的出現催生了公司必須管理和保護各式各樣的資料類型。
這些資料類型包括:
結構化資料以數字資料為主,來源是交易系統和技術空具,例如企業資源規劃(ERP)系統。
非結構化資料由隨機檔案類型組成—包括影像、音訊/視訊錄製檔,以及MicrosoftOffice檔案—不受任何規則限制。
半結構化資料代表以上類型的綜合體,其中的檔案可能包含數字資訊,但要擷取檔案並不容易(例如MicrosoftExcel試算表)。
每種資料類型在建立儲存資訊、保護隱私權和安全性以及遵守政府有關資料法規的資料控管策略方面都面臨到獨特的挑戰。
何謂結構化資料?
大多數的企業對結構化資料瞭若指掌,這類資料通常會採資料列和資料欄的格式,中繼資料元素也非常明確,例如月/日/年。
結構化資料以數字為主,來源是交易系統、資料庫以及後勤應用程式(例如ERP系統)。
企業縱然有龐大的結構化資料,但通常知道該如何管理、分析及運用,因為這類資料的定義非常清楚。
何謂非結構化資料?
對大多數組織而言,更棘手的問題是要瞭解非結構化資料並從中找出價值。
非結構化資料分為許多不同的格式,每一種格式的複雜程度不一,例如影像、音訊檔、辦公室或生產力檔案,以及掃描的手寫筆記。
這類資料的來源可能而且確實無所不在:內部、外部、第三方、邊緣裝置,以及其他來源。
由於非結構化資料不受嚴格規定或共享格式的管理,因此很難管理和應用一致的資料控管策略。
但是,它可以包含組織在當今持續競爭激烈的企業領域中需要運用的關鍵性見解。
例如,想想重要客戶在語音信箱上留下的投訴。
從音訊檔案中挖掘價值需要一個能夠播放該檔案的軟體應用程式,一個人可以親自收聽,而另一個人可以確定資料的價值性或哪些是沒有價值的。
作為資料處理策略的一部分,將音訊轉變成文本會建立一個一致的記錄觀點,任何有權利存取該記錄的人都可以根據需要解釋該觀點。
它還允許語音信箱與其他形式的分析混合,且不會損害原始來源。
包含關鍵見解的其他非結構化資料可能包括維修技術員維修基本生產設備的手寫筆記。
關於第三方資料,影響者發佈的長期天氣預報或負面的社群媒體貼文可能會嚴重地影響某些產品的需求。
很容易就能看到此類型資料的巨大潛在價值。
何謂半結構化資料?
最後是半結構化資料,這類資料是前兩種資料類型的綜合體。
這類資料可能包括Excel試算表,通常試算表包含重要的財務資訊,但要單純擷取其中的資料並不容易。
這類資料物件本身可能有其結構,但少了標準資料管理流程所需的外部結構。
這些物件就像非結構化資料一樣包含重要見解,但若不採用資料控管智慧策略,要擷取及運用這些見解實屬不易。
半結構化資料是指使用自我描述架構的任何資訊,例如,XML或JSON。
這類型的資料具有開放式架構,可以實現應用程式資料的靈活性。
有時候,這種類型的資料與結構化資料結合,以記錄結構化資料儲存中特定記錄類型的其他屬性。
開放式結構代表半結構化資料並不會依賴建立資料的應用程式,從而定義內嵌式結構。
例如,會將Oracle資料庫視為結構化資料的類型。
管理資料庫的規則是由建立檔案的應用程式(在本案例中為資料庫)加以約束和套用。
針對半結構化資料庫,不論是否為建立它們的應用程式,都會將定義和限制嵌入檔案中。
例如,網頁的XML檔案和級聯樣式表都是半結構化資料的形式。
它們幾乎可以由任何類型的應用程式(例如,記事本、網站架設應用程式或Word等Office應用程式)加以建立,因此應用程式無法將結構或規則應用於這些資料類型。
對組織而言,半結構化資料具有挑戰性,因為它不一定具有與結構化資料相同的組織級別和可預測性。
其並不會停留在固定的範圍或記錄中。
在此同時,它的確比非結構化資料具有更強的剛性,因為它確實包含可以將資料分成各種層次結構的元素(想想以逗號分隔的檔案或標籤分隔的檔案)。
與會將資料表示為平面格式的結構化資料不同,半結構化資料可以包含n級嵌套的資訊層次結構。
這代表著可以很容易地將標準資料管理流程應用於半結構化資料,並且可以很容易地從中擷取見解。
真正的問題是確保您的企業擁有將資料裝載到結構化或非結構化資料模式中所需的工具和技術,可以透過資料控管對其進行管理。
與這些資料類型相關的兩個最大挑戰是什麼?
到目前為止,當今企業面臨的最大挑戰是非結構化資料的爆炸性成長。
實際上,今天建立的所有新資料中有80%是非結構化的。
這超出了大多數組織的能力範圍,這表明公司可能正在收集他們甚至尚未意識到的資訊。
這可能會使正確使用和保護非結構化資料帶來極大的挑戰,並且產生風險,因為缺乏認知會導致組織無意間地違反越來越多有關資料隱私權的規定。
第二個挑戰是了解如何處理資料。
如此龐大且不斷成長的資料量需要基礎架構來儲存和保留。
大多數組織沒有能力維護資料所需的大量管理時間和成本。
更重要的是,其龐大的規模使公司難以取出確實存在的重要策略見解。
資料永遠不會停止成長,它的複雜性一直都在變化,但生產者和消費者的數量卻似乎永遠不會停止。
這就是答案在於智慧資料控管的原因,這代表建立旨在篩選、標記、保護、管理和確保可存取性的非結構化資料,以及結構化和半結構化資料可證實的政策和最佳實踐。
有了明確定義的資料控管策略,您公司將為處理資料成長、資料品質、資料相關性和資料可用性做更好的準備。
資料控管如何幫助我們管理不同的資料類型?
簡單地說,智慧資料控管意味著將資料置於控制之下,對其進行保護並允許對資料的存取,以執行最頂級的企業策略。
但是資料控管也代表著需要了解資料的來源目前所在的位置、可存取的人員、所包含的內容以及應保留的時間。
智慧資料控管也暗指著瑣碎的資料與策略上重要的資訊有所區別。
一旦資料遭到集中起來並經過深思熟慮的管理,就可以釋放其真正的策略潛力。
企業可以輕鬆地辨別客戶需求、預料新出現的問題、探討新的企業機會並回應監管的調查。
他們可以更完善儲存和管理這些資訊資產的成本,同時仍然允許企業中的利害關係人運用資料來改善決策。
在資料控管方面,達到適當的平衡是關鍵。
必須對所有類型的資料進行嚴密的管理,但是組織仍需要使其可以存取,以支援在當今快速發展的世界中所必要的高度靈活性和速度。
好消息是,有一些創新的自動化解決方案可以幫助簡化和加速資料控管流程,為您的組織節省寶貴的時間和成本。
誰是資料控管的領導者?
HitachiVantara撰寫了一本探討資料控管的書。
Hitachi在資料儲存與管理領域的領導能力不言可喻,我們的專家可以簡化複雜的資料控管作業,因為我們就是採用自動處理解決方案幫助貴公司:
確保資料品質。
使資料可以辨別。
集中資料並使其可以存取。
透過實施自動化解決方案,篩選、辨識和集中結構化、非結構化以及半結構化資料,Hitachi可以幫助您建立具有極大策略價值的「單一可靠來源」。
您可以獲得有關您的日常運作、客戶和生意夥伴、財務狀況以及影響您公司及其財務成果的新興趨勢的新見解。
智慧資料控管如何準確地幫助我的企業?
智慧資料控管為典型公司提供了一系列的策略優勢,包括:
改善決策過程。
取得及運用適度控管的資料比較容易,也就是說,各部門的關係人都可以根據事實做決定,不需要憑直覺或靠臆測。
運作效率。
可以運用重要資料(包括效能指標)找出並解決公司日常作業當中的瓶頸和效率不彰之處。
要做到這一點,就必須能夠取得並運用最精準、最新的資料。
加強瞭解資料的內容與脈絡。
若能瞭解「資料軌跡」和所有與資料相關的責任歸屬,就能即時因應稽核需求、提高案例早期評估成效,還能運用更主動的方法預防資料毀損與漏洞。
遵守法規。
企業必須管理及儲存資料,也越來越需要遵守與這方面相關的隱私權與安全規章,而這些規章都十分複雜。
資料控管是保障及證明組織遵守相關法遵規定的重要條件。
增加營收。
掌握準確、經過篩選的即時資料,企業就能放心做出更好、更有效率的決定,對銷售和營業利潤帶來正面的影響。
針對不同類型資料的政策,我的企業應該多久審查一次?
由於資料量呈指數成長,HitachiVantara建議您的公司每個季度審查一次其資料控管政策和實踐。
透過每三個月查看一次有關資料的「全局」,您的公司可以辨別新興趨勢、排解疑難問題並確保資料繼續為策略資源發揮作用。
除了建立資料控管制度外,Hitachi還建議每個組織都應該設置資料長或數位長的職位。
在組織內部,數位長作為「資料的聲音」,可以保護資料並持續讓策略貢獻變得更加重要。
不同類型的資料如何影響我公司的DATAOPS新措施?
DataOps又稱資料運作,是近年來新興的概念,也是人工智慧紀元的企業資料管理模式。
倘若採用支配一切的DataOps策略,就能緊密結合資料使用者與生產者,迅速找到並運用資料所蘊藏的一切價值。
資料作業並非產品、服務或解決方案。
它是一套方法,一項兼具技術和文化的改變,透過加強資料品質、縮短循環時間和出色的資料管理來改善您組織對資料的使用。
由於DataOps跨越了收集和應用資訊的整個週期,因此組織必須有效地管理不同類型的資料,這是絕對至關重要的。
透過對資料的篩選、良好的管理和立即存取,可以為您的DataOps新措施支援所需的正確資訊,而這些資訊是根據事實而非猜測來做出策略決定的。
由於HitachiVantara在DataOps和資料控管方面均擁有公認的專業知識,因此對於每種類型的資料,Hitachi都是自然的合作夥伴。
透過灌輸資料驅動的文化和思維方式,Hitachi可以每天都您的企業關注資料。
You’reintheRightPlace!
HitachiConsultingandHitachiVantarahaveintegratedintoanewcompanyundertheHitachiVantarabrand.Wehelpyouconnectwhat’snowtowhat’snext.
KNOWMORE
KNOWMORE
CONTINUE
CONTINUE
這個網站使用Hitachi及第三方的Cookie,用途只限於本公司業務運作,以及針對您個人需求提供最適合的服務。
使用本網站即表示您同意使用Cookie。
如需詳細資訊,請參閱Hitachi的Cookie政策。
zh
延伸文章資訊
- 1工程師一定要知道的數據型態資料|菜鳥救星RookieSavior
資料搜尋後先整理成半結構資料後再建立整理成結構化資料,因為工程師常常會碰到資料交換的需求,所以整理成半結構資料通常是工程師的工作內容之一。 另外 ...
- 2半結構化數據_百度百科
半結構化數據(semi-structured data)模型在數據庫系統中有着獨特的地位:. (1)它是一種適於數據庫集成的數據模型,也就是説,適於描述包含在兩個或多個 ...
- 3結構、半結構、非結構式資料是啥意思? - kevinwang
半結構式資料(Semi-structured data) ... 半結構式資料,顧名思義其規格介於結構與非結構資料庫之間。 這種資料具有欄位,因此可以依據欄位來進行查找,使用方便,但是除此之 ...
- 4半結構化、結構化、非結構化的區別及定義 - 每日頭條
半結構化數據(semi-structured data)在做一個信息系統設計時肯定會涉及到數據的存儲,一般我們都會將系統信息保存在某個指定的關係資料庫中。
- 5半結構化知識系統- 维基百科
半結構化知識系統(英語:Semi-structured Knowledge System)是指為已電子化、數位化但不具有標準格式、制式內容、固定結構識的文件內容提供搜尋、擷取、整理、分類、 ...