非結構化信息 - MBA智库百科
文章推薦指數: 80 %
非結構化信息(Unstructured Information)非結構化信息指信息的形式相對不固定,常常是各種格式的文件。
它是相對結構化信息而言的,從巨集觀上看也是結構化信息的一種 ...
非結構化信息
用手机看条目
扫一扫,手机看条目
出自MBA智库百科(https://wiki.mbalib.com/)
非結構化信息(UnstructuredInformation)
目錄
1什麼是非結構化信息
2結構化信息與非結構化信息
3構建非結構化信息產業
4相關條目
[編輯]什麼是非結構化信息
非結構化信息指信息的形式相對不固定,常常是各種格式的文件。
它是相對結構化信息而言的,從巨集觀上看也是結構化信息的一種形式。
諸如電子文檔、電子郵件、網頁、視頻文件、多媒體等.
[編輯]結構化信息與非結構化信息
對於來源繁多的信息資料,專業人士根據信息的格式加以劃分,將其分為結構化信息和非結構化信息兩大類。
結構化信息是可以數字化的數據信息,可以方便地通過電腦和資料庫技術進行管理。
無法完全數字化的信息稱為非結構化信息,如文檔文件、圖片、圖紙資料、縮微膠片等。
這些資源中擁有大量的有價值的信息。
現在這類非結構化信息正以成倍的速度增長。
另一種定義:
結構化信息,我們通常接觸的資料庫所管理的信息,包括生產、業務、交易、客戶信息等方面的記錄。
非結構化信息,專業術語為內容,所涵蓋的信息更為廣泛,可分為:營運內容(operationalcontent):如合約、發票、書信與採購記錄;部門內容(workgroupcontent):如文書處理、電子錶格、簡報檔案與電子郵件;Web內容:如HTML與XML等格式的信息;多媒體內容(RichMediaContent):如聲音、影片、圖形等。
如果說結構化信息更多的忠實、詳實地記錄了企業的生產交易活動,是顯性的表示,那麼非結構化信息則隱性包含了掌握著企業命脈的關鍵,隱含著許多提高企業效益的機會。
對於企業來說,企業內部,以及企業與供應商、客戶、合作伙伴和員工數字化共用所有形式的數據資源,已越來越重要。
90%的信息和知識在“結構化”世界之外,IT應用中還存在著一個“非結構化”的世界。
對大多數企業來說,ERP等業務系統所管理的結構化數據只占到企業全部信息和知識的10%左右,其他的90%都是資料庫難以存取到的非結構化信息和知識。
來自IDC的分析顯示,雖然很多企業投資不菲建立了諸多業務支撐系統,但仍有72%的管理者認為知識沒有在他們的組織得到重覆利用,88%的人認為他們沒有接觸到企業最佳實踐的機會。
Gartner也曾預言,對非結構化信息和知識的管理將會帶來一個新IT應用潮流。
目前的非結構化信息處理類似於上世紀70年代以前的結構化信息應用。
割裂、無法進行數據互操作的應用是其主流。
以人們最常用的文檔軟體來看,DOC文檔是MSWORD與WPS的專用格式,永中、中文2000等OFFICE產品廠商則各有各的“自留地”。
這種情況下,由於文檔格式的束縛而使信息四分五裂,信息流無法通暢流轉,信息處理更加困難,信息資源因為“信息流的不通暢”而喪失了其應有的巨大價值。
從非結構化到半結構化,從半結構化到結構化,從結構化到關聯數據體系,從關聯數據體繫到數據挖掘,從數據挖掘到故事化呈現,從故事化呈現到決策導向。
互連網上出現的海量信息,大概分為結構化、半結構化和非結構化三種。
結構化信息如電子商務信息,信息的性質和量值的出現的位置是固定的;半結構化的信息如專業網站上的細分頻道,其標題和正文的語法相當規範,關鍵詞的範圍相當局限;非結構化的信息如BLOG和BBS,所有內容都是不可預知的。
結構化信息和非結構化信息是IT應用的兩個世界,它們有著各自不同的應用進化特點和規律。
但是,這兩個世界之間還缺少相互連接的橋梁,而這種缺失使企業中不可避免地存在“活動”、“信息和知識”的分離,其後果就是:雖然它們都在進行著“知識化”的努力,但兩個世界分離的IT應用模式,註定使其難以真正實現它們的初衷——“在最合適的時間,將最合適的信息傳送給最合適的人”。
[編輯]構建非結構化信息產業
中國的軟體產業無法在結構化信息產業中獲得主動地位,但歷史並不會停留在這一個領域內。
整個信息產業還有更大的市場有待開發:這就是非結構化信息應用。
通俗地說,結構化信息是一些可以用表格來描述的信息。
除此之外還有大量的文檔、流媒體信息等非結構化信息。
但事實上,現實社會中,非結構化信息占據著80%以上的份額。
這部分信息目前仍處於低效率的處理階段,它給世界信息產業發展留下了空間,也給中國軟體產業的跨越式發展帶來了契機。
目前的非結構化信息處理仍處於類似於上世紀70年代以前的結構化信息應用。
割裂地、無法進行數據互操作的應用是它的主流。
以人們最常用的文檔軟體來看,DOC文檔是MSWORD與WPS的專用格式,永中、中文2000等OFFICE產品廠商則各有各的“自留地”。
這種情況下,由於文檔格式的束縛而使信息四分五裂,信息流無法通暢流轉,信息處理更加困難。
我們可以想象,有多少信息資源因為“信息流的不通暢”而喪失了其應有的巨大價值。
基於諸如此類的問題和現狀,文檔庫技術的成展成為信息產業下一步發展不可避免的潮流。
文檔庫產業也將成為一個比資料庫產業更加重要的核心產業,關係到信息技術的發展進程。
文檔庫技術應用意味著文檔信息可以像結構化信息應用操作一樣,文檔信息的構建只要符合一個特定的數學模型,並設計一種可以對所有符合這種數學模型的文檔進行各種操作的標準,文檔應用軟體就可以對所有此類文檔進行相應的操作——就像一個ERP軟體通過SQL操作關係型資料庫時可以不必去考慮你底層用的是DB2還是ORACLE一樣。
一個令人振奮的消息是,北京書生公司近日宣佈推出了其SEP文檔庫技術,並已經形成可以實際應用的文檔模型描述和相應的操作標準——UOML(UnstructuredOperationMarkupLanguage,非結構化操作標記語言)。
這意味著,中國的企業有可能成為非結構化信息產業發展中核心技術的持有者和標準的制訂者。
可以想象,占整個信息領域20%的結構化信息產業發展帶來了超過千億美元量級的產業,那麼,占整個信息領域80%的非結構化信息產業一旦走上正軌,它將帶來怎樣的市場機會。
這是很多人不敢想象的數字!
按照書生董事長王東臨教授的介紹,由書生公司發起的UOML聯盟已經啟動,TRS、中文2000、漢王、中科院軟體所、中標、中科啟信、星火燎原等國內的IT企業已加入其中,理光、Fatwire、Autonomy等單位也均有意向加入聯盟,正在洽談過程中。
作為計劃推進的一部分,加入UOML聯盟的企業將首先實現相關操作的互操作問題。
如10家聯盟企業有各自的文檔處理軟體,以往這10種軟體所保存的文檔無法被其他軟體操作,而加入聯盟後的這10種軟體可以操作其他任何一個軟體生成的文檔。
由於文檔庫及UOML的應用,這些軟體完成這種改造只需要一兩個小時到一個星期的開發工作(視操作功能而定)。
“比如其中有一家加入聯盟的企業只是想讓他的軟體可以打開符合UOML標準的文檔,那他只需要花一天去修改他的軟體。
”
這既是文檔庫技術給文檔信息處理帶來的巨大優勢,也是推動非結構化信息產業發展的關鍵。
[編輯]相關條目
結構化信息
取自"https://wiki.mbalib.com/zh-tw/%E9%9D%9E%E7%BB%93%E6%9E%84%E5%8C%96%E4%BF%A1%E6%81%AF"
本條目對我有幫助11
赏
MBA智库APP
扫一扫,下载MBA智库APP
分享到:
下载MBA智库,阅读全文
温馨提示
复制该内容请前往MBA智库App
立即前往App
如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目或投訴舉報。
本條目相關文檔
基於SOA的非結構化信息檢索的模型研究4頁 結構化&非結構化雙料管理人業績分析2頁 談談半結構化和非結構化財政問題的解決途徑3頁 非結構化面試評價表1頁 基於蟻群演算法的非結構化P2P信息檢索6頁 {管理信息化ORACLE}Oracle企業門戶內容管理解決方案結構化內容及非結構化內容)67頁 結構化主體信息披露的探討3頁 {管理信息化ORACLE}Oracle11g對非結構化數據的管理之SecureFiles19頁 非結構化數據的三維關係存儲模型6頁 {管理信息化ORACLE}Oracle11g對非結構化數據的管理——SecureFiles19頁 更多相關文檔
本条目相关课程
本条目由以下用户参与贡献
Dan,Cabbage,Wangdong,Zfj3000,Yixi,KAER,连晓雾,Lin,苏青荇. 頁面分類:信息類型
評論(共0條)提示:評論內容為網友針對條目"非結構化信息"展開的討論,與本站觀點立場無關。
發表評論請文明上網,理性發言並遵守有關規定。
导航
首页
文档
百科
课堂
商学院
资讯
国际MBA
商城
企业服务
個人工具
用戶登錄創建新帳號
打开APP
搜索
全球专业中文经管百科,由121,994位网友共同编写而成,共计431,954个条目
首页
管理
营销
经济
金融
人力资源
咨询
财务
品牌
证券
物流
贸易
商学院
法律
人物
分类索引
查看
條目討論編輯收藏
简体中文繁体中文
工具▼
鏈入頁面
鏈出更改
上載文件 特殊頁面 可列印版
永久链接
導航
最新資訊
最新评论
最新推荐
热门推荐
编辑实验
使用帮助
创建条目
随便看看
INFP德國默克集團ISTP(人格特質理論)ENFPINFJ第一性原理波特五力分析模型GDPISFP墨菲定律
奶頭樂理論蘑菇管理定律猴子管理法則情緒ABC理論100個最流行的管理辭彙垃圾人定律21天效應破窗效應SWOT分析模型墨菲定律
以上内容根据网友推荐自动排序生成
最後更改10:19,2016年10月9日.
智库首页-
百科首页-
关于百科-
客户端-
人才招聘-
广告合作-
权利通知-
联系我们-
免责声明
-友情链接
©2022MBAlib.com,Allrightsreserved.
闽公网安备35020302032707号
问题分类
类型
反馈内容
添加图片(选填)0/9
联系方式
取消
提交
提交成功
反馈结果请前往MBA智库App查看(我的>帮助与反馈>我的反馈)
知道了
延伸文章資訊
- 1什么是非结构化数据? - Teradata
非结构化数据是指没有固定组织原则的未经过滤的信息。它通常被称为原始数据。常见示例包括网页日志、XML、JSON、文本文档、图像、视频和音频文件。通过对非结构化数据 ...
- 2非結構化數據_百度百科
非結構化數據是數據結構不規則或不完整,沒有預定義的數據模型,不方便用數據庫二維邏輯表來表現的數據。包括所有格式的辦公文檔、文本、圖片, HTML、各類報表、圖像和 ...
- 3結構化與非結構化資料| Seagate 台灣
裝置或軟體將移往資料湖的原始格式資訊收集後,原始的輸出資料便是非結構化資料。結構化資料會以數值或文字格式整理妥當,可在預先定義的參數內將資料分門別類、重組分析。
- 4淺談資料格式— 結構化與非結構化資料 - Medium
非結構化資料在資料庫裡則意指:沒有固定欄位,也沒有固定格式。例如:影像檔、語音檔、圖檔、Office檔案、PDF檔、e-mail、網頁等。半結構化資料在資料 ...
- 5結構、半結構、非結構式資料是啥意思? - kevinwang
非結構式資料(unstructured data) ... 一言以蔽之,非結構式資料就是亂成一團,讓人無從打理起的資料。舉例來說,一支影片、一串缺乏欄位概念的純文字等都是。 此處的差異不 ...