這個(gè)系列文章描述了一個(gè)單一的語(yǔ)義數(shù)據(jù)模型來支持物聯(lián)網(wǎng)和建筑、企業(yè)和消費(fèi)者的數(shù)據(jù)轉(zhuǎn)換。 這種模型必須簡(jiǎn)單可擴(kuò)展, 以便能夠在各行業(yè)領(lǐng)域之間實(shí)現(xiàn)插件化和互操作性。 對(duì)于一個(gè)目前從事智能硬件的老碼農(nóng),覺得這些文字具有積極的參考意義。這一部分定義了數(shù)據(jù)語(yǔ)義。
互操作性, 或計(jì)算機(jī)系統(tǒng)或軟件交換或使用資訊的能力[1] , 是參與如今信息經(jīng)濟(jì)所有設(shè)備的一項(xiàng)要求。 傳統(tǒng)上, 互操作性主要是在網(wǎng)絡(luò)通信背景下定義的。 但隨著從智能家居、智能建筑到智能能源、零售以及醫(yī)療保健和交通等行業(yè), 數(shù)以百萬計(jì)的設(shè)備正在連接, 因此現(xiàn)在需要一個(gè)更廣泛的定義, 來考慮互操作性對(duì)系統(tǒng)以及系統(tǒng)性能的跨領(lǐng)域影響。
著名的網(wǎng)絡(luò)互操作性框架是OSI模型。 OSI 模型通過七個(gè)不同的抽象層提供了一個(gè)互操作性的框架, 這些抽象層通過分享軟件中的應(yīng)用程序數(shù)據(jù)(第7層)從物理媒體中的底層傳輸(第1層)。 這些圖層及作用的簡(jiǎn)要描述見圖1。
圖1 | OSI 模型概述了電信和計(jì)算網(wǎng)絡(luò)互操作性的七個(gè)抽象層
雖然 OSI 模型的每一個(gè)抽象層都有助于整個(gè)網(wǎng)絡(luò)的互操作性, 但每個(gè)抽象層都是弗吉尼亞建模分析和模擬中心(VMASC)定義的互操作性模型(LCIM)[2]中的三類互操作性之一。 這就是技術(shù)互操作性、句法互操作性和語(yǔ)義互操作性[3] :
技術(shù)互操作性是網(wǎng)絡(luò)交換任何形式原始信息的基本能力。 技術(shù)互操作性由 OSI 棧(層1-4)的較低層級(jí)管理, 這些層次定義了網(wǎng)絡(luò)上各點(diǎn)之間可靠傳輸和接收數(shù)據(jù)的基礎(chǔ)設(shè)施。
句法互操作性是在兩臺(tái)或多臺(tái)機(jī)器之間交換結(jié)構(gòu)化數(shù)據(jù)的能力, 通常由 OSI 模型的第5層和第6層處理。 在這里, XML 和 JSON 等標(biāo)準(zhǔn)數(shù)據(jù)格式提供了語(yǔ)法, 使系統(tǒng)能夠識(shí)別正在傳輸或接收的數(shù)據(jù)類型。
語(yǔ)義互操作性使系統(tǒng)能夠以上下文的方式從結(jié)構(gòu)化數(shù)據(jù)中解釋意義,并在 OSI 棧的第7層中實(shí)現(xiàn)。
在 OSI 框架中, 每個(gè)抽象層的正確實(shí)現(xiàn)都有助于實(shí)現(xiàn)互操作性, 技術(shù)上的互操作性使得句法互操作性得以實(shí)現(xiàn), 進(jìn)而又可以實(shí)現(xiàn)語(yǔ)義互操作性。 技術(shù)互操作性目前在多領(lǐng)域通信網(wǎng)絡(luò)中得到很好的理解和標(biāo)準(zhǔn)化, 這使得句法和語(yǔ)義層成為了真正可互操作的M2M數(shù)據(jù)通信的關(guān)鍵因素。
在 OSI 模型的第1至第4層提供了一套基于協(xié)議的網(wǎng)絡(luò)基礎(chǔ)設(shè)施技術(shù), 而句法和語(yǔ)義互操作性通常依賴于針對(duì)特定行業(yè)的格式和協(xié)議, 并根據(jù)現(xiàn)有的系統(tǒng)和數(shù)據(jù)類型進(jìn)行優(yōu)化。 這一事實(shí)導(dǎo)致了對(duì)現(xiàn)有網(wǎng)絡(luò)基礎(chǔ)設(shè)施進(jìn)行了數(shù)十億美元的投資, 以支持在這些垂直市場(chǎng)上的 M2M 通信[4]。
為了在這些情況下促進(jìn)廣泛的句法互操作性, 工業(yè)互聯(lián)網(wǎng)聯(lián)盟(IIC)最近發(fā)布了"工業(yè)互聯(lián)網(wǎng)連接框架"或 IICF [3]。 IICF 重新定義了傳統(tǒng)的 OSI 模型, 將表示層和會(huì)話層(第5層和第6層)結(jié)合起來, 提供所有必要的機(jī)制, 以便"促進(jìn)數(shù)據(jù)如何由端點(diǎn)無歧義地結(jié)構(gòu)化和解析"(圖2)。 跨行業(yè)領(lǐng)域的句法互操作性得到了一套"核心連接標(biāo)準(zhǔn)"(目前為數(shù)據(jù)分配服務(wù)(DDS)、 opc-unify 架構(gòu)(OPC-UA) , oneM2M, 以及 web services) , 這些標(biāo)準(zhǔn)通過一套擬議的標(biāo)準(zhǔn)化網(wǎng)關(guān)進(jìn)行通信。
圖2 | IIC的連接框架層為不同系統(tǒng)和領(lǐng)域的句法互操作性提供了基礎(chǔ)
IICF 框架層允許在不同服務(wù)質(zhì)量(QoS)級(jí)別上在應(yīng)用程序之間傳輸?shù)臓顟B(tài)、事件和流。 這樣的架構(gòu)足以滿足句法互操作性的要求。
除了 IICF 的句法互操作層之外, 還有信息層(OSI 模型中的應(yīng)用層) , 這個(gè)層面的語(yǔ)義互操作性尚未確定。 在這里發(fā)生的分布式數(shù)據(jù)管理和互操作性依賴于兩臺(tái)或多臺(tái)機(jī)器之間的指定本體, 可以自動(dòng)而準(zhǔn)確地解釋交換數(shù)據(jù)的含義(上下文) , 并將其應(yīng)用到一個(gè)有價(jià)值的目標(biāo)。 正如 IICF 對(duì)于句法互操作性的方法所建議的, 本體必須考慮到在不同的系統(tǒng)和環(huán)境之間交換的元數(shù)據(jù)。 它代表了連接系統(tǒng)之間最高級(jí)別的互操作性。
一些行業(yè)組織努力實(shí)施涵蓋盡可能廣泛的行業(yè)和系統(tǒng)的語(yǔ)義數(shù)據(jù)模型(信息模型)。 它們包括 Object Management Group (OMG)、 IPSO 聯(lián)盟、開放連接基金會(huì)(OCF)、開放組織、 zigbee、 Global Standards 1(GS1)、 Schema.org、 Project Haystack 等。 然而, 它們?cè)趯?shí)現(xiàn)適用于基礎(chǔ)廣泛的跨行業(yè)用例語(yǔ)義數(shù)據(jù)方案方面基本上沒有成功, 因?yàn)樗鼈兊慕?jīng)驗(yàn)往往基于一系列狹窄的技術(shù)或行業(yè)細(xì)分。
下面描述了如何利用每種方法的最佳屬性來實(shí)現(xiàn)跨多個(gè)行業(yè)和環(huán)境的可伸縮語(yǔ)義互操作性。
物聯(lián)網(wǎng)正在改變我們的世界, 影響著我們管理和操作環(huán)境的方式, 比如家庭、建筑、商店、醫(yī)院、工廠和城市。 低成本的傳感器, 更強(qiáng)大的控制器, 云服務(wù), 智能設(shè)備和新的軟件應(yīng)用使得從設(shè)備到供應(yīng)鏈的一切事物都得到了新的管理。
智能設(shè)備正在大幅增加從環(huán)境中獲得數(shù)據(jù)的數(shù)量和類型, 而新型的軟件應(yīng)用程序正在創(chuàng)造新的方式從這些數(shù)據(jù)中獲益。 這些進(jìn)展共同推動(dòng)了我們?nèi)绾喂芾砗筒僮鬟@些環(huán)境的根本性轉(zhuǎn)變, 使我們能夠從基于簡(jiǎn)單反饋回路的傳統(tǒng)控制戰(zhàn)略轉(zhuǎn)變?yōu)橐詳?shù)據(jù)為導(dǎo)向的方法, 使締約方能夠?qū)崟r(shí)了解智能設(shè)備和系統(tǒng)的實(shí)際運(yùn)行情況。
所有這些趨勢(shì)都有助于提高效率, 并在有效使用的情況下, 推動(dòng)整體業(yè)務(wù)成本的節(jié)省。 然而, 獲取數(shù)據(jù)是一回事, 讓數(shù)據(jù)具有可操作性是另一回事。 由于現(xiàn)有的數(shù)據(jù)比以往任何時(shí)候都多, 因此產(chǎn)業(yè)面臨著新的挑戰(zhàn)。
毫無疑問, 物聯(lián)網(wǎng)和自動(dòng)化系統(tǒng)的廣泛應(yīng)用所面臨的最大障礙是互操作性。 麥肯錫公司的一份報(bào)告中估算, 實(shí)現(xiàn)物聯(lián)網(wǎng)的互操作性將會(huì)為總的可用市場(chǎng)中增加40% 的額外價(jià)值。
智能設(shè)備的數(shù)據(jù)以多種不同的格式存儲(chǔ)和傳遞。 它有不一致的、非標(biāo)準(zhǔn)的命名約定, 并提供非常有限的描述符用于理解其含義。 簡(jiǎn)單地說, 智能設(shè)備和自動(dòng)化系統(tǒng)的數(shù)據(jù)缺乏信息來描述它自己的意思。 如果沒有意義, 就需要進(jìn)行耗時(shí)的規(guī)范化努力, 才能有效地利用數(shù)據(jù)來產(chǎn)生價(jià)值。 現(xiàn)狀是, 當(dāng)今設(shè)備的數(shù)據(jù)雖然在技術(shù)上是"可用的", 但卻難以使用, 從而限制了締約方充分受益于數(shù)據(jù)[5]中所承載的價(jià)值。
為了充分利用分析應(yīng)用、遠(yuǎn)程設(shè)備管理和自動(dòng)化系統(tǒng)等程序中的數(shù)據(jù), 我們需要知道數(shù)據(jù)的含義。 例如, 如果從智能建筑系統(tǒng)中的傳感器點(diǎn)獲得數(shù)據(jù), 它可能包含一個(gè)值為77.6。
[圖3 | 示例傳感器值]
首先,在理解值的數(shù)據(jù)類型之前, 我們不能做任何有效的分析或處理。 這個(gè)值是否代表溫度、速度、壓力或其他數(shù)據(jù)類型?
[圖4 | 數(shù)據(jù)類型語(yǔ)義的示例值]
如果這個(gè)值代表一個(gè)溫度, 那么我們需要知道它是77.6華氏度還是攝氏度呢? 度量單位是我們理解和使用數(shù)據(jù)所需要的另一個(gè)基本描述符。
[圖5 | 單元語(yǔ)義的示例值]
繼續(xù)這個(gè)例子, 如果只知道數(shù)據(jù)類型(溫度)和測(cè)量單位(華氏度) , 我們?nèi)匀徊惶私膺@個(gè)值的重要性。 溫度值是否代表空氣、水或其他環(huán)境條件?
如果是建筑物某一樓層的空氣溫度, 對(duì)于住戶來說可能有點(diǎn)熱。 如果是鍋爐的水溫, 那就太涼了。
[圖6 | 對(duì)象語(yǔ)義的示例值]
最后, 如果價(jià)值代表一個(gè)建筑物內(nèi)部某層的一個(gè)空氣溫度, 那么當(dāng)建筑是空置的時(shí)候, 它可能是很好的, 但是當(dāng)它被使用的時(shí)候可能就不是這樣了。 所以事件的日期和時(shí)間也很重要。
[圖7 | 示例值與時(shí)間戳]
讓我們假設(shè)值為77.6的傳感器由名稱(即標(biāo)識(shí)符)"zn3-wwfl4"來識(shí)別。 如果我對(duì)安裝時(shí)使用的建筑系統(tǒng)和命名約定非常熟悉, 我也許能夠確定這意味著西翼第3區(qū), 第4層等這些信息來解決問題。如果我對(duì)這座建筑了如指掌, 我也許還能看出,"zn3-wwfl4"標(biāo)識(shí)符是按照第1號(hào)占用調(diào)度時(shí)間表(上午7時(shí)30分至下午6時(shí)30分)運(yùn)作的樓層空氣溫度。
有了這些額外的信息, 可以確定一個(gè)工作日上午9點(diǎn)的值為77.6是不合適的, 因?yàn)樘鞖馓珶? 會(huì)導(dǎo)致乘客投訴。 然而, 使我能夠作出這一決定的是有關(guān)特定傳感器含義的大量信息。 我之所以碰巧掌握這些信息, 是因?yàn)槲覀€(gè)人對(duì)建筑物的了解, 但是在控制系統(tǒng)(或任何一個(gè)數(shù)據(jù)存儲(chǔ)器中沒有記錄到的信息) 中, 可能不能夠以任何一致的"機(jī)器可讀"格式提供。
這就是利用現(xiàn)有系統(tǒng)和設(shè)備產(chǎn)生豐富數(shù)據(jù)的挑戰(zhàn)——數(shù)據(jù)的表示、交流和解釋能力。 這種"關(guān)于數(shù)據(jù)的數(shù)據(jù)表示"通常被稱為元數(shù)據(jù)或數(shù)據(jù)語(yǔ)義。
有關(guān)傳感器點(diǎn)的適當(dāng)元數(shù)據(jù)將使我們能夠了解目前77.6的價(jià)值所產(chǎn)生的影響, 而不需要依靠個(gè)人對(duì)系統(tǒng)的了解。 如上所述, 如果我們知道與傳感器相關(guān)位置的相關(guān)時(shí)間, 我們就可以確定它在被占用的時(shí)間段溫度過高, 而且用戶很可能會(huì)感到不舒服。
然而, 如果沒有必要的元數(shù)據(jù), 我們無法確定當(dāng)前值的影響及其與相關(guān)運(yùn)行系統(tǒng)的關(guān)系。因此, 為了有效地使用數(shù)據(jù), 我們需要將元數(shù)據(jù)和傳感器值結(jié)合起來。 當(dāng)人工完成時(shí), 這個(gè)過程被稱為映射或數(shù)據(jù)規(guī)范化。對(duì)于如數(shù)據(jù)分析、遠(yuǎn)程設(shè)備管理和自動(dòng)化系統(tǒng)這些新實(shí)施的軟件應(yīng)用程序,時(shí)間序列數(shù)據(jù)處理是一個(gè)耗費(fèi)時(shí)間的過程。
有趣的是, 在過去的十年里, 標(biāo)準(zhǔn)的通信協(xié)議幾乎沒有為大多數(shù)自動(dòng)化系統(tǒng)提供任何能力來捕捉他們所包含數(shù)據(jù)的語(yǔ)義信息。 沒有一種標(biāo)準(zhǔn)化的方法來表達(dá)它們所產(chǎn)生或包含的數(shù)據(jù)含義。 該系統(tǒng)提供帶有標(biāo)識(shí)符的傳感器點(diǎn)(zn3-wwfl4) , 一個(gè)值(77.6)和單位(華氏度) , 但是其他信息很少。 結(jié)果是需要一個(gè)勞動(dòng)密集的過程來"映射"數(shù)據(jù)(數(shù)據(jù)映射) , 然后才能開始有效使用傳感器數(shù)據(jù)。 顯然, 這對(duì)有效使用智能設(shè)備中的數(shù)據(jù)造成了重大障礙。
[圖8 | 數(shù)據(jù)交換和規(guī)范化]
分析人士預(yù)測(cè), 到2020年, 物聯(lián)網(wǎng)將有超過250億個(gè)連接設(shè)備。 總之, 這些設(shè)備將產(chǎn)生前所未有的數(shù)據(jù)量, 為了創(chuàng)造價(jià)值, 必須有效地索引、共享、存儲(chǔ)、查詢和分析。
越來越多的數(shù)據(jù)被規(guī)范化為時(shí)間序列數(shù)據(jù)——標(biāo)有時(shí)間戳的數(shù)據(jù)——并以定期(基于間隔)或狀態(tài)(或值)更改(基于事件)進(jìn)行傳輸。
[圖9 | 時(shí)間序列和事件]
雖然應(yīng)用分析程序只需要時(shí)間序列數(shù)據(jù)的單向流動(dòng), 但自動(dòng)化系統(tǒng)需要雙向數(shù)據(jù)流, 以便將測(cè)量數(shù)據(jù)從傳感器和指令消息傳遞給執(zhí)行器。
[圖10 | 雙向數(shù)據(jù)流]
那么我們?nèi)绾潍@取所有這些信息, 分享它, 并將它與我們的自動(dòng)化系統(tǒng)和智能設(shè)備中的數(shù)據(jù)元素聯(lián)系起來呢? 不能僅僅通過使用標(biāo)準(zhǔn)化的點(diǎn)標(biāo)識(shí)符來做到這一點(diǎn)。 即使在這個(gè)的簡(jiǎn)單例子中, 我們有更多的元數(shù)據(jù)才能有效地捕捉到一個(gè)點(diǎn)標(biāo)識(shí)符。 除此之外, 我們可能希望隨著時(shí)間推移增加許多其他數(shù)據(jù)元素, 這遠(yuǎn)遠(yuǎn)超出了這個(gè)簡(jiǎn)單的例子, 顯然我們需要另一種方法。 有效的解決辦法必須具有以下特點(diǎn):
點(diǎn)標(biāo)識(shí)符與相關(guān)元數(shù)據(jù)的解耦合。事實(shí)上, 我們有成千上萬個(gè)系統(tǒng)中的數(shù)百萬個(gè)點(diǎn)和它們的點(diǎn)標(biāo)識(shí)符且無法改變。我們需要的是一個(gè)標(biāo)準(zhǔn)化的模型來聯(lián)系點(diǎn)標(biāo)識(shí)符和元數(shù)據(jù)。
應(yīng)該利用一個(gè)點(diǎn)標(biāo)識(shí)符元數(shù)據(jù)的標(biāo)準(zhǔn)化庫(kù)來提供元數(shù)據(jù)的一致性。這將使軟件應(yīng)用程序能夠解釋數(shù)據(jù)意義, 而不需要數(shù)據(jù)的規(guī)范化。隨著新應(yīng)用的涌現(xiàn), 標(biāo)準(zhǔn)庫(kù)需要由行業(yè)組織維護(hù),使元數(shù)據(jù)具有良好的擴(kuò)展性。
語(yǔ)義互操作性面臨的一個(gè)關(guān)鍵挑戰(zhàn)是, 能否在不同行業(yè)領(lǐng)域之間實(shí)現(xiàn)互操作性, 每個(gè)行業(yè)都有自己的環(huán)境和互操作性的應(yīng)用場(chǎng)景。 在本系列接下來的部分中, 討論了五個(gè)相互關(guān)聯(lián)的行業(yè)——住宅與建筑、能源、零售、醫(yī)療和運(yùn)輸及物流。
[圖11 | 工業(yè)用例受益于語(yǔ)義互操作性]
“Oxford Dictionaries – Dictionary, Thesaurus, & Grammar.” Oxford Dictionaries | English. Accessed June 20, 2017. https://en.oxforddictionaries.com/.
Andreas, T., et al. “Applying the Levels of Conceptual Interoperability Model in Support of Integratability, Interoperability, and Composability for System-of-Systems Engineering.” Virginia Modeling Analyses & Simulation Center, Old Dominion University. Accessed June 20, 2017. http://www.iiisci.org/journal/cv$/sci/pdfs/p468106.pdf
“The Industrial Internet of Things Volume G5: Connectivity …” Accessed June 20, 2017. https://www.iiconsortium.org/pdf/IICPUBG5V1.0PB_20170228.pdf
ReportsnReports. “M2M, IoT & Wearable Technology Market – 30% CAGR for Installed Base Connections by 2020.” PR Newswire: news distribution, targeting and monitoring. June 21, 2016. Accessed June 20, 2017. http://www.prnewswire.com/news-releases/m2m-iot–wearable-technology-market—30-cagr-for-installed-base-connections-by-2020-583815741.html.
Petze, John. “Describing the Meaning of Data—An Introduction to Data Semantics and Tagging”, Project Haystack Connections, Issue 1, Spring 2016.
聯(lián)系客服