近年來,數(shù)字孿生(DigitalTwin)一詞迅速躥紅,成為一個炙手可熱的概念。但隨著工業(yè)界和學術界對數(shù)字孿生的不斷解讀,其含義卻越發(fā)撲朔迷離,和其他一些相關概念的界限也越來越模糊。數(shù)字孿生到底是什么,能做什么,邊界在哪里,它和建模仿真是什么關系等等問題令很多人困惑。本文嘗試對其中的一些疑惑進行粗淺的分析。
1 Digital Twin 到底指什么?
由于Digital Twin的中文翻譯莫衷一是(這個問題稍后會提到),暫時使用DT代表Digital Twin。
在信息領域,一個概念有多種解釋已是司空見慣的事情。不過大多概念雖然在開始出現(xiàn)時含義模糊,定義不明,但經過一段時間討論和沉淀之后,會逐漸形成一致的看法,比如云計算。而DT很有意思,它一開始的時候,含義還比較明確,但隨著研究的深入,定義和內涵卻越來越模糊。另外,很多概念,雖然有多種不同的定義和解釋,但大致的區(qū)別都在于要么看問題的角度和側重點不同,要么解釋的詳細程度不同,要么文字表述方式不同,而概念本身所指向的事物主體卻是確定的。像DT這樣,不同的定義指向不同的主體,卻不多見。
DT一詞,業(yè)界一般認為,是由密西根大學MichaelGrieves教授于2002年針對產品全生命周期管理(PLM)提出的一個概念,當初并不叫Digital Twin,而是叫鏡像空間模型(Mirrored Space Model, MSM),后來NASA的John Vickers將其命名為Digital Twin[1]。其模型的屬性是很清楚的,盡管當時沒有引起太多關注,卻也沒有什么歧義,DT就是一個數(shù)字化的模型。
但隨著NASA將其引入《NASA空間技術路線圖》,DT的含義發(fā)生了重要的變化。NASA給出的解釋是這樣的:DT是充分利用物理模型、傳感器更新、運行歷史等數(shù)據(jù),集成多學科、多物理量、多尺度、多概率的仿真過程,在虛擬空間中完成映射,從而反映相對應的實體裝備的全生命周期過程[2]。
DT的主體變成了仿真。
還是這個報告,又很明確地指出,NASA的Digital Twin就是“基于仿真的系統(tǒng)工程”(Simulation-Based Systems Engineering)。
DT的主體又變成了系統(tǒng)工程。
NASA對DT的這些解讀大概是引起后續(xù)DT的定義和內涵含糊不清的根源。我們不妨列舉一些有代表性的定義。
(1) DT是物理設備的一個實時的數(shù)字副本[3]。
(2) DT是有生命或無生命的物理實體的數(shù)字副本。通過連接物理和虛擬世界,數(shù)據(jù)可以無縫傳輸,從而使得虛擬實體與物理實體同時存在[4]。
(3) DT是對人工構建的或自然環(huán)境中的資產、流程或系統(tǒng)的數(shù)字表示[5]。
(4) DT是資產和過程的軟件表示,用于理解,預測和優(yōu)化性能以改善業(yè)務[6]。
(5) DT是實際產品或流程的虛擬表示,用于理解和預測對應物的性能特點[7]。
(6) DT是在云平臺上運行的真實機器的耦合模型,并使用來自數(shù)據(jù)驅動的分析算法以及其他可用物理知識的集成化知識對健康狀況進行仿真[8]。
(7) DT是物理對象或系統(tǒng)在其整個生命周期中的動態(tài)虛擬表示,使用實時數(shù)據(jù)實現(xiàn)理解,學習和推理[9]。
(8) DT使用物理系統(tǒng)的數(shù)字副本執(zhí)行實時優(yōu)化[10]。
(9) DT是現(xiàn)實世界和數(shù)字虛擬世界溝通的橋梁[11]。
圖1是上面各種定義中所提到的和DT有關的各個部分。包括①物理對象、②數(shù)據(jù)、③模型、④仿真和⑤仿真結果。
圖1 與DT相關的各個部分
這些定義分別將DT指向圖1中的不同部分。
第一類:定義(1)~(5)將DT定義為數(shù)字副本、數(shù)字表示、軟件表示或虛擬表示,指向③,即DT是一個隨物理對象實時更新的模型,因為不管是數(shù)字副本、數(shù)字表示還是軟件表示或虛擬表示,都屬于模型的范疇。
第二類:定義(6)~(8)將DT指向③和④,即DT是模型加仿真。
第三類:定義(9)將DT指向②和⑤,即DT是連接物理對象和模型之間的橋梁。
那么,作為一個嚴謹?shù)膶W術術語,哪一個更合理呢?不妨來分析一下。
第二類將建模和仿真合起來定義成一個新的概念,一方面沒有必要,另一方面也不合理。因為模型和仿真雖然密切相關,但確是兩件事情。模型是對事物的描述,而仿真則是基于模型的各種活動,就像兩個數(shù)的量綱不同,是不能直接相加成為一個數(shù)的。
第三類聽起來很有煽動性,但卻最不合理。如果將來自物理對象的數(shù)據(jù)或是仿真反饋的數(shù)據(jù)稱為“橋梁”到無可厚非,但這兩類數(shù)據(jù)都不能稱為物理對象的Twin。
因此,相對而言還是第一類定義最為合理,即DT就是物理對象的一個數(shù)字化模型。只不過這個模型可以實時接收來自物理對象的數(shù)據(jù),從而可以不斷演化以保持與物理對象的一致。當然并不是說之前的模型不具備演化特性,只不過之前模型的演化并沒有強調實時性。
在關于DT的理解中,還有一個問題令人困擾,即一個DT是否應該包含物理對象,即圖1中的①?這也使得很多人對于DT與信息物理系統(tǒng)的關系感到困惑。
造成這個問題的根源也來自NASA和美國空軍研究辦公室的相關文獻[12-13],它們認為DT的概念由三個不同的部分組成:物理產品,數(shù)字/虛擬產品以及兩個產品之間的連接。即圖1中的①②③甚至⑤。
但顯然這樣的解釋存在邏輯上的問題。如果DT里面包含物理系統(tǒng),那么這個Twin就沒有了參照物。因為Twin一定是和另一個人(或物體)相對而言的。當然如果將①和③合起來稱為Twins,即雙胞胎,倒還說得過去,但不能叫Digital Twins,因為其中一個是digital,另一個是physical。所以在DT概念里還是應該把物理對象和數(shù)字模型這兩部分區(qū)分開來。
按照前面的分析,若將DT定義為物理對象的一個數(shù)字化模型,那么DT和信息物理系統(tǒng)(Cyber Physical System)之間的關系就很容易理清了,即數(shù)字模型、基于數(shù)字模型的各種活動(仿真)、物理對象以及數(shù)字模型和物理對象之間的連接(數(shù)據(jù)及仿真結果)形成一個信息物理系統(tǒng),如圖2所示。
圖2 DT和信息物理系統(tǒng)之間的關系
另外,還有一個可能引起歧義的問題,即DT中是否應該包含從物理系統(tǒng)采集的數(shù)據(jù),即圖1中的②?本人認為,DT概念中不需要也不宜包含這類數(shù)據(jù),因為這里的模型是根據(jù)這些數(shù)據(jù)實時演化的,所以數(shù)據(jù)的信息將在模型中得到體現(xiàn)。而且關于數(shù)據(jù)還有一個專門的技術,即Digital Thread技術,它可以用來處理和Digital Twin有關的數(shù)據(jù)問題。
再來看一下關于DT 的中文翻譯問題。目前雖然數(shù)字孿生一詞用的較為普遍,但數(shù)字雙胞胎或數(shù)字化雙胞胎等稱謂仍然經常被使用。
DT最早翻譯為數(shù)字化雙胞胎或數(shù)字雙胞胎。后來經專家考證,改為數(shù)字孿生。大概的意思是說,雙胞胎是指兩個人,即雙胞胎兄弟或雙胞胎姐妹,對應的英文單詞應該是Twins,Twin則是指雙胞胎中的一個,所以應該叫孿生。其實孿生這個詞在中文里也少見單獨使用,多數(shù)情況下和兄弟、姐妹連用,如孿生兄弟、孿生姐妹等。不過單從詞義的準確性上講,用數(shù)字孿生對應Digital Twin,確實比數(shù)字雙胞胎更合理些。
聯(lián)想前面提到的關于DT概念的各種解釋,將DT譯為數(shù)字孿生,也就意味著,默認了DT是指模型這一事實,并且不包含物理系統(tǒng)。因為孿生指的是雙胞胎中的一個,顯然不包含所對應的物理系統(tǒng)本身。如果既包含模型部分又包含物理部分,那叫數(shù)字(化)雙胞胎應該更合適些,雖然也不算嚴謹,因為正如前面所說,物理系統(tǒng)不是數(shù)字的。
在中文文獻中,對DT還有一種解讀,即將其解釋為一種建模的過程和方法,也稱為數(shù)字孿生技術,而利用這一技術所構建的模型稱為數(shù)字孿生模型,或數(shù)字孿生體。這樣的解釋顯然和DT的基本含義無法對應。
對DT概念認識上的模糊不清,也是導致中文翻譯一直不能統(tǒng)一的一個重要原因。
綜上所述,筆者認為,將DT翻譯為數(shù)字孿生更符合其本來的含義。對于數(shù)字孿生可以這樣理解:
數(shù)字孿生是物理對象的數(shù)字模型,該模型可以通過接收來自物理對象的數(shù)據(jù)而實時演化,從而與物理對象在全生命周期保持一致?;跀?shù)字孿生可進行分析、預測、診斷、訓練等(即仿真),并將仿真結果反饋給物理對象,從而幫助對物理對象進行優(yōu)化和決策。物理對象、數(shù)字孿生以及基于數(shù)字孿生的仿真及反饋一起構成一個信息物理系統(tǒng) (cyberphysical systems)。面向數(shù)字孿生全生命周期(構建、演化、評估、管理、使用)的技術稱為數(shù)字孿生技術(DigitalTwin Technology)。
2 數(shù)字孿生背后的建模和仿真技術
作為學術研究,我們需要采用一個合理的且沒有歧義的概念,而不必糾結于NASA對于DT的解釋。但對于NASA所提到的NASA Digital Twin的真實目的卻不能忽視。事實上很多人對于DT的熱情和研究動機就來自于NASA Digital Twin為制造業(yè)的未來帶來的無限憧憬。
雖然我們對NASA關于DT概念的解釋并不認同,但換個角度想一想,NASA其實并沒有將DT當作一個嚴肅的學術術語來進行定義。其真正想表達的意思,是強調仿真的價值,即NASA飛行器研制需要遵循“基于仿真的系統(tǒng)工程”這一理念。
仿真技術幾乎是伴隨著計算機技術的誕生而產生的,自上世紀五十年代至今,已經經歷了六十多年的發(fā)展。由于仿真是以建立模型為基礎的,所以為了突出建模的重要性,建模和仿真常常一起出現(xiàn),即Modeling &Simulation,??s寫為M&S。
從下面的這段文字可以看出美國對建模和仿真的認識所達到的高度。這段文字摘錄自美國國會于2007年7月16日通過的487號決議[14]。
美利堅合眾國是一個偉大而繁榮的國家,而建模和仿真極大地促進了這一偉大和繁榮。
在美國,建模和仿真是計算機科學和數(shù)學的獨特應用,它基于模型或仿真的有效性、正確性和可重復性,以及成千上萬的美國人在建模和仿真事業(yè)中開發(fā)這些模型的能力。
政府、工業(yè)界和學術界的建模和仿真領域的成員為美國的整體福利做出了突出的貢獻,下面的例子可以部分體現(xiàn)建模和仿真為美國做出的貢獻,盡管這些貢獻不勝枚舉:
(1) 曼哈頓計劃期間,通過最早復現(xiàn)核鏈式反應過程的仿真,拓展了對核裂變的理解,最終促成了第二次世界大戰(zhàn)的結束;
(2) 作為“庫存管理計劃”的基本要素,使美國總統(tǒng)能夠在不進行真實核試驗的情況下,確保核武器庫存十年以上的安全性和可靠性,并展示了國家對核不擴散的承諾。
僅從上面兩項貢獻,便可看出建模和仿真的巨大威力。而在這個決議中,這樣的案例共羅列了11條。在該決議中還明確提出,建模和仿真是“國家核心技術(National Critical Technology)”。
下面的內容更加震撼。
1965年頒布的《高等教育法》是美國歷史上第一部高等教育立法,它通過擴展聯(lián)邦政府在高等教育財政領域的角色,使聯(lián)邦政府介入美國高等教育的發(fā)展,為美國高等教育普及化奠定了基礎。該法在美國高等教育改革中具有里程碑的意義[15]。
而2018年12月修訂生效的新版高等教育法,專門將建模和仿真作為一項重要的內容(20 U.S. Code § 1161v - Modeling andsimulation)列入其中[16],并使用大量篇幅說明政府和社會應如何推動建模和仿真技術在大學教育中的普及。在整個法案中,還沒有見到任何其他的一項技術能夠享受如此高的待遇,即使近年來熱火朝天的人工智能技術,都沒有出現(xiàn)。
從這兩個文件可以看出,建模和仿真技術的基礎性和長遠價值已遠遠超出其所在的技術領域范疇,將對國家利益和國家安全產生重大影響。
而在制造業(yè),建模和仿真也一直發(fā)揮著不可替代的作用。2000年,由美國DARPA、商務部、能源部、NSF聯(lián)合發(fā)布了一項國家級制造業(yè)發(fā)展戰(zhàn)略研究及推廣計劃“集成制造技術路線圖(IntegratedManufacturing Technology Roadmapping, IMTR)”。IMTR提出了未來制造業(yè)面臨的6個“重大挑戰(zhàn)”,即成為精良、高效的企業(yè),提高響應客戶的企業(yè),成為全面互聯(lián)的企業(yè),保持環(huán)境可持續(xù)性,進行知識管理,善于應用新技術。不難看出,這六大挑戰(zhàn)放到今天也仍然成立。IMTR進而提出了迎接這6大挑戰(zhàn)的4類技術對策,即面向制造的信息系統(tǒng),建模和仿真技術,制造工藝與裝備,企業(yè)集成。由此可見建模和仿真技術對于制造業(yè)的重要性。
而在此報告發(fā)布之前的1997年,美國國防部對武器采辦進行改革,最重要的改革就是提出“基于仿真的采辦”(Simulation Based Acquisition, SBA),即將建模和仿真應用于武器從需求分析到最終報廢的全生命周期過程。而洛克希德馬丁公司的F35則是第一個全面引進SBA概念而研制的產品。2017年11月,有報道稱,洛克希德馬丁公司將數(shù)字孿生列為未來國防和航天工業(yè)六大頂尖技術之首。洛馬的數(shù)字孿生背后其實是SBA,即基于仿真的采辦,這與NASA的基于仿真的系統(tǒng)工程如出一轍。
建模和仿真技術六十多年前誕生于美國,而且一直都在為美國的國家利益發(fā)揮著不可估量的作用,但美國人從來不把建模和仿真拿出來炒作。其中的原因值得我們深思。
3 對數(shù)字孿生不宜過度演繹,需保持清醒的頭腦
數(shù)字孿生(digital twin)這個詞之所以能夠走紅,很大程度上得益于這個詞本身的傳播特性,它形象,上口,通俗易懂,即使行外人也能從字面上明白個大概,而且還能引發(fā)無限的想象。對于科普或商業(yè)推廣,確實是個好詞。但作為一個學術術語,它卻缺乏應有的嚴謹性,至少到目前為止仍然如此。當前有兩種傾向值得關注,一是在概念上把數(shù)字孿生的內涵不斷放大,賦予越來越多的內容,致使與其他概念交叉甚至重疊;二是在應用上將傳統(tǒng)技術應用貼上數(shù)字孿生的標簽。這兩種傾向對數(shù)字孿生技術的發(fā)展都沒有好處。
正如前面說講,數(shù)字孿生背后是建模和仿真技術。數(shù)字孿生最誘人的地方,是數(shù)字模型和物聯(lián)網的結合,而這種結合的最終目的是為了將模型打磨得更加接近真實系統(tǒng)。物聯(lián)網技術為建模提供了一種新的強有力的手段,而且在對復雜系統(tǒng)機理缺乏足夠認識的情況下,還可基于所采集的數(shù)據(jù)利用人工智能技術對系統(tǒng)進行建模。這是對建模技術的發(fā)展和補充。而基于模型的分析、預測、訓練等活動,本來就是仿真要做的事。所以數(shù)字孿生本質上是新一代信息技術在建模和仿真中的應用。
經過半個多世紀的發(fā)展,建模和仿真已經形成了一個相當完善和系統(tǒng)的技術體系。事實上,在仿真領域,利用動態(tài)實時數(shù)據(jù)進行建模和仿真的方法和技術已經研究多年,如動態(tài)數(shù)據(jù)驅動的仿真(Dynamic Data Driven Simulations, DDDS),嵌入式仿真,硬件在回路的仿真等。當然,數(shù)字孿生作為仿真技術的重要內容,通過與新一代信息技術的融合,將進一步促進建模和仿真技術的發(fā)展。
另外,建模和仿真技術體系中很多可以直接用于數(shù)字孿生的研究和應用,包括理論、方法、標準、工具和平臺,而沒有必要在數(shù)字孿生的名義下重復開發(fā)。這也是NASA雖然提出2027年實現(xiàn)Digital Twin的目標,但后續(xù)并沒有就Digital Twin本身再建立新的技術體系的原因。因為所需要的技術、標準、工具和平臺等,在其建模和仿真技術體系里大多都已經存在了。換個標簽,再搞一套類似的東西,既浪費資源,又浪費時間。
數(shù)字孿生的火爆,名字起的好固然很重要,但更重要的還是得益于西門子、GE等行業(yè)大鱷們的推波助瀾。清醒的業(yè)內人士都清楚,數(shù)字孿生相關的核心技術大多掌握在外國人手中,如傳感技術、CAD技術、CAE技術、PLM技術、VR/AR技術等。西門子, Predix, 達索、PTC, SAP, Ansys等企業(yè)之所以大肆渲染數(shù)字孿生的迷人前景和應用價值,是因為他們確實掌握著數(shù)字孿生所必須的核心技術,而伴隨著數(shù)字孿生熱度的提升,真正熱賣的都是這些企業(yè)的產品。工業(yè)界對新概念的熱衷,都有其自身的目的,行內人都心知肚明。
然而,上面提到的這些核心技術和產品恰恰是我國目前最缺乏的。但有意思的是,在國內,對數(shù)字孿生的研究卻常常避重就輕,關注的多是些外圍的、非核心的東西,而且對其概念的熱情遠遠高于提出這一概念的美國以及其他工業(yè)發(fā)達國家。我們大多數(shù)時間熱衷于概念的炒作,說的多、做的少,做虛事兒多,做實事兒少。其實尚且不知,我們一輪一輪的吶喊,都是在為他人助威。
對于嚴重缺乏核心技術支撐的我們,在熱詞不斷涌現(xiàn)的今天,應該保持清醒的頭腦。埋頭研發(fā)卡脖子的關鍵技術才是硬道理。否則,我們既浪費了資源,又浪費了時間,最終失去的是發(fā)展的大好機遇和戰(zhàn)略主動權。(文章來源于:人工智能學家)