一、動(dòng)力學(xué)研究——航空航天取得成功的理論基石
2021年3月26日,國家航天局發(fā)布2幅由我國首次火星探測任務(wù)天問一號探測器拍攝的南、北半球火星側(cè)身影像,這無疑是我國深空探測成果的一個(gè)縮影。自2020年7月23日成功發(fā)射以來,天問一號探測器已累計(jì)飛行兩百余天,為后續(xù)著陸和巡視探測奠定了良好的基礎(chǔ)。這一切的背后,離不開科研人員的持續(xù)攻關(guān),而相關(guān)的動(dòng)力學(xué)研究便是重要的攻關(guān)領(lǐng)域之一。
某動(dòng)力學(xué)科研機(jī)構(gòu)是為適應(yīng)中國航空航天事業(yè)發(fā)展需要而組建的,迄今為止已圓滿完成大量航空航天飛行器相關(guān)的科研任務(wù),獲得國家級和部委級科技進(jìn)步獎(jiǎng)千余項(xiàng)。作為國內(nèi)動(dòng)力學(xué)研究的核心力量,幾十年來,機(jī)構(gòu)科研人員默默堅(jiān)守,逐一攻克該領(lǐng)域發(fā)展中的層層阻礙,為我國邁向科技強(qiáng)國做出了突出貢獻(xiàn)。
二、檔案管理的新要求:數(shù)字化 合規(guī)化 智能化
該機(jī)構(gòu)積攢了大量的歷史檔案資料,絕大部分是以非結(jié)構(gòu)化數(shù)據(jù)存儲的電子文檔,包括紙質(zhì)檔案掃描件、錄音、錄像等。目前所采用的傳統(tǒng)IT架構(gòu)在海量檔案存儲管理面前顯得捉襟見肘。
海量小文件存儲
目前檔案掃描件數(shù)量超過1億,當(dāng)錄入文件數(shù)達(dá)到2000萬,原有的集中式存儲便已出現(xiàn)明顯性能瓶頸,影響數(shù)據(jù)讀取和備份效率。后續(xù)總文件數(shù)預(yù)計(jì)超過5億,傳統(tǒng)存儲顯然無法支撐。
檔案數(shù)據(jù)智能處理
由于檔案掃描件多是PDF格式,信息檢索查閱不便。比如:科研人員想要基于文獻(xiàn)內(nèi)容查閱歷史資料就很難實(shí)現(xiàn)。因此,該機(jī)構(gòu)要求存儲能夠?qū)呙杓M(jìn)行內(nèi)容提取,進(jìn)而支持基于內(nèi)容的檢索,提升效率。
全生命周期管理
按照合規(guī)要求,檔案需長期甚至永久保存,因此要制定生命周期管理策略,讓檔案數(shù)據(jù)在在線庫、近線庫和離線庫間自動(dòng)遷移。而目前無論是原有存儲本身還是檔案管理系統(tǒng)都沒有考慮此問題。
跨部門檔案收集
該機(jī)構(gòu)檔案資料分散在不同下屬機(jī)構(gòu),以往是通過移動(dòng)硬盤拷貝到傳統(tǒng)存儲中,效率低且存在安全風(fēng)險(xiǎn)。
為了滿足上述需求,客戶最終選擇杉巖MOS海量對象存儲替換原有傳統(tǒng)存儲,實(shí)現(xiàn)IT基礎(chǔ)架構(gòu)的演進(jìn)升級。
三、基于MOS構(gòu)建海量檔案智能存儲管理平臺
MOS支撐海量存儲與便捷管理
該平臺基于多臺杉巖對象存儲一體機(jī)構(gòu)建百TB級對象存儲資源池,滿足百億級小文件存儲和高效訪問的需求,為該機(jī)構(gòu)提供統(tǒng)一的非結(jié)構(gòu)化數(shù)據(jù)存儲和管理平臺,并通過生命周期管理策略、智能數(shù)據(jù)處理引擎等實(shí)現(xiàn)電子化檔案的集中存儲、全局管理、智能處理和自動(dòng)運(yùn)維。

圖1.基于MOS構(gòu)建海量檔案智能管理平臺
MOS智能數(shù)據(jù)處理引擎帶來效益加成
值得一提的是,MOS獨(dú)有的智能數(shù)據(jù)處理引擎在該方案為客戶帶來了極大價(jià)值。前述講到,檔案掃描件多是以單層的PDF文件形式進(jìn)行存儲,業(yè)務(wù)端無法基于PDF中的文字內(nèi)容進(jìn)行檢索,查閱資料十分不便。
通過MOS智能數(shù)據(jù)處理引擎集成的OCR識別插件,客戶可以根據(jù)需要設(shè)定文件處理策略,存儲自動(dòng)調(diào)用OCR識別功能,將單層PDF文件(文字不可讀取)轉(zhuǎn)為雙層PDF文件(文字可讀取),然后基于文字內(nèi)容通過檢索引擎建立全文索引,方便快速檢索查閱,充分發(fā)揮檔案資料的知識價(jià)值。

圖2.MOS智能數(shù)據(jù)處理引擎實(shí)現(xiàn)檔案數(shù)據(jù)智能處理
四、客戶價(jià)值
集合海量存儲核心引擎和智能數(shù)據(jù)處理引擎,MOS海量對象存儲為客戶帶來顯著價(jià)值。
安全合規(guī):海量數(shù)據(jù)永久保存
MOS承載包括紙質(zhì)檔案掃描件、視頻、圖片在內(nèi)的多種類型數(shù)據(jù),分布式架構(gòu)支撐海量小文件高效存取和未來擴(kuò)展性,滿足永久保存的合規(guī)性要求。
簡化管理:集中存儲與全局管理
基于MOS構(gòu)建統(tǒng)一的存儲和管理平臺,實(shí)現(xiàn)全局檔案自動(dòng)化管理,避免了單獨(dú)拷貝帶來的安全風(fēng)險(xiǎn),同時(shí)簡化了運(yùn)維。
效率提升:智能處理助力科研提效
通過智能數(shù)據(jù)處理引擎,存儲自身實(shí)現(xiàn)檔案數(shù)據(jù)處理,配合檢索工具,科研人員能夠快速獲取所需檔案資料,一定程度上提升了科研效率,讓檔案的知識價(jià)值最大化。
該項(xiàng)目基于MOS構(gòu)建的智能存儲管理平臺,不僅解決了客戶海量文件讀寫慢、共享管理難的痛點(diǎn)問題,同時(shí),也證明了MOS智能數(shù)據(jù)處理引擎在數(shù)據(jù)價(jià)值利用方面的效益加成,是傳統(tǒng)IT基礎(chǔ)架構(gòu)向新型分布式智能基礎(chǔ)架構(gòu)演進(jìn)的成功實(shí)踐。
特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,并請自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。