第758章 流形學習

姚夢娜提出的這個問題,對於常浩南來說,不難理解。

只是很難解決。

真要說起來的話,這涉及到文本挖掘、數據可視化、信息檢索、數據挖掘、機器學習乃至人工智能等一系列問題。

如果真做到姚夢娜所設想的那樣全自動化生產,那就是工業4.0了。

在1999年這個時間點上,顯然不大現實。

但不可能完全實現這一整套東西,並不意味着其中沒有可以作爲突破口的部分。

比如數據挖掘和信息檢索,就是千禧年附近很火熱的研究方向。

也就是一維數據。

再假設X中的數據樣本來自於或近似來自於低維嵌入空間中的數據Y={y1,y2,…,yn}Rd。

倒是旁邊的小超市,來來往往的人流量不少。

但當年的他作爲一個工科出身的普通技術人員,並沒有太多理論功底。

“信息……”

“這個麼……”

姚夢娜看了看紙上的一個名詞和三句話,也知道常浩南大概是沒什麼思路,乾脆站起身道:

“要不先去吃個飯?”

給定一組高維數據X={x1,x2,…,xn}RD,n爲數據樣本個數,D爲高維數據的維數。

不過,這個思路卻是可以被借鑑的。

3、提取到高質量的數據特徵,提升後續的數據表示和分類任務的效果。

而對於稍複雜一些的情況來說,要完全描述一個含義,往往需要一組數據。

姚夢娜的反應稍微慢了一點,剛想起身,又意識到還沒結賬,只好掏出錢包,無奈地走向收銀臺。

“在封裝步驟之前,專門找個人在流水線旁邊看着不就行了麼?”

餐桌周圍又恢復了平靜,只剩下偶爾發出的微弱咀嚼聲。

2、消除,或者至少降低隱藏在原始高維數據中的噪聲。

“?”

但與此同時,這一組數據又往往不只能描述這一個含義。

但主成分分析法只相當於找到投影距離最小的意義下的最佳線性映射,而現實中卻沒有那麼多簡單的線性問題。

常浩南思索半晌,又在紙上寫下了三個基本條件:

幾分鐘之後,當朱雅丹都快要吃完麪前盤子裡的炒麪時,常浩南突然開口道:

確實有點餓了。

1、對原始高維數據進行壓縮,降低原始高維數據的維度,進而節省存儲空間,同時也降低高維數據的計算複雜度。

朱雅丹瞬間縮了縮頭:

“我只是隨便一說……但有些時候人腦的作用或許還是沒辦法代替的……”

實際上,在常浩南重生之前,飛機設計和製造領域已經開始應用這方面的技術,他本人也接觸過不少。

正在低頭吃飯的姚夢娜一愣,旋即意識到常浩南這還是在思考剛纔她提出來的問題。

顯然,這並不能被算作是“完整且可行”的思路。

更何況數學這種東西,光靠俺尋思是尋思不出個一二三的。

小學和中學時候做的應用題,大體上就是這樣。

常浩南放下只吃了一口的羊湯麪,蹭地站起身,快步離開食堂。

不如先放鬆一下,換個思路。

……

常浩南搖搖頭否定道。

姚夢娜猜測道:

雖然她覺得在兩位博士面前有點班門弄斧,但最後還是沒忍住:

沒有反應。

但到了99年這會,大學生在宿舍備上幾袋甚至一箱,都不算什麼稀罕事了。

而對於理論研究來說,明確地提出問題,幾乎也就相當於走完了成功之路的一半。

朱雅丹滿腦袋問號地擡起頭,但看着常浩南思考的樣子,很有自知之明地沒有打擾。

實際生活中面臨的,其實大多數也是這種問題。

十五分鐘後,三人(連同朱雅丹)已經圍坐在了食堂二層的一個圓桌旁邊。

直到一陣來自腹部的叫聲把它從深思中吵醒。

“人類的大腦能夠通過某種辦法解析高維數據,從而獲取對外部世界的感知。”

在理想化的模型中,最好是一個數據就可以精確且唯一地描述一個含義。

“換句話說,具有高維數的外部信息必定潛在於一個低維空間中的非線性流形結構上……”

常浩南面前擺着一份熱氣騰騰的羊湯麪,但卻並沒有急着動筷子,而是出神地看着不遠處樓梯口上上下下的人羣。

常浩南突然開口道:

“那個……”

要想在數學上描述這種一組(多個)數據對應多個含義的現象,就需要將一組數據在不同的維度上進行展開。

回到辦公室的常浩南重新找到了剛纔那張紙。

而如果想要讓計算機處理這些高維數據……

“你們說……”

旁邊的朱雅丹左看看常浩南,右看看姚夢娜,實在是不知道這兩個人爲什麼突然討論起這個問題了。

這裡算是個點餐制的小竈,價格比下面的大食堂貴一些,加上還要多上一層樓,因此來這裡吃飯的人並不算多。

這就導致如今他腦子裡空有一大堆名詞,但卻不知道哪個是破局的關鍵——

在近70年前,美國統計學家哈羅德·霍特林就已經提出過將高維數據進行降維的主成分分析法。

而系統,則首先需要構建出一個完整且可行的思路出來。

儘管仍然沒有給出完整的思路,但是,他至少已經把三個抽象的基本條件解析成爲了一個具體的數學問題。

“嗯……但麪餅重量本身就有誤差,而且調料包有好幾種,稱重只能證明總量沒問題,但不能保證沒放錯……”

在三個基本條件下方又寫下了幾行字。

90年代這會,方便麪還屬於非常流行的即食類食品。 常浩南讀本科那陣子,大家的條件普遍比較差,有閒錢吃得起的人不多。

而生產方便麪的企業,顯然不太可能有多麼高大上的設備和技術。

沒有靈感,說啥都沒用。

身負安保職責的朱雅丹趕緊跟上。

他認爲方差越大提供的信息越多反之提供的信息越少,於是通過原分量的線性組合構造方差大、含信息量多的若干主分量,再進行矩陣奇異值分解,實現數據維數的降低。

“調料包大概佔整包方便麪重量的10%左右,如果少放或者多放,那應該很容易檢測出來。”

姚夢娜單手扶額:

“我們就是在想,如何才能不用這個人,但實現一樣的效果。”

常浩南從旁邊扯過一張紙,在紙的最中間寫下了兩個字。

給方便麪裡面塞調料包和給飛機打鉚釘,在數學模型上其實是差不多的。

實際上,他此時就面臨着無法從大量繁雜信息中提取出有價值信息的困境。

“大概……稱重?”

但常浩南仍然沒有動筷子。

不知不覺間,常浩南就在辦公桌前枯坐到了快要吃午飯的時候。

常浩南不是那種死鑽牛角尖的人。

尋找一個從高維觀測空間到低維嵌入空間的映射關係,使得yi=(xi),以及一個一對一的重構映射關係^-1,使得xi=^-1(yi)。

仍然沒能想出一個很好的思路。

“生產方便麪的企業,是怎麼保證不漏裝或者多裝調料包的?”

而反過來,現實中收集到的信息,在多數情況下,本身就是已經展開過的高維數據。

“你說得對。”

他在腦子裡把這三條內容過了一下,然後試圖讓系統給出一個結果。

這是由數學理論推向現實的情況。

“也好。”

其核心目的是從海量數據庫和大量繁雜信息中提取出有價值的知識,並進一步提高信息的利用率。

寫到這裡,常浩南的臉上露出了一個滿意的微笑。

想到這裡,他回到這張紙的最上面,重新寫下六個字。

流形學習方法。

307.第307章 理論水平LV3,小試鋒芒!296.第296章 理論結合實際第517章 渦槳7和渦軸7第833章 龐加萊猜想已經證明了236.第236章 九星戰將和航母之父第976章 突如其來的見家長第187章 殲7,超進化!(二合一)第150章 救火,機翼結冰!第810章 什麼叫獅子大開口啊?第591章 連升兩級的戰鬥英雄第561章 打撈戰利品第1060章 遄達900,出大事了第819章 兩種證法第491章 你們不會自己改嘛?372.第372章 堪比戰術導彈的遠程火箭炮!第636章 一個相對複雜的算法第1202章 八十項技術清單第736章 挑戰NS方程的第15步第1246章 勿謂言之不預第902章 我,常浩南,打錢第185章 00批次殲8C,交付部隊第25章 從風扇葉片引發的思考第1035章 沒錯,我們已經研究好了第895章 教育界的地位第1076章 F136的關鍵設計評審第56章 前往盛京!第997章 大幹一場!第775章 是你懂渦扇10還是我懂渦扇10?394.第394章 一個人,帶動一個行業第134章 衆生相(二合一)第972章 生產定型鑑定,以及未來的打算第569章 面貌一新的江城重型機牀廠第1248章 生意,都是生意第646章 驚人的飛行包線385.第385章 “息壤”戰洪魔第1268章 萬衆矚目的倒計時第874章 設計定型是新的開始278.第278章 我一個人就是一支軍隊第1226章 英國人的燃氣輪機要出問題255.第255章 “9910”工程第468章 媒體攻勢第1158章 出人意料的療效第838章 我改變了學術規則第418章 全國首個壓氣機研究中心第178章 精工計劃(二合一)第1117章 大佬雲集!第85章 喘振位置,可以算出來!第818章 佩雷爾曼的到訪第523章 青出於藍第1189章 提前部署F22(新的一月,求波月票)第437章 安靜的渦槳客機(日萬,求一波月票第422章 電子戰,不只是干擾第734章 搞到名額了第686章 墜落的夜鷹第117章 來自的需求(爲上月月票金主flanke337.第337章 突破攔截,飛越航母上方!374.第374章 箱式遠程火箭炮第917章 “小修小補”第814章 提前入世!(算昨天的)第179章 國產斯貝,有救了!第70章 差分進化算法(55)第515章 新一代直升機的合作伙伴第1112章 我給兩院帶來了一份禮物第821章 課題還沒開始,就已經被解決了?第567章 取代運8的新一代空中平臺310.第310章 兩個方案的殲10!(爲盟主【死355.第355章 一場大戲第771章 餘波迴盪(6K章)第476章 渦扇10,第375代航發!第627章 令人糾結的垂直起降第170章 客機背後的利益第808章 不同的利益訴求第731章 給國慶獻禮!(4K)第1182章 爆轟破膜試驗第134章 衆生相(二合一)第627章 令人糾結的垂直起降第963章 光輝也要搞改進型?第516章 成爲國際供應商!第34章 關鍵抉擇第975章 優秀的獵人,往往以獵物的姿態出現第761章 閱兵前夕第1073章 英國人的瘋狂思路246.第246章 能不能干擾GPS?第111章 進氣畸變試驗第1107章 我有三種方法,三種!第1228章 地下堡壘的剋星第58章 項目進展第1066章 必須體現出華夏的作用!306.第306章 非線性偏微分方程組降維問題第901章 一年之期已至!第558章 對國產裝備的信心第803章 來跳個舞吧348.第348章 江城重型機牀廠第813章 通過海峽!第529章 獲獎懸念揭曉!第85章 喘振位置,可以算出來!第1055章 公務機搞軍用?第671章 專職秘書第875章 設備就緒