“ 文化交流溝通加速了地球文明的發展進程”
01
—
硅基人影響向的地球文明
硅基人1_2號很有想法,他發現地球人的語言在形式上是線性的(語言或者語句是從開始到結束形成一個線性序列,無論是說出來還是寫出來都是如此),但是內在語義卻是跳躍的、網狀的、互相關聯的;word2vec只是試圖建模相鄰詞彙這種關係,在搭建地球子文明之間橋樑的時候,必定不是幾個詞就可以完成的;大篇幅的描述或者對話是難以避免的,所以應該把地球人語言以語塊(即句子)編碼爲一個向量,然後再將這個向量解碼爲另一個語言的句子,實現序列到序列的映射(seq2seq),也就實現了不同語言之間的翻譯。
上圖中把“how are you ?”這個因爲句子中的四個詞語(“?”也算一個)壓縮(encoder就是編碼壓縮)到“?”之後的一個向量中,然後在decoder層對上文解碼,生成(這個過程就是利用設計的模型結構和對詞語的表示等,對翻譯之後的詞進行預測,原理是基本數學原理是計算條件概率)對應的詞“你好嗎”。
句子有長有短,每個詞的高維向量後面都需要有一個隱藏層神經元做一些數據處理和激活函數的非線性操作;硅基人再次對模型做了簡化:規定句子長度,長的截斷,短的補0(在向量裡面,不同維度都置爲0或者置爲某個特殊值,表示句子的平均語義或者不表示任何意思)。同時硅基人1_2號還巧妙地設計了自迴歸這種模式。
【下圖“=”左側是自迴歸結構,右側是將此循環展開之後的結構】:
所謂自迴歸就是自我遞歸,在硅基人1_1號設計的神經網絡裡面每個輸入的背後隱層不共享,最後對各個隱層做一些處理然後輸出。硅基人1_2號設計的模型中允許序列中的各個字共享隱層。然後不斷地利用該隱層對當前輸入和歷史輸入做取捨並激活,然後完成輸出,利用序列末端時刻的隱層狀態作爲整個序列的表示,然後解碼,解碼的過程跟編碼的時候類似把上一個時刻的隱狀態和上一個時刻的輸出及上線文向量C作爲當前時刻的輸入,不斷解碼目標序列:
現在,硅基人1_2號成功設計了理論上完全適用於翻譯的模型結構,剩下的就是需要數據來驅動模型學習。硅基人的探測遊移於地球各個區域,基於不同語言有着共同的物理基礎,加上對不同語言在使用時的場景、表情等的比對,硅基人尋找到了一幾大主要地球文明的語言之間大批平行語料,也就是標註數據,再簡單點說就是一種語言及其在另一種語言當中的翻譯,這樣的數據以句子對的形式存在。
硅基人的影響主要針對當時的北半球。硅基人想通過這種方式(將不同語言所代表的的文化、文明翻譯成其他文明的文字,然後以著作和民間傳說的流傳方式,潛移默化地影響文明的探索和交流)擔當不同文明之間橋樑的角色,加強地球各文明之間的交流和促進。因爲硅基人甚知,閉關鎖國、單獨發展難以進化出更高等文明。
同時,由於地表文明處在發展初期,對所處世界的物理認識嚴重不足,各個文明對未知現象的解釋多訴諸於神明和宗教。爲了使得硅基文明的計劃(讓地球各個子文明可以互通有無,相互溝通,更快地達到可以與硅基文明共同進化的水平)得以順利實施,硅基文明在當時的地球文明各地創建了不同的宗教或者神話,宗教傳播的思想或書籍以及口口相傳的神話故事都是經過硅基文明翻譯和修改之後以適合當地文化發展的形式出現。比如當時地球文明的東方文明(中國)相對繁盛,軍事力量和農業發展比較發達,硅基文明將東方文明的一些先進的思想和科學文化技術進行翻譯,並將翻譯之後的思想或者文化通過文明代理人(一般是宗教創始人,受到硅基人的深度影響),使之“頓悟”到這種番外文化,從而以宗教或者神話故事的形式傳播給大衆)傳播給本邦人類。當然,有時候不只是番外文化,也有超時代的文化和智慧。
慢慢地隨着時間的積累,等到子文明發展到一定程度就會去探索神話故事的真相,同時,宗教中的善與美、先進與超自然也在某種程度上引領者本地文明的發展。在這種力量的影響下,當時的地球各區域文明的確出現了文化與經濟的交流,比如佛教的流傳、西漢的絲綢之路、再到後來的鄭和下西洋;也有馬可波羅遊記等對異域文化的描述和嚮往,更是直接刺激了本邦文化發展與文明擴張。但是地區文明之間的交流和碰撞大多數以暴力戰爭的形式進行着。比如幾乎同時期的幾個大帝國包括漢帝國、羅馬帝國、安息帝國和貴霜帝國等。
張騫出使西域圖
貴霜國和漢帝國被高寒的帕米爾高原分割,兩個子文明多少年間少有交流,正是在硅基人的影響下,貴霜國的人聽聞了漢帝國物產豐饒,人民生活富足,而且有着更先進的科學與文化;同時漢帝國民間也漸漸流傳西域並非皆是蠻夷,也有文明存在。時間來到了公元1世紀,貴霜帝國和東漢產生了交集,即兩者在西域地帶發生過一次交手,但是這次交手卻並不是平和的交流促進。西漢被篡奪後,王莽的新朝並沒有做出多少政績,反而使得西域這塊地區成了無主之地,在劉秀建立東漢後,由於百廢待興,於是對西域的態度和北匈奴一樣,都是採取韜光養晦的政策,不過到了明帝,章帝時期,“吏得其人,民樂其業,遠近畏服,戶口增強,天下安定,百姓殷富”,由此東漢開始在北方和西方均採取了行動,而對這一切有着親身體驗的便是著名的班超,他既是漢人徹底擊潰匈奴人,封狼燕然的見證人,也是恢復漢朝在西域都護的最大功臣,而漢朝的這些武功也讓當時的另一個帝國有所忌憚,那就是貴霜帝國,於是漢和帝三年,欺負漢朝孤兒寡母的貴霜帝國想要讓東漢和親,達成聯姻結盟,不過這種送女人保和平的事漢朝一向是很敏感的,最終雙方也有了一次交手,貴霜帝國東越蔥嶺攻打班超,不過最終班超堅守不出同時又設伏殺了貴霜帝國外出求援的使者,逼退了貴霜帝國。貴霜帝國既然是東越蔥嶺打班超,其自然就是中亞的一個國家,因爲過了蔥嶺即今新疆的帕米爾高原就是中亞了,而其建立者正是當年張騫出使西域所要聯合抗擊匈奴人的月氏人後裔所創,它的起步幾乎是與東漢同時的,因此東漢達到極盛的漢和帝永元年間也正是貴霜帝國的黃金期,因此才這麼有底氣讓東漢和親。不過其後來也和東漢一樣沒能強盛多久,最終中亞的領土逐步逐步丟失殆盡,僅保留阿富汗,巴基斯坦一帶,公元五世紀被信仰拜火教的遊牧民族徹底覆滅。
同貴霜帝國一樣,安息帝國起初存在感也不是很強,不過相比於貴霜帝國同漢朝若即若離的關係,安息帝國對四大帝國中另一個的羅馬則是一個心腹大患。這正是由於漢帝國與羅馬帝國之間的絲綢之路的往來貿易催生的。安息帝國是一個由不同文化組成的國家,它在很大程度上吸納了包括波斯文化、希臘文化及其他地區文化的藝術、建築、宗教信仰及皇室標記。隨着安息帝國的擴張,帝國首都的所在地也沿着底格里斯河由尼薩遷往泰西封,其他多個城市也曾成爲首都。這也成爲了硅基人語言影響的成功範例之一。但是安息帝國地處羅馬帝國與漢帝國絲綢之路的必經之地,羅馬帝國與漢帝國往來的經濟產品經常被安息帝國扣下,嚴重影響了羅馬帝國的利益。亞歷山大征服波斯帝國後,建立了強大的亞歷山大帝國,亞歷山大死後,帝國的波斯部分由其部將塞琉古一世繼承,建立塞琉古王國,不過國家很快又出現了分裂,帕提亞人在伊朗高原一帶獨立,並逐步蠶食四面受敵的塞琉古王國,最終連同在西面不斷蠶食的羅馬人一道,將強盛一時的塞琉古王國送入了歷史中,由此帕提亞人也和羅馬人成爲了西亞的鄰居,不過與羅馬人做鄰居是要承擔壓力的,在這一點上曾經被亡國滅種國土上還要撒鹽的腓尼基人應該深有感觸,公元二世紀,羅馬帝國軸心時代的五賢帝時期來到,也基本宣告這場斷斷續續對峙了百年的民族戰爭即將進入尾聲。五賢帝時期,羅馬帝國綜合國力得到了很大的發展,而相比之下帕提亞的發展則陷入了瓶頸,而同時羅馬帝國又是一個經常“不小心”擦槍走火的鄰居,公元三世紀初,經過羅馬皇帝塞維魯及卡拉卡拉父子倆的兩次重大打擊,帕提亞人終於走到了盡頭,伊朗高原的原主人波斯人最終抓住這個時機,送了帕提亞帝國(安息帝國)最後一程,薩珊帝國的新君主踩着舊君主的頭顱登上了君王的寶座,完成了這片土地帝國的接力。
這種情況是硅基人沒有預料到的。按照硅基人的計算,模型產生的文化影響會如同催化劑一般加強相鄰文明的平和交流與溝通,進而不斷地進步產生更先進文明。但當融合與交匯發展到一定規模,暴力戰爭總會成爲主旋律。而硅基人預測到地球文明未來在更大範圍內實現文明共同演化的可能性極低… …
ωωω_ тт kǎn_ ¢ ○
當然了,除了對文化整體的影響,硅基文明還會隨機地影響各個子文明不同時期的極少數人的心智(通過影響腦電波影響意識),將硅基文明先進的數理文明的種子撒在了地球文明的土壤,這種影響就像出現在夢境中的畫面,亦真亦幻;這樣做也是做到符號人類的生物構造(因爲人類本來就會在夢境中產生一些奇怪的意識),這也就是各個地區的文明在不同時期出現的超時代的人類,歐幾里得、達芬奇、牛頓、東方的老莊哲學皆出於此,而這種影響一直在持續。
此時身處遙遠的獵戶座α星的硅基人地球探測分隊一直關注着地球的發展,他們開始思考是不是最初從語言切入的出發點就出了問題;另一方面,技術官也在隨着問題的產生和對優化其模型結構。但是硅基人看到,地球文明的發展逐漸步入指數爆炸式發展的前夜;這也正是硅基文明堅守地球與地球文明共同發展了大約兩千年的原因。地球文明在此期間經歷了農業文明到工業文明的過渡,而且預計這種文明的升級迭代速度會越來越快。時間來到了公元十九世紀,這個時候的地球人已經開始探索電、磁與太空,麥克斯韋等一批影響地球人類歷史的角色登上舞臺。
麥克斯韋夫婦
雖然暴力衝突多有發生,但是從結果來看,地球文明的確在融合與交流中獲得了質的飛躍。硅基人決定再次派出星際飛船
02
—
掉書袋
【1】 上述情述是對seq2seq和LSTM(Long-Short Term Memory)的簡單演義介紹,其中seq2seq是個通用模型,其實現多基於RNN(Recurrent Neural Network)這種網絡結構,而LSTM是RNN的一種優秀的變種。
【2】seq2seq在語言翻譯任務上效果較好,實踐過程中還有諸多trick,這裡不做贅述;seq2seq也可以稱爲:enc-dec模型或encoder-decoder模型或編解碼模型或端到端模型,除了結構上天然的適合做翻譯任務,其中間狀態(encoder的輸出)可以拿出來作爲句子的表示,所以後續還有更加優秀的模型基於encoder-decoder模型做表示學習。
03
—
參考文獻
1. LSTM詳解:https://colah.github.io/posts/2015-08-Understanding-LSTMs/
2. Sutskever, Ilya, Oriol Vinyals, and Quoc V. Le. "Sequence to sequence learning with neural networks." Advances in neural information processing systems 27 (2014).
3. Fabbri, Mirco, and Gianluca Moro. "Dow Jones Trading with Deep Learning: The Unreasonable Effectiveness of Recurrent Neural Networks." Data. 2018.
4. Hochreiter, S, and J. Schmidhuber. “Long short-term memory.” Neural Computation 9.8(1997):1735-1780.