第三章 成功運行
李御昭往餘光所及之處看去,會場的西北角已經坐滿了參會的人群。他來回掃了掃感覺並沒有什麼人盯着自己看,以為是自己的錯覺,便收回了目光。
在胡雪走之後,典禮很快就開始了。期間李御昭還和當年的導師聊了聊天,談了談近狀。導師姓張,也算是李御昭的伯樂了。不像其他“散養”和“壓榨”學生的教授,張教授在李御昭讀博期間,給了他許多建議和支持,也很少讓他做無關科研的工作。李御昭打心底尊重這個老師,也正是如此,他才不想拒絕校慶發言的邀請。
……
典禮結束后,李御昭拖着略顯疲憊的身子回到了工作的研究所。今天因為特殊原因同事們已經提前下班了。他刷着門禁卡推開了實驗室的房門,空無一人的房間內只有大型散熱器的轟鳴聲。李御昭慢悠悠地走到工位旁邊,一屁股坐在了皮質的靠椅上,腦袋耷拉在椅背上,閉幕冥神,放空着思緒。
“叮咚~”一聲清脆的手機通知聲將李御昭從冥想中拉回。
他打開手機一看,又是早上的警告通知。他沒有管,將手機裝回了兜中。然後猛地站起來伸了個懶腰。
然後,他來到呼嘯的散熱器后,在一列列機器之間穿梭,不斷地開啟着一個個電源。各種指示燈也不斷亮起,機器運作的轟轟聲此起彼伏,聲音漸漸越來越大。當“滴——”的一聲警告聲響起后,這座巨大的計算機器像被賦予生命一樣喚醒了意識。
每次開啟這座“神威”超算機,李御昭總喜歡將實驗室所有的照明燈都關上。一是他不想讓自己的實驗太惹人注目,二是當實驗室關燈之後,他坐在自己的工位上,看着下面在漆黑中運轉的一台台機器,那紅紅綠綠閃爍的指示燈,就像點綴在夜幕中的星光一樣。時而閃爍,時而常亮,在這孤寂的夜晚,彷彿描繪了一個別樣的星空……
工作總是枯燥的,今天的“生命方舟”實驗也不例外。李御昭坐在工位前,在控制終端上開始了模型代碼的調試。他先是調整一下模型的關鍵參數,想要解決上次“生命方舟”因為計算機算力不足而崩潰的問題。程序從上個存檔點運行后之後,李御昭帶上vr眼鏡觀察着這次“生命方舟”的運行。幾分鐘后,李御昭摘下眼鏡,無奈地嘆了口氣。
接着,他又改變了模型架構,打算試試最近大火的transformer架構,結果“生命方舟”反而比上次更快地崩潰了。隨後,他又試了改變模型的正則化方式、採用不同的收斂函數、使用ema更新模型參數……
幾個小時后,李御昭再一次扯下了帶在頭上的vr眼鏡。在這悶熱的機房中,幾個小時的不斷嘗試已經讓他的臉龐佈滿了汗水。內心煩躁至極,無力地癱坐在靠椅上,嘗試放鬆自己緊繃的肌肉神經,讓過載的大腦放鬆下來。
不知怎地,李御昭頭腦中突然浮現了老同學胡雪地身影,也許是意外的見面讓他印象深刻,又或是突然的離開讓他難以忘懷,胡雪就這樣不折不扣地出現了。李御昭慢慢回想着今天和胡雪的相遇、閑聊……
突然,他像是意識到了什麼一樣,做起身,打開了電腦的瀏覽器。
“元學習么……”李御昭嘴裏碎碎念着。
他登錄了ieee期刊數據庫,輸入了“sce”來搜索。ieee是國際上最大的工程類期刊數據庫,而《sce》正是他看到“元學習”文章的期刊雜誌。簡單地翻找之後,他在最新一期的《sce》中找到了一篇名為《基於自調參的自動演進算法——元學習》的論文。
第一次看到這個題目時,李御昭覺得和自己研究交集不多便跳過了,更何況這篇文章的機構他聽都沒聽過,內容也不多,不像什麼“重大突破”。
他開始隨性地看起論文來。花了幾分鐘概讀全文後,漸漸地,李御昭的精神集中了。他發現這篇論文的內容不像紙面一樣單薄。論文非常簡要,直接是問題定義、算法、實驗結果三部分構成。文章提出了一個可以自我調參進化的模型結構,這使得模型運行可以省去大量算力。同時,調參進化可以使模型運行的越久便越穩定。
通俗地說,可以將模型理解為一輛組裝的汽車,普通算法組成的“汽車”不僅龐大而且跑一段時間就會散架;而這篇論文提出的“元學習”,可以在“汽車”跑的時候,根據路況優化“汽車”的結構,自動更換汽車的某些部件,使“汽車”越跑越穩定。
李御昭看完論文的實驗結果,內心的激動已經難以言表。他深刻地明白,如果這篇論文研究屬實,將對他的“生命方舟”計劃提供多大的幫助。他壓抑住微微顫抖的手,耐心地又讀了一遍論文,通篇上下不願遺漏任何一個字。
看完,他挺直了腰板,盯着電腦屏幕,正襟危坐。按照論文中演示的算法一步步地調試着自己的“生命方舟”模型程序。一行兩行……直到最後一行的代碼修改完后,他又用編譯器檢查了一遍代碼的語法,確保無誤后,長吁了一口氣,然後點下了開始運行的按鈕。
李御昭再一次帶上了vr眼鏡,一道刺眼的白光之後,還是那個熟悉的星球,一群“駱駝”一樣的生物棲息在這裏。但不一樣的是,這一次沒有bug,天空沒有呈現怪異的顏色,駱駝們的肢體也沒有四散分離,大地上的一切都按照合理的方式來運行着,一副生機盎然的景象……
李御昭就這麼靜靜地看着這一切,就這樣靜靜地看着。他突然有點想哭,等這一刻太久了,自從四年前神威超級計算機落地起,他就幻想着這麼一天,幻想着看到自己的“生命方舟”承載着一個個生命的運行……