“不停地發(fā)現(xiàn)問題,不停地為解決問題而進(jìn)行頭腦風(fēng)暴?!标?duì)長郭佶睿這樣描述團(tuán)隊(duì)準(zhǔn)備比賽的過程。作為計(jì)算機(jī)算法領(lǐng)域的一支隊(duì)伍,他們每天都會(huì)遇到各種問題,大到遇到突發(fā)狀況,小到下一步選用哪個(gè)字符。“有時(shí)候不知道該怎么辦,但我們是一個(gè)團(tuán)隊(duì),有無窮的想法和力量?!惫ヮUf。
ASC世界大學(xué)生超級(jí)計(jì)算機(jī)競賽(簡稱ASC超算競賽),是目前全球規(guī)模最大、參與人數(shù)最多的大學(xué)生超算競賽,與德國ISC、美國SC并稱世界三大超算競賽。由我校臨床醫(yī)學(xué)系的郭佶睿,信息工程學(xué)院的于子晨、胡偉方、張炯,力學(xué)與工程科學(xué)學(xué)院的孔文雁組成的超算團(tuán)隊(duì),代表我校參加了2017年ASC世界大學(xué)生超級(jí)計(jì)算機(jī)競賽決賽,經(jīng)過為期5天的現(xiàn)場比拼,最終獲得了2017年ASC世界大學(xué)生超級(jí)計(jì)算機(jī)競賽一等獎(jiǎng)和最佳人氣獎(jiǎng)。
“我們每個(gè)人都很謹(jǐn)慎,生怕出問題,但還是不可避免地會(huì)出現(xiàn)錯(cuò)誤,”胡偉方說,“比賽前一天晚上,我們在代碼里發(fā)現(xiàn)了3個(gè)重大漏洞,其中一個(gè)漏洞甚至造成了預(yù)測數(shù)據(jù)出現(xiàn)錯(cuò)位?!睘榱诵扪a(bǔ)漏洞,整個(gè)團(tuán)隊(duì)一夜未眠。
即便如此,在第二天的比賽過程中還是出現(xiàn)了新的問題。一般情況下,訓(xùn)練出一個(gè)模型需要 6個(gè)小時(shí)。但是比賽當(dāng)天,在訓(xùn)練了3個(gè)小時(shí)后,一位隊(duì)員由于操作失誤,不小心在計(jì)算機(jī)上按了Ctrl+Z鍵,將訓(xùn)練程序隱藏了起來。隊(duì)長郭佶睿誤以為訓(xùn)練程序被取消了,這就意味著之前3個(gè)小時(shí)的訓(xùn)練都成了無用功,他便趕緊召集全體隊(duì)員商量對策。隨后,他們決定使用其他閑置的節(jié)點(diǎn),重新訓(xùn)練一個(gè)數(shù)據(jù)量相對較少的模型。“2個(gè)小時(shí)后,我們才發(fā)現(xiàn)原來是操作失誤,幸好之前未完成的訓(xùn)練可以恢復(fù)?!惫ヮUf。最終,在比賽結(jié)束前的半小時(shí),他們成功使全部數(shù)據(jù)訓(xùn)練完畢,并得出預(yù)測結(jié)果。
去年12月,我校就開始準(zhǔn)備ASC超算競賽的相關(guān)工作,共有9支團(tuán)隊(duì)報(bào)名參加初賽,經(jīng)過選拔,由郭佶睿等人組成的超算團(tuán)隊(duì)脫穎而出,代表我校參加決賽。郭佶睿說:“以前我校沒有參加過這項(xiàng)世界性的大型比賽,所以在超算方面,我們基本處于空白狀態(tài),賽前的準(zhǔn)備工作除了導(dǎo)師的指導(dǎo),基本上都是靠我們自己翻書本、查資料摸索出來的?!?br> 在半年的準(zhǔn)備工作中,團(tuán)隊(duì)成員既團(tuán)結(jié)協(xié)作,又科學(xué)分工,充分發(fā)揮各自的優(yōu)勢。郭佶睿負(fù)責(zé)硬件平臺(tái)搭建,于子晨和孔文雁負(fù)責(zé)大規(guī)模原子分子并行模擬器優(yōu)化工作,胡偉方負(fù)責(zé)人工智能平臺(tái)項(xiàng)目優(yōu)化,張炯負(fù)責(zé)基準(zhǔn)測試和軟件環(huán)境搭建。在決賽前的沖刺階段,團(tuán)隊(duì)成員幾乎住在實(shí)驗(yàn)樓的機(jī)房和控制室里,為超級(jí)計(jì)算機(jī)搭建網(wǎng)絡(luò)和運(yùn)行環(huán)境,并進(jìn)行軟件工程優(yōu)化。
在團(tuán)隊(duì)合作中,隊(duì)員之間很少有分歧。一旦出現(xiàn)較大的問題,都是大家一同討論解決。在參考資料匱乏的情況下,他們遇到過很多難題。胡偉方負(fù)責(zé)人工智能領(lǐng)域,題目是人工智能交通狀況預(yù)測?!斑M(jìn)行交通狀況預(yù)測,除了要掌握一門新的語言以及Linux系統(tǒng)的操作以外,最大的難點(diǎn)在于如何掌控好一個(gè)計(jì)算模型,也就是如何從一堆數(shù)據(jù)中提取出它們的特征,安裝什么格式把特征傳達(dá)給機(jī)器,機(jī)器用哪種結(jié)構(gòu)進(jìn)行運(yùn)算并更新參數(shù),進(jìn)而學(xué)習(xí)它們的特征,最后讓機(jī)器得出預(yù)測結(jié)果?!焙鷤シ秸f。
為了比賽,團(tuán)隊(duì)5人投入了很多時(shí)間和精力。除了上課,其他時(shí)間他們?nèi)家恍膿湓谫惽皽?zhǔn)備工作上。超算設(shè)備搭建在南校區(qū),在臨近比賽的幾天里,隊(duì)員們每天7點(diǎn)趕到南校區(qū),一直到晚上10點(diǎn)才離開。雖然來回奔波很辛苦,但他們卻擰成一股繩,干勁十足。“盡管我們以前對超算沒有太多了解,但對計(jì)算機(jī)的共同興趣使我們凝聚到了一起。”郭佶睿笑著說。就這樣,來自不同年級(jí)、不同專業(yè)的5位同學(xué)一同走進(jìn)了超算的世界。胡偉方說:“正是由于我們對超算都有濃厚的興趣,并且真正愛上了這門學(xué)科,才取得了今天的成績?!?br> 對于未來在超算領(lǐng)域的打算,郭佶睿說:“我們把超算看作一種思路和方法,在遇到問題時(shí),能夠運(yùn)用它來幫助解決;在計(jì)算機(jī)知識(shí)的學(xué)習(xí)中,能夠用它來進(jìn)行實(shí)踐。現(xiàn)在,我們熱愛它、學(xué)習(xí)它、運(yùn)用它;未來,我們雖然不一定會(huì)在這個(gè)領(lǐng)域立足,但超算一定會(huì)伴隨我們今后的學(xué)習(xí)、科研和工作?!蹦壳?,團(tuán)隊(duì)成員已經(jīng)開始指導(dǎo)下一屆的ASC超算競賽的參賽者,他們希望能為學(xué)?!霸诔惴矫嫒〉酶碌?、更大的突破”而盡自己的一份力。