從第一個(gè)現(xiàn)代集成電路誕生距今已有62年。這么多年以來,人們獲得更高性能產(chǎn)品的方法一直沒有改變,那就是使用更多的晶體管進(jìn)行更高密度的計(jì)算。令人欣慰的是,半導(dǎo)體制造技術(shù)的發(fā)展支撐了集成電路對(duì)晶體管數(shù)量幾乎無盡的需求,并誕生了摩爾定律這樣業(yè)界統(tǒng)一的共識(shí),不斷驅(qū)動(dòng)計(jì)算能力一步步增強(qiáng)。但是,在AI計(jì)算進(jìn)一步發(fā)展后,人們發(fā)現(xiàn)AI計(jì)算對(duì)算力的渴求更勝以往。
在半導(dǎo)體制造技術(shù)進(jìn)步速度逐漸放緩的今天,如何進(jìn)一步獲得更高算力的芯片就成為AI行業(yè)共同的問題。路線開始分叉,押大還是押???一家名為Cerebras的公司帶給我們一個(gè)新的可能——那就是越大越好,一個(gè)12英寸的晶圓上只容納一顆完整功能的AI計(jì)算芯片。這就是CerebrasWaferScaleEngine(WSE),今天本文就和你一起來了解它的秘密。
AI計(jì)算中的深度學(xué)習(xí)計(jì)算已經(jīng)是目前最重要的計(jì)算負(fù)載之一。在過去,那些只有人類大腦才能完成的任務(wù),如今有很多都可以使用計(jì)算機(jī)以人類或者超過人類的效率來執(zhí)行。根據(jù)OpenAI的報(bào)告顯示,自2012年以來,AI計(jì)算中所使用的的計(jì)算量呈現(xiàn)出指數(shù)增長的態(tài)勢(shì),計(jì)算需求平均每三四個(gè)月就可以翻一番。從2012年到2018年,全球的整個(gè)計(jì)算量指標(biāo)增長了30萬倍。
▲進(jìn)入2012年后,AI計(jì)算的計(jì)算需求平均每三四個(gè)月翻一番
AI計(jì)算需求的暴增,和我們熟悉的摩爾定律所驅(qū)動(dòng)的半導(dǎo)體產(chǎn)業(yè)速度之間產(chǎn)生了一個(gè)顯而易見的矛盾。如今的摩爾定律已經(jīng)從之前的18個(gè)月放緩到每2年到3年才使得半導(dǎo)體單位面積的晶體管數(shù)量翻倍,并且在可預(yù)見的未來,這樣的放緩速度還將繼續(xù)下去。因此,半導(dǎo)體廠商在面對(duì)市場(chǎng)的性能需求時(shí),往往會(huì)選擇通過其他手段來增加芯片有效工作面積,提高性能。
現(xiàn)在業(yè)內(nèi)對(duì)此的態(tài)度普遍是傾向兩種看法,一種是選擇小芯片聯(lián)合提高性能,也就是Chiplet方案,這種方案比較容易在民用和商用市場(chǎng)之間取得平衡,不過如何連接諸多小芯片并取得更好的性能,業(yè)內(nèi)依舊有很多討論,當(dāng)然這也并非本期的話題,暫且不表。
另一種看法則是繼續(xù)做大芯片,這對(duì)一部分需要大規(guī)模并行計(jì)算的用戶來說是非常友好的,比如超級(jí)計(jì)算機(jī)。原因也很簡單,芯片面積越大,相對(duì)應(yīng)所涉及的外圍材料就越少。舉例來說,一個(gè)傳統(tǒng)尺寸的GPU芯片如果可以提供1TFLOPS算力的話,那么擴(kuò)大它的面積到現(xiàn)有芯片的4倍,其算力在合理的情況下還可以繼續(xù)提升2~3倍。甚至芯片面積進(jìn)一步擴(kuò)大,直接將外圍的DRAM、SRAM等集成在芯片上,由此帶來的延遲降低、帶寬增加等因素,性能還將繼續(xù)提升。同時(shí),節(jié)約了多個(gè)小芯片系統(tǒng)所需要的PCB、供電、封裝等不同組件的成本,綜合考慮,甚至可能帶來更低的單位性能價(jià)格。
不過,芯片尺寸并不僅僅由廠商自行決定,它還受到很多其他因素的限制。比如之前英偉達(dá)、IBM和英特爾就很難推出尺寸超過800mm²的芯片,這是因?yàn)榧词故乾F(xiàn)在,i193型號(hào)的光刻步進(jìn)器最大可支持刻錄的芯片尺寸為短邊26mm,長邊33mm,面積最大可接受858mm²。因此,繼續(xù)擴(kuò)大芯片尺寸也需要考慮設(shè)備允許等問題。
▲ASML的介紹顯示,在經(jīng)過多次縮放處理后,目前能夠生產(chǎn)的最大的芯片尺寸大約是858mm²。
因此,以整體的方式(非片上拼接)制造超出常規(guī)尺寸的芯片需要更多新工具的支持。不過依舊存在一些替代方法可以達(dá)成制造更大芯片的目的,這就是晶圓級(jí)集成(Wafer-scaleintegration,簡稱為WSI)的單芯片制造方法,采用這種方法制造的芯片尺寸和晶圓本身最大直徑十分接近,在12英寸晶圓上能呈現(xiàn)“巨無霸”芯片的效果。
▲TrilogySystems的WSI芯片樣品
缺陷控制:初探晶圓級(jí)集成WSI
WSI能制造如此巨大的芯片,看起來非常美好。但實(shí)際上,WSI雖然能夠大幅度提升芯片的尺度從而提升性能,相應(yīng)的也面臨著巨大的困難??v觀歷史,WSI在過去的50年時(shí)間中被多個(gè)廠商實(shí)踐過,但成功者寥寥。失敗的主要原因除了資金、市場(chǎng)外,技術(shù)上問題也頗多,包括超大尺度的芯片的設(shè)計(jì)、制造、封裝、散熱等,還有致命的晶圓缺陷。所謂晶圓缺陷,是指高純度硅晶圓上那些存在雜質(zhì)或晶體生成異常的區(qū)域。
作為一個(gè)晶圓尺寸級(jí)別的芯片,對(duì)電路正確的要求非常高,理論上任何電路錯(cuò)誤都可能導(dǎo)致整個(gè)芯片運(yùn)作失敗。但是由于人類目前工程技術(shù)制約和物理規(guī)律限制,任何晶圓都不可能100%完美,總會(huì)有缺陷的存在。因此,WSI如何控制晶圓缺陷(甚至包括制造缺陷)就在很大程度上制約著它的成敗。
晶圓缺陷并不是一個(gè)新話題,它在普通的芯片制造中也存在,并引發(fā)了良率和成本等問題。為了更好地理解WSI技術(shù),本文先對(duì)普通芯片制造制造過程和缺陷處理方式進(jìn)行簡單描述。
一般來說,普通芯片設(shè)計(jì)時(shí),工程師在芯片設(shè)計(jì)階段就能確定芯片所使用的工藝代次,然后和芯片制造廠商共同確定所設(shè)計(jì)芯片的面積尺寸。在得到這些數(shù)據(jù)后,使用晶圓的面積除以目標(biāo)芯片的面積,就得到了一張晶圓可以獲得多少芯片的參考數(shù)據(jù)。根據(jù)這個(gè)參考數(shù)據(jù),芯片制造廠會(huì)在晶圓上根據(jù)芯片的尺寸給出最佳的布局方式,完成之后,晶圓看起來就像劃上了規(guī)律的方格。然后,芯片制造廠會(huì)根據(jù)布局的方格,利用同樣方格布局的掩模,使用光刻工藝進(jìn)行不斷地重復(fù)刻制、沖洗、繼續(xù)重復(fù)、沖洗等,直到形成了所需要的一個(gè)個(gè)成功的芯片圖案。接下來,廠商會(huì)根據(jù)之前設(shè)定的方格邊線,切割并分開一個(gè)個(gè)芯片,再通過檢測(cè)手段確定不能工作的芯片。
▲經(jīng)過光刻芯片后的晶元,可見大量相同的芯片排列。
對(duì)這些已經(jīng)切割的完成、但又不能正常工作的芯片而言,迎接它們的通常的做法是直接報(bào)廢,或者還可以屏蔽一部分功能后再廉價(jià)銷售。這種情況下,使用被拋棄報(bào)廢的芯片數(shù)量除以所有生產(chǎn)出的芯片數(shù)量,就得到了某種意義上的良率數(shù)據(jù)(不同情況下良率計(jì)算需求可能不同,比如是否納入屏蔽芯片等)。可以看到,傳統(tǒng)的芯片制造依靠切割芯片并拋棄一部分,來實(shí)現(xiàn)對(duì)晶圓缺陷和制造缺陷的控制。
▲晶圓缺陷是固有的,傳統(tǒng)的處理方法是將其拋棄。紅色點(diǎn)為晶元缺陷,黃色為需要拋棄的芯片。可見芯片面積越小,拋棄的芯片數(shù)量越少。
對(duì)WSI來說,拋棄、切割等方法都無法使用,畢竟作為一整塊芯片,難以切割部分區(qū)域。不過轉(zhuǎn)換思維來看,所謂的拋棄,只是壞塊部分在芯片意義上不存在而已,等同于存在但不工作。對(duì)WSI來說,在芯片設(shè)計(jì)上也采用分區(qū)設(shè)計(jì)的方案,區(qū)塊之間相對(duì)獨(dú)立,且存在可以單獨(dú)關(guān)閉或者開啟某個(gè)區(qū)域的控制電路等,就可以在一定程度上避免“一個(gè)老鼠屎壞一鍋湯”的問題。
實(shí)際上,WSI技術(shù)解決晶圓缺陷的方法,正是通過設(shè)計(jì)階段提前布局,在發(fā)現(xiàn)缺陷塊后,通過改變芯片本身的工作邏輯來避開損壞的區(qū)域。具體實(shí)現(xiàn)上,設(shè)計(jì)人員會(huì)使用子電路的網(wǎng)格圖案和適當(dāng)?shù)奶幚磉壿?,在受損電路周圍“重新布線”,因此即使晶圓區(qū)域上有不少的錯(cuò)誤,但只要有足夠的子電路,那么整個(gè)芯片即使存在故障也可以使用。
在解決了缺陷控制問題后,WSI技術(shù)的威力終于可以爆發(fā)出來了。由于不需要切割,WSI產(chǎn)生的整個(gè)晶圓最終會(huì)被作為一個(gè)芯片看待,因此在制造過程上,WSI可以避免受到單芯片尺寸的限制。目前尚未有詳細(xì)的資料說明WSI光刻過程是如何進(jìn)行的,不過,考慮到WSI技術(shù)的特殊性,廠商完全可以利用現(xiàn)有的設(shè)備和技術(shù),對(duì)芯片上不同部分分區(qū)制造,當(dāng)然,WSI可能需要耗費(fèi)更多的、昂貴的掩模,但是和整個(gè)芯片的性能以及最終的單位性能價(jià)格相比,應(yīng)該還是值得的。
此外,WSI的發(fā)展歷史也值得了解。WSI的初出茅廬是在1970年到1980年,當(dāng)時(shí)主流晶圓還是2.5英寸,包括比如TI和ITT等公司都嘗試實(shí)現(xiàn)WSI技術(shù),但是最終均告失敗。真正在WSI技術(shù)上有所突破的是一家名為TrilogySystems的公司,這家公司在1980年獲得了2.3億美元的投資,開發(fā)了名為TrilogySystems的WSI芯片,這是一個(gè)在100mm晶圓上實(shí)現(xiàn)的“超級(jí)計(jì)算機(jī)”,并且成功制造出了樣品,但是隨后由于各種原因包括自然災(zāi)害、資金不足等,產(chǎn)品在1985年宣布研發(fā)終止。1989年,英國一家公司也推出了WSI技術(shù)的產(chǎn)品,不過集成的是內(nèi)存顆粒,一張晶元集成2021Mb內(nèi)存,在當(dāng)時(shí)也是天文數(shù)字了。
從發(fā)展歷史來看,WSI的研發(fā)道阻且長,對(duì)Cerebras公司來說,他們對(duì)此情況應(yīng)該有充分的估計(jì)和預(yù)測(cè)。那么CerebrasWaferScaleEngine又是一款怎樣的產(chǎn)品呢?
常山圖庫
新聞排行榜
- 2019年平價(jià)上網(wǎng)項(xiàng)目值得關(guān)注的幾個(gè)重要
- 蔚來公布電池升級(jí)計(jì)劃!
- GlobalData:維斯塔斯于2018年重新奪回OE
- 呂梁今年需退出140萬噸鋼鐵產(chǎn)能 長治市
- 國際 臺(tái)風(fēng)“玲玲”已造成3省45.5萬人受
- 2020年是AI產(chǎn)品化的一年 行業(yè)需要重拾產(chǎn)
- 貝索斯被全球CFO理事會(huì)評(píng)為最佳商業(yè)領(lǐng)
- 阿里巴巴聯(lián)合創(chuàng)始人蔡崇信不當(dāng)小鵬汽
- 2019年你應(yīng)該知道的那些大發(fā)現(xiàn)
- 太陽的8900億倍 296千萬億個(gè)地球
最新推薦
- 華為Mate40 Pro概念圖來了!正反雙屏+手寫
- 美債被買爆!黃金與美元同跌 這場(chǎng)風(fēng)暴
- 看點(diǎn) 優(yōu)質(zhì)的屏幕都是相似的 劣質(zhì)屏幕各
- 王騰宣布小米平板歸來,聯(lián)動(dòng)小米手機(jī)
- 蘋果官宣了WWDC的日子,iOS 15要來了
- 午餐戰(zhàn)役,外賣系統(tǒng)里的幽靈廚房
- OPPO手機(jī)的AI智能助手比蘋果三星都好用
- 看點(diǎn) 商務(wù)部回應(yīng)美國將審查中國聯(lián)通、
- 三部性價(jià)比超高的千元機(jī)性能介紹
- 手機(jī)市場(chǎng)環(huán)境大變動(dòng),蘋果13也有了消息
