9 月 13 日凌晨,蘋果在秋季發(fā)布會上正式推出了全新一代 iPhone 智能手機:iPhone 8、iPhone 8 Plus 和 iPhone X(發(fā)音為 iPhone 10)。
這三款新設(shè)備的都搭載了全新的移動芯片,蘋果稱之為 A11 仿生(不是“Fusion”),并表示這是 iPhone 上有史以來最強大、最智能的芯片。
通過發(fā)布會介紹的 A11 仿生芯片細(xì)節(jié),不難發(fā)現(xiàn)蘋果自主定制芯片野心非常大,可謂雄心勃勃。并且隨著時間的推移,針對半導(dǎo)體芯片的定制設(shè)計越來越多,A11 達(dá)到了前所未有的高度。
蘋果在發(fā)布會中的幻燈片多次出現(xiàn)并多次強調(diào),A11仿生芯片內(nèi)部的CPU、GPU、性能控制器、神經(jīng)網(wǎng)絡(luò)單元、ISP等這些都是蘋果自己設(shè)計(Apple-designed)的。
那么,關(guān)于蘋果這枚“智能過人”的 A11 芯片,其亮點有哪些?對未來的重要影響又在哪里呢?
自主設(shè)計的CPU內(nèi)核:六個核心在A10芯片上,蘋果推出了所謂的“Fusion”技術(shù),CPU采用新的四核心設(shè)計,擁有2個高性能核心和2個高能效核心。高低能效兩種內(nèi)核可以根據(jù)不同的需要,來達(dá)到理想的性能與能效表現(xiàn)。
其中高能效內(nèi)核用于應(yīng)付密集型的重度任務(wù),提升處理速度保證性能。而高能效內(nèi)核則應(yīng)用于日常事務(wù),低能耗運行,從而保證電池續(xù)航能力的提升,享受更長的單次充電續(xù)航時間。
最新的A11仿生芯片,蘋果又向前邁進(jìn)了一步。
這一次A11仿生的CPU采用了六核心設(shè)計,由2個高性能核心與4個高能效核心組成。相比A10 Fusion,其中兩個性能核心的速度提升了25%,四個能效核心的速度提升了70%,性能與能效表現(xiàn)更加出眾。
關(guān)鍵是,蘋果還準(zhǔn)備了第二代性能控制器,因此可以同時發(fā)揮六個核心的全部威力,性能提升最高可達(dá)70%,以應(yīng)對多線程工作負(fù)載。
對于六個CPU 核心全部發(fā)揮性能這一點,究竟提升多大還不清楚,但至少在基準(zhǔn)測試上,目前泄露的跑分成績相當(dāng)驚人。
從下面圖可以看到(10.2、10.3 和 10.5 分別對應(yīng)三款新機型),A11 仿生在Geekbench 4的性能基準(zhǔn)測試中,單核平均得分高達(dá)4169,而多核得分也有9837將近一萬的分?jǐn)?shù),秒殺所有手機行業(yè)內(nèi)同基于ARM授權(quán)設(shè)計的移動處理器。
對比自家,此前A10 Fusion的iPhone 7 Plus在單核模式下的得分約為3514,在多核中則為5970。而搭載蘋果目前最強移動芯片A10X Fusion的最新12.9 英寸iPad Pro,單核跑分的成績?yōu)?924,多核則是9371。
若是對比x86平臺的2017 年款 MacBook Pro,這款搭載3.1 GHz英特爾Core i5處理器的產(chǎn)品單核得分為4274。當(dāng)然,多核還是英特爾更強,但至少A11 給 x86 陣營的低電壓處理器帶來了威脅。
A11 仿生的 CPU 性能澎湃已毋庸置疑,不過沒有一臺手機會時刻保持 CPU 多核同時高性能運行。
因此,A11 仿生也會在性能核心與能效核心之間合理分配任務(wù),智能地適當(dāng)?shù)毓芾砣蝿?wù),將輕量級的任務(wù)或后臺任務(wù)交給高能效核心去處理,例如發(fā)短信或者瀏覽網(wǎng)頁,很多日常做的事情大多交給高能效內(nèi)核就能完成,耗電更少。
此外,蘋果還公布,A11 仿生芯片有 43 億個晶體管。這就表示,A11 相比 A10 采用了更加先進(jìn)的工藝制程打造,不出意外的話將是臺積電的 10 納米 FinFET 工藝制程。
因為得益于新工藝,才能在既定面積之內(nèi)塞進(jìn)更多晶體管或先進(jìn)的功能。如果 A11 芯片保持 125 平方毫米的尺寸,至少可將晶體管提高到 60 億個,不過蘋果在同一芯片區(qū)域內(nèi)做了其他更多的工作。
無論如何,雖然從早期 A4 到今天 A11 芯片,蘋果無一不是基于 ARM 授權(quán)的指令集定制自主 CPU 核心,但始終能夠能保持業(yè)內(nèi)最強 CPU 性能的優(yōu)勢。所以,蘋果沒有理由不堅定走自主定制的道路,并且將優(yōu)勢進(jìn)一步擴(kuò)大。
過去幾年,競爭對手大多通過定制 ARM 內(nèi)核并打造多核 CPU 的方式與 A 系列芯片競爭,起碼不落下風(fēng),但今年蘋果加入到多核的競爭中,性能領(lǐng)先優(yōu)勢再次擴(kuò)大,對于高通、三星、麒麟等這些對手會如何回應(yīng),令人期待。
蘋果自主設(shè)計的 GPU之前蘋果采用一直采用來自 Imagination Technologies 公司設(shè)計的 GPU 圖形處理單元。
不過,蘋果早就已經(jīng)確認(rèn)將放棄 PowerVR GPU,改用將自主研發(fā) GPU 圖形芯片技術(shù)。蘋果這一舉動,直接導(dǎo)致 Imagination Technologies 公司在今年早些時候被迫掛牌出售。
雖然 Imagination Technologies 認(rèn)為在 2018 年之前蘋果無法自主設(shè)計 GPU,但是蘋果的舉動就是那么意外。A11 仿生芯片的誕生證明了 Imagination Technologies 的推測是錯誤的。
蘋果在發(fā)布會上表示,A11 仿生芯片還整合了蘋果自主設(shè)計的三核心 GPU 圖形處理單元,圖形處理速度與上一代相比最高提升可達(dá) 30% 之多。
很顯然,今年 A11 仿生芯片就能用上蘋果自主設(shè)計的 GPU,這一點的確出乎很多人的意料,因為 Imagination Technologies 不認(rèn)為蘋果能夠完全避開自家的 IP 知識產(chǎn)權(quán)、專利和保密信息,如果蘋果從基礎(chǔ)完全重新設(shè)計 GPU 架構(gòu)而不侵犯 IP,這絕對是一項超級艱難的挑戰(zhàn)。
事實上,蘋果不是無情拋棄 Imagination Technologies 的 GPU,反而是過去多年時間已經(jīng)做了大量鋪墊。
可以說是 2013 年甚至更早,蘋果就有了打造自主 GPU 團(tuán)隊的多個舉動,很多 GPU 相關(guān)的移動芯片廠商被蘋果收購,來自 IBM、AMD、飛思卡爾甚至是 Imagination Technologies 等公司的優(yōu)質(zhì)圖形工程師人才被蘋果搶到手。
當(dāng)一個 GPU 團(tuán)隊組建完成,再加上自主定制 CPU 的長期經(jīng)驗,相關(guān) GPU 自主設(shè)計的工作也就順其自然展開了。
所以,其實從 A8 開始蘋果就基于 Imagination Technologies 的 IP 定制 GPU,被譽為 GPU“心臟”著色器內(nèi)核以及驅(qū)動都是自主完成設(shè)計。只不過到了 A11 仿生這一代芯片,蘋果才真正公布了完全自主設(shè)計的 GPU。
蘋果沒有透露太多自主設(shè)計 GPU 的細(xì)節(jié),不過表示 A11 仿生的 GPU 圖形處理單元已針對機器學(xué)習(xí)技術(shù)、新穎的沉浸式 3D 游戲和 AR 增強現(xiàn)實體驗進(jìn)行了優(yōu)化。
其中在 AR 方面蘋果稱,A11 能發(fā)揮六核 CPU 進(jìn)行全局追蹤、場景識別,GPU 圖形處理單元還能配合進(jìn)行驚人的 60 fps 高速處理,同時自主定制的 ISP 圖像信號處理單元還可以實時進(jìn)行光線預(yù)測,最后加上新雙攝和重新校準(zhǔn)的傳感器,讓 AR 體驗更加超乎想象的流暢體驗,且真實感達(dá)到了前所未有的新高度。
A11 仿生只是蘋果第一次自主設(shè)計 GPU 的嘗試而已,雖然看起來是剛剛起步,但已經(jīng)在 AR 方面發(fā)揮重大作用了,未來必然會往更重大的方向上前進(jìn)。
畢竟蘋果為了保持行業(yè)的差異化,多年期就開始部署自主基礎(chǔ)技術(shù),圍繞處理器或傳感器技術(shù)展開工作,目的是掌握更高的控制權(quán),打造屬于自己最理想的圖形性能、創(chuàng)新視覺和圖形環(huán)境。
神經(jīng)網(wǎng)絡(luò)引擎5 月份彭博社爆料蘋果內(nèi)部已經(jīng)開始測試神經(jīng)網(wǎng)絡(luò)引擎,甚至是在搭載新 A 系列芯片的設(shè)備中測試,當(dāng)時很多推測就認(rèn)為 A11 非常有可能集成神經(jīng)網(wǎng)絡(luò)引擎。
事實證明,A11 仿生成為了蘋果第一枚神經(jīng)網(wǎng)絡(luò)引擎的 SoC 移動 芯片。那么,這一神經(jīng)網(wǎng)絡(luò)引擎有什么呢?
蘋果在發(fā)布會上解釋,有一種 AI 人工智能叫作機器學(xué)習(xí),即讓電腦通過觀察的方式進(jìn)行學(xué)習(xí)。而神經(jīng)網(wǎng)絡(luò)引擎就是專為機器學(xué)習(xí)而開發(fā)的硬件,它不僅能執(zhí)行神經(jīng)網(wǎng)絡(luò)所需的高速運算,而且具有杰出的能效。
簡而言之,通過神經(jīng)網(wǎng)絡(luò)引擎能夠擔(dān) CPU 和 GPU 的任務(wù),大幅提升芯片的運算效率,以更少的能耗更快的完成更多任務(wù)。
在 A11 仿生中,蘋果表示自家的神經(jīng)網(wǎng)絡(luò)引擎采用雙核設(shè)計,每秒運算次數(shù)最高可達(dá) 6000 億次。不過,蘋果沒有像華為那樣透露具體的浮點運算性能(當(dāng)時華為麒麟 970 的 NUP 在 FP16 下提供的運算性能可以達(dá)到 1.92 TFLOPs)。
蘋果表示,自家的 AI 單元主要用于勝任機器學(xué)習(xí)任務(wù),能夠識別人物、地點和物體,為“面容 ID”和“動話表情”等創(chuàng)新的功能提供強大的性能。
其中對于 iPhone X 的“面容 ID”,面容 ID 功能會投射 30000 多個肉眼不可見的紅外光點,然后將得到的紅外圖像和點陣圖案傳輸給神經(jīng)網(wǎng)絡(luò),創(chuàng)建臉部的數(shù)學(xué)模型,再將這些數(shù)據(jù)發(fā)送至安全隔區(qū),以確認(rèn)數(shù)據(jù)是否匹配。而且,就算樣貌隨著時間而改變,它也能隨之進(jìn)行調(diào)整適應(yīng)。
神經(jīng)網(wǎng)絡(luò)引擎是蘋果在 A 系列芯片上的首次嘗試,雖然目前服務(wù)的范圍還很有限,更多的為 iPhone X 而設(shè)計,但未來這一 AI 單元很快會擴(kuò)展到更多蘋果生態(tài)的領(lǐng)域當(dāng)中,包括無人駕駛汽車系統(tǒng)、AR 增強現(xiàn)實技術(shù)、Apple TV 和 HomePod 音箱等,讓更多原本生硬的設(shè)備也能采用與人類同樣的方式進(jìn)行交互,變得真正會思考。
A11讓蘋果有太多“過人”之處 靜等對手在不到十年的時間里,蘋果打造了一支世界級的芯片團(tuán)隊,并且在移動行業(yè)取得了巨大的成就,這令人難以置信。
盡管大多數(shù)時候我們只簡單看到了表面上的性能收益,但隨著蘋果越來越重視芯片和內(nèi)部組件的定制設(shè)計和研發(fā),除了無可比擬的性能優(yōu)勢之外,特定領(lǐng)域的功能特征上也形成巨大的競爭優(yōu)勢。
有了最好的應(yīng)用生態(tài),最好的定制級移動處理器,最受贊譽可完全掌控的操作系統(tǒng),可以說蘋果的軟硬件整合能力越來越強大了。
這種碾壓級的優(yōu)勢很多 OME 手機制造商根本難以與之競爭,部分原因在于,首先大多數(shù)智能手機制造商起步太晚,再者很多廠商負(fù)擔(dān)不起的相關(guān)和巨額的研發(fā)支出。
因此,對于蘋果在手機行業(yè)的競爭對手而言,直接從高通這樣的芯片公司購買方案顯然更簡單,也更可取。
就拿 AI 單元來說,除了蘋果和華為已有 NPU 神經(jīng)網(wǎng)絡(luò)單元之外,高通從 2014 年開始也公開了 NPU 的研發(fā),并且在最新兩代驍龍 8xx 芯片上都有所體現(xiàn),例如驍龍 835 就集成了“驍龍神經(jīng)處理引擎軟件框架”,提供對定制神經(jīng)網(wǎng)絡(luò)層的支持,OEM 廠商和軟件開發(fā)商都可以基于此打造自己的神經(jīng)網(wǎng)絡(luò)單元。
其實 ARM 本身早已在神經(jīng)網(wǎng)絡(luò)上發(fā)力,今年所發(fā)布的 Cortex-A75 和 Cortex-A55 都融入了 自家的 AI 神經(jīng)網(wǎng)絡(luò) DynamIQ 技術(shù)。
ARM 聲稱,通過 DynamIQ 技術(shù)在未來 3-5 年內(nèi)實現(xiàn)比當(dāng)前設(shè)備高 50 倍的人工智能性能,可將特定硬件加速器的反應(yīng)速度提升 10 倍。
很顯然,AI、神經(jīng)網(wǎng)絡(luò)單元、機器學(xué)習(xí)等這些詞,今天只是開始而已。因此蘋果對手實現(xiàn)超車是可能辦得到的,就像華為買的寒武紀(jì)的 NPU 授權(quán),小米的澎湃也可以去買,三星自己定制的 Exynos 完全可以基于 DynamIQ 技術(shù),其他廠商只要采購高通芯片即可。
當(dāng)然,蘋果不會止步不前,而且正如前述,蘋果龐大的閉環(huán)生態(tài)鏈?zhǔn)瞧?ldquo;過人”之處。更重要的是,蘋果正逐漸擁有更多核心技術(shù),所以我們看到了自主 S 系列芯片、T 系列芯片和自主儲存控制器等,未來還會更多。