اپل در رویداد Peek Performance، قدرتمندترین عضو خانواده ی اپل سیلیکون را معرفی کرد. M1 Ultra به نوعی ترکیبی از دو تراشه ی M1 Max به حساب می آید و از CPU بیست هسته ای و گرافیک ۶۴ هسته ای بهره می برد. تراشه ی جدید اپل به کامپیوتر رومیزی و کوچک مک استودیو قدرت می بخشد و قرار است تا بهترین های دنیای PC را به چالش بکشد.
تراشه ی M1 Ultra درواقع ترکیبی از دو تراشه ی M1 Max به حساب می آید. مهندسان کوپرتینو دو تراشه ی M1 Max را با رابطی موسوم به UltraFusion به یکدیگر متصل کرده اند. این رابط با پهنای باند فوق العاده پرسرعت ۲٫۵ ترابایت برثانیه ای به دو بلوک M1 Max اجازه می دهد تا مانند یک تراشه ی واحد رفتار کنند. تراشه ی جدید اپل با لیتوگرافی ۵ نانومتری TSMC تولید می شود و ۱۱۴ میلیارد ترانزیستور در دل خود دارد.
اپل می گوید تراشه ی جدیدش می تواند عملکردی هم سطح Core i9-12900K و RTX 3090 را با توان مصرفی به مراتب کمتر، ارائه دهد؛ اما این ادعا چه اندازه با واقعیت هم خوانی دارد؟ در ادامه براساس بنچمارک های M1 Max، عملکرد M1 Ultra را تخمین می زنیم.
ویدئوی تحلیل تراشه M1 Ultra
پردازنده مرکزی M1 Ultra دربرابر Core i9 12900K
M1 Ultra از ترکیب ۱۶ هسته ی پرقدرت با واحدهای اجرایی فوق عریض و ۴ هسته ی کم مصرف با واحدهای اجرایی عریض به عنوان CPU استفاده می کند. اپل در مورد فرکانس و معماری هسته ها اطلاعات چندانی ارائه نمی دهد؛ اما به نظر نمی رسد تغییری در این زمینه شاهد باشیم؛ احتمالاً هسته های پرقدرت و کم مصرف از همان معماری M1 بهره می برند و فرکانس آن ها به ترتیب ۳٫۲ و ۲٫۰ گیگاهرتز است.
هرکدام از هسته های پرقدرت M1 Ultra به ۳۲۰ کیلوبایت کش L1 دسترسی دارند؛ در حالی که در مجموع ۴۸ مگابایت کش L2 به صورت مشترک در اختیارشان قرار گرفته است. اعداد یادشده برای هسته های کم مصرف به ترتیب ۱۹۲ کیلوبایت و ۸ مگابایت هستند. به لطف ترکیب دو بلوک M1 Max، اکنون ۶۴ مگابایت کش سیستمی نیز برای کل سیستم دردسترس قرار دارد؛ اما از کش سطح L3 خبری نیست.
در سوی دیگر میدان، پردازنده ی Core i9-12900K از ترکیب ۸ هسته ی پرقدرت با معماری Golden Cove، فرکانس پایه ی ۳٫۲ و فرکانس توربوی ۵٫۲ گیگاهرتز در کنار ۸ هسته ی کم مصرف با معماری Gracemont، فرکانس پایه ی ۲٫۴ و فرکانس توربوی ۳٫۹ گیگاهرتز بهره می برد. هسته های پرقدرت از پردازش چندرشته ای پشتیبانی می کنند؛ بنابراین کل پردازنده قابلیت پردازش هم زمان ۲۴ رشته را دارد.
مشخصات فنی پردازنده ی مرکزی M1 Ultra دربرابر Core i9-12900K | ||
---|---|---|
پارامترها/تراشه | Apple M1 Ultra | Apple Core i9-12900K |
فرایند ساخت | ۵ نانومتری TSMC تراکم تقریباً ۱۷۱٫۳۰ میلیون ترانزیستور بر میلی مترمربع | Intel 7 تراکم تقریباً ۱۰۰٫۷ میلیون ترانزیستور بر میلی مترمربع |
هسته ها | ۱۶ هسته ی پرقدرت با فرکانس ۳٫۲ گیگاهرتز ۴ هسته ی کم مصرف با فرکانس ۲٫۰ گیگاهرتز | ۸ هسته ی پرقدرت با فرکانس پایه و توربوی ۳٫۲ و ۵٫۲ گیگاهرتز ۸ هسته ی کم مصرف با فرکانس پایه و توربوی ۲٫۴ و ۳٫۹ گیگاهرتز |
کش L1 | ۳۲۰ کیلوبایت برای هریک از هسته های پرقدرت ۱۹۲ کیلوبایت برای هریک از هسته های کم مصرف | ۸۰ کیلوبایت برای هریک از هسته های پرقدرت ۹۶ کیلوبایت برای هریک از هسته های کم مصرف |
کش L2 | ۴۸ مگابایت برای کل هسته های پرقدرت ۸ مگابایت برای کل هسته های کم مصرف | ۱٫۲۵ مگابایت برای هریک از هسته های پرقدرت ۴ مگابایت برای کل هسته های کم مصرف |
کش L3 | ندارد | ۳ مگابایت برای هریک از هسته های پرقدرت ۶ مگابایت برای کل هسته های کم مصرف |
کش اشتراکی سطح سیستم | ۶۴ مگابایت برای کل تراشه | ندارد |
DRAM | ۶۴ یا ۱۲۸ گیگابایت رم 6400-LPDDR5 | تا ۱۲۸ گیگابایت DDR5-4800 یا DDR4-3200 |
پهنای باند حافظه | ۸۰۰ گیگابایت برثانیه | ۷۶٫۸ گیگابایت برثانیه |
توان مصرفی | ۶۰ تا ۷۰ وات | ۱۲۵ وات پایه و ۲۴۱ وات توربو |
هرکدام از هسته های پرقدرت Core i9 12900K در مجموع به ۸۰ کیلوبایت کش L1 و ۱٫۲۵ مگابایت کش L2 و ۳ مگابایت کش L3 دسترسی دارند. هریک از هسته های کم مصرف ۹۶ کیلوبایت کش L1 دراختیار دارند؛ در حالی که ۲ بلوک حافظه ی ۲ مگابایتی L2 و ۲ بلوک حافظه ی ۳ مگابایتی L3 نیز به صورت مشترک برای هسته های کم مصرف تدارک دیده شده است.
تراشه ی M1 Ultra از حداکثر ۱۲۸ گیگابایت رم LPDDR5-6400 با پهنای باند شگفت انگیز ۸۰۰ گیگابایت برثانیه پشتیبانی می کند؛ این مقدار رم در قالب ۸ بلوک ۱۶ گیگابایتی و دسته های چهارتایی در دو طرف تراشه قرار گرفته اند؛ البته در نظر داشته باشید که M1 Ultra از حافظه ی ۱۲۸ گیگابایتی DRAM خود به عنوان VRAM نیز استفاده می کند.
پردازنده ی Core i9 12900K نیز درست مانند M1 Ultra از ۱۲۸ گیگابایت رم پشتیبانی می کند؛ اما در بهترین شرایط می توان از رم DDR5-4800 همراه آن استفاده کرد. حداکثر پهنای باند حافظه دردسترس با پردازنده ی بالارده ی اینتل به ۷۶٫۸ گیگابایت برثانیه می رسد.
توان مصرفی پکیج CPU در تراشه ی M1 Max به حدود ۳۰ تا ۳۵ وات می رسید؛ بنابراین احتمالاً توان مصرفی پردازنده ی مرکزی M1 Ultra در محدوده ی ۶۰ تا ۷۰ وات قرار خواهد داشت؛ در حالی که پردازنده ی قدرتمند Core i9 12900K اینتل در بازه های زمانی کوتاه به توان مصرفی توربوی ۲۴۱ وات می رسد و توان مصرفی پایه ی آن در محدوده ی ۱۲۵ تا ۱۵۰ وات قرار می گیرد.
اپل می گوید پردازنده ی مرکزی M1 Ultra با مصرف یکسان حدود ۶۰ وات، تا ۹۰ درصد سریع تر از تراشه ی نسل دوازدهمی Core i9-12900K عمل می کند. کوپرتینونشین ها به نام بنچمارک اشاره ای نمی کنند و صرفاً به عبارت «بنچمارک های استاندارد رایج» در پانویس صفحات خود بسنده می کنند. در هر صورت براساس بنچمارک های تراشه ی M1 و M1 Max با در نظر گرفتن ضریب افت حدود ۱۰ درصدی به دلیل استفاده از اینترکانکشن UltraFusion، به صورت حدودی می توان عملکرد M1 Ultra را در بنچمارک CineBench R23 تخمین زد.
ازآنجاکه M1 Ultra از همان معماری M1 Max استفاده می کنند؛ بنابراین احتمالاً در بنچمارک های تک هسته ای عملکرد مشابهی را از هر دو تراشه شاهد خواهیم بود. با همین فرض، در بنچمارک CineBench تراشه ی غول پیکر اپل به امتیاز ۱۵۵۶ دست می یابد که حدود ۲۰ درصد از امتیاز ۱۹۷۳ پردازنده ی Core i9-12900K ضعیف تر است.
* توجه داشته باشید که ازآنجاکه متأسفانه هنوز سیستمی با Core i9 12900K را در زومیت بررسی نکرده ایم، نمودار زیر با ترکیبی از اعداد به دست آمده در بررسی های زومیت و آنانندتک به دست آمده اند.
در بنچمارک چندهسته ای CineBench R23، پردازنده ی مرکزی M1 Ultra به امتیاز تخمینی ۲۲۳۲۳ و Core i9 12900K به امتیاز ۲۶۷۶۶ دست می یابد؛ بنابراین در این آزمون نیز تراشه ی اپل با اختلافی ۱۵ درصدی ضعیف تر از پردازنده ی اینتل عمل می کند.
توجه داشته باشید که پردازنده ی Core i9-12900K برای دستیابی به چنین عملکرد خیره کننده ای به کیسی حجیم با سیستم خنک کننده ی کارآمدی نیاز دارد؛ چراکه توان مصرفی آن برای دقایقی در محدوده ی ۲۵۰ وات و در حالت پایدار در محدوده ی ۱۵۰ وات قرار می گیرد. پردازنده ی اینتل این عملکرد خیره کننده را نمی تواند با توان مصرفی ۶۰ تا ۷۰ وات و کیس کوچک ۳٫۶ لیتری همچون مک استودیو به دست آورد.
از دلایل ضعف و برتری دو پردازنده نسبت به هم می توان به لیتوگرافی به مراتب بهینه تر (۵ نانومتر TSMC دربرابر Intel 7) و معماری قدیمی تر M1 Ultra اشاره کرد که به سال ۲۰۲۰ و تراشه ی M1 بازمی گردد.
گرافیک M1 Ultra دربرابر RTX 3090
M1 اولترا از گرافیک یکپارچه ی ۴۸ یا ۶۴ هسته ای استفاده می کند و براساس اعلام اپل در قدرتمندترین نسخه از ۸۱۹۲ واحد اجرایی با قابلیت پردازش هم زمان ۱۹۶٬۶۰۸ رشته، ۲۵۶ واحد مدیریت بافت و ۱۲۸ واحد رندر خروجی بهره می برد. گرافیک M1 Ultra معماری مشترکی با M1 Max دارد و به احتمال زیاد با همان فرکانس ۱۲۹۶ مگاهرتزی کار می کند.
اپل توان محاسباتی M1 Ultra روی اعدادی با ممیز شناور و دقت مضاعف (FP32) را ۲۱ ترافلاپس عنوان می کند و می گوید گرافیک تراشه ی قدرتمندش از پسِ رندر بافت ها با نرخ ۶۶۰ گیگاتکسل برثانیه و پیکسل ها با نرخ ۳۳۰ پیکسل برثانیه برمی آید.
مشخصات فنی گرافیک M1 Ultra دربرابر RTX 3090 | ||
---|---|---|
پارامترها/تراشه | Apple M1 Ultra | RTX 3090 |
فرایند ساخت | ۵ نانومتری TSMC تراکم تقریباً ۱۷۱٫۳۰ میلیون ترانزیستور بر میلی مترمربع | ۸ نانومتری سامسونگ تراکم تقریباً ۴۵٫۱ میلیون ترانزیستور بر میلی مترمربع |
واحدهای محاسباتی | ۸۱۹۲ | ۱۰۴۹۶ |
واحدهای مدیریت بافت | ۵۱۲ | ۳۲۸ |
واحدهای رندر خروجی | ۲۵۶ | ۱۱۲ |
فرکانس گرافیک | ۱۲۹۶ مگاهرتز | ۱۳۹۵ مگاهرتز پایه و ۱۶۹۵ مگاهرتز بیشینه |
حافظه | ۶۴ یا ۱۲۸ گیگابایت LPDDR5-6400 | ۲۴ گیگابایت GDDR6X |
پهنای باند حافظه | ۸۰۰ گیگابایت برثانیه | ۹۳۶٫۲ گیگابایت برثانیه |
توان محاسباتی FP32 | ۲۱ ترافلاپس | ۳۵٫۶ ترافلاپس |
نرخ پردازش بافت | ۶۶۰ گیگاتکسل برثانیه | ۵۵۶ گیگاپیکسل برثانیه |
نرخ پردازش پیکسل | ۳۳۰ گیگاپیکسل برثانیه | ۱۸۹٫۸ گیگاپیکسل برثانیه |
توان مصرفی | ۱۰۰ تا ۱۲۰ وات | ۳۵۰ وات |
گرافیک M1 Ultra از حافظه ی VRAM مجزا بهره نمی برد و از همان ماژول های DRAM از نوع LPDDR5-6400 با پهنای باند ۸۰۰ گیگابایت برثانیه استفاده می کند؛ بدین ترتیب روی کاغذ گرافیک M1 Ultra به ۱۲۸ گیگابایت حافظه ی VRAM دسترسی دارد که معادل آن را در هیچ کارت گرافیک تجاری دیگری نمی توان یافت.
گرافیک پرچم دار انویدیا بالغ بر ۱۰۴۹۶ هسته، ۳۲۸ واحد مدیریت بافت و ۱۱۲ واحد رندر خروجی در بطن خود دارد. این گرافیک از معماری Ampere انویدیا بهره می برد و با فرکانس پایه و بیشینه ی ۱۳۹۵ و ۱۶۹۵ مگاهرتز کار می کند. RTX 3090 از ۲۴ گیگابایت حافظه ی پرسرعت GDDR6X با پهنای باند ۹۳۶٫۲ گیگابایت برثانیه بهره می برد.
انویدیا توان محاسباتی RTX 3090 روی اعدادی با دقت مضاعف (FP32) را ۳۵٫۵۸ ترافلاپس عنوان می کند. بررسی ها نشان می دهد که گرافیک غول پیکر انویدیا بافت ها و پیکسل ها را به ترتیب با نرخ ۵۵۶ گیگاتکسل برثانیه و ۱۸۹٫۸ گیگاپیکسل برثانیه پردازش می کند.
براساس داده های موجود از گرافیک M1 Max، به نظر می رسد که توان مصرفی گرافیک ۶۴ هسته ای M1 Ultra در محدوده ی ۱۰۰ تا ۱۲۰ وات قرار می گیرد؛ در حالی که RTX 3090 برای ارائه ی عملکرد خیره کننده اش به توانی بالغ بر ۳۵۰ وات نیاز دارد.
اپل می گوید گرافیک M1 Ultra با ۲۰۰ وات مصرف انرژی کمتر، می تواند عملکردی هم سطح RTX 3090 دراختیار کاربر بگذارد؛ اما باز هم به نام بنچمارکی که برای رسیدن به این نتیجه استفاده کرده است، اشاره ای نمی کند؛ اما براساس تجربه ی قبلی مان، بنچمارک بازی محور GFXBench معمولاً با ادعاهای اپل هم خوانی دارد.
در نمودار زیر، با در نظر گرفتن ضریب افت ۱۵ درصدی به دلیل وجود اینترکانکشن UltraFusion بین دو تراشه ی M1 Max و براساس عملکرد M1 Max به امتیاز ۵۲۵ فریم برثانیه در بنچمارک Aztec Ruins High Tier Offscreen برای M1 Ultra دست یافتیم که ۱۰ درصد بهتر از نتیجه ی به دست آمده برای RTX 3090 در بررسی کیس غول پیکر MSI Aegis Ti5 است.
برتری M1 Ultra در بنچمارک GFXBench را می توان در اختلاف نرخ پردازش پیکسل ها و بافت ها جست وجو کرد؛ این پردازش ها روی تراشه ی اپل با نرخ ۳۳۰ گیگاپیکسل برثانیه و ۶۶۰ گیگاتکسل برثانیه صورت می گیرد؛ در حالی که RTX 3090 چنین پردازش هایی را با نرخ پایین ترِ ۱۸۹٫۸ گیگاپیکسل برثانیه و ۵۵۶ گیگاتکسل برثانیه صورت می دهد.
وقتی صحبت از توان محاسباتی به میان می آید، برتری مطلق از آن RTX 3090 است؛ همان طور که در نمودار زیر مشاهده می کنید، با در نظر گرفتن ضریب افت ۱۵ درصدی و براساس عملکرد M1 Max به امتیاز ۱۲۳۶۰۳ برای تراشه ی M1 Ultra دست یافتیم که با ختلافی ۴۰ درصدی، در سطح پایین تری نسبت به گرافیک RTX 3090 قرار می گیرد.
ضعف فاحش M1 Max در بنچمارک های محاسباتی نسبت به RTX 3090 را می توان به کم بودن تعداد واحد های اجرایی (۸۱۹۲ دربرابر ۱۰۴۹۶) و توان محاسباتی پایین تر آن (۲۱ دربرابر ۳۵٫۶ ترافلاپس) نسبت داد.
در مورد گرافیک نیز باید به تفاوت توان مصرفی اشاره کرد؛ برای دستیابی به بالاترین سطح عملکرد RTX 3090 به کیسی غول پیکر با سیستم خنک کننده ای کارآمد نیاز خواهید داشت. توان مصرفی گرافیک قدرتمند انویدیا حدود ۳ برابر M1 Ultra است.
جمع بندی
M1 Ultra به مدد مواردی همچون واحدهای اجرایی فوق عریض هسته های Firestorm، حافظه های کش حجیم و پهنای باند فوق العاده ی ۸۰۰ گیگابایت برثانیه ای، عملکرد خیره کننده ای را به نسبت توان مصرفی اندکش به نمایش می گذارد؛ اگر تخمین هایمان را ملاک قرار دهیم، پردازنده ی مرکزی M1 Ultra با ۶۰ درصد مصرف انرژی کمتر، می تواند ۸۵ درصد از عملکرد پردازنده ی قدرتمند Core i9-12900K را ارائه دهد.
در سوی دیگر میدان، M1 Ultra به احتمال زیاد در بنچمارک بازی محور GFXBench حدود ۱۰ درصد بهتر از RTX 3090 عمل می کند؛ اما در بنچمارک های محاسباتی با اختلافی ۶۰ درصدی از گرافیک انویدیا جا می ماند.
توجه داشته باشید که اپل بخش زیادی از برتری خود را به لیتوگرافی فوق العاده بهینه ی TSMC مدیون است؛ در حالی که لیتوگرافی ۵ نانومتری TSMC، تراکم ترانزیستور حدودی ۱۷۱٫۳۰ میلیون ترانزیستور بر میلی متر مربع را فراهم می کند؛ لیتوگرافی Intel 7 تراکم ۱۰۰٫۷ میلیون ترانزیستور بر میلی متر مربع را برای پردازنده ی اینتل و لیتوگرافی ۸ نانومتری سامسونگ تراکم ناامیدکننده ی ۴۵٫۱ میلیون ترانزیستور بر میلی متر مربع را برای گرافیک انویدیا فراهم می سازد.
0 نظرات