پردازنده های اینتل نسل چهارم هاسول(Haswell)
چهارشنبه, ۷ خرداد ۱۳۹۳، ۰۴:۰۰ ب.ظ
مدتی است که در فهرست مشخصات لپتاپها، دسکتاپها و اولترابوکهای جدید نام پردازندههای جدید اینتل یعنی نسل چهارم خانوادهی Core با عنوان Haswell را میبینیم و طبق معمول این سوال مهم مطرح میشود که تفاوت نسل جدید با نسل سوم یا آیوی بریج چیست؟ در این مطلب میخواهیم نگاهی اجمالی به هسولها داشته باشیم و از آن مهمتر، نتیجهی بهینهسازیهای اینتل را در تستها، بازیها و بنچمارکها ببینیم. اینتل مدعی است که کارایی نسل جدید با سرعت کلاک مساوی، 5 الی 15 درصد نسبت به آیوی بریجیها یا به عبارت دیگر، نسل سوم خانوادهی Core افزایش نشان میدهد. مصرف انرژی، افزایش خاصی نداشته و در مجموع عملکرد اینتل در طراحی نسل جدید به نظر راضیکننده میرسد، اما انقلابی نیست.تغییرات اعمال شده در هسول هسول هم مثل نسل قبلی از لیتوگرافی 22 نانومتری استفاده میکند. از نظر معماری، موتور اجرایی اینتل مثل همیشه بهبود یافته است. اندازهی بافر بیشتر شده و ساختار اطلاعات در هستههای پردازنده بهتر شده است. اجرای خارج از نوبت دستورات (یا OoOE) پیشرفت کرده و لذا اجرای دستورات به صورت موازی، باز هم بهتر از قبل است. بخش بعد از کانال اطلاعات یا به عبارتی پایپلاین، بهتر از قبل پیشبینی میکند و دستورات را تقسیم مینماید. در هسول دو درگاه اجرایی جدید اضافه شده است، در واقع بعد از اختراع اولین خانوادهی پردازندههای Core در سال 2006 همواره از 6 درگاه اجرایی استفاده میشد تا اینکه اینتل بالاخره این تعداد را به 8 عدد افزایش داده است. از نظر مجموعه دستورات پشتیبانی شده، AVX2 ( مخفف Advanced Vector Extensions یا نسخهی دوم اکستنشنهای پیشرفتهی برداری) اضافه شده که شامل یک عمل FMA (مخف Fused Multiply-Add به معنی عمل ترکیبی ممیز شناوری جمع و ضرب) است، این عمل خروجی محاسبات ممیز شناوری را تا حد قابل توجهی افزایش میدهد. با دو برابر شدن خروجی ممیز شناوری، کش سطح L1 نیز دارای پهنای باند دو برابر شده تا اطلاعات کافی را به غولهای جدید پردازشی اینتل برساند. در برخی مدلهای هسول از دستورات تراکنشی حافظه یا TSX نیز پشتیبانی میشود. لطفا به ادامه مطلب برویدمنبع:www.rasekhoon.net
در هسول تأخیر بیشتری در دسترسی به حافظه وجود دارد، البته در تمام مدلها و تمام محدودهی حافظه این وضعیت قابل مشاهده نیست: کش L3 نقشهی جداگانهای برای انرژی مصرفی و فرکانس کاری خود دارد و به نظر میرسد که آرامتر از قبل مشغول فعالیت است. در واقع دسترسی به آن با تأخیری در حد 2 تا 3 سیکل انجام میشود که حاصل جدا کردن کش L3 است.هسول و توان مصرفی کمتر هسولها در مجموع مصرف انرژی کمتری دارند. به خصوص هسولهای سری U و Y که برای اولترابوکها و تبلتها در نظر گرفته شدهاند. سوییچ بین حالات مختلف مصرف انرژی چیپست و هستههای پردازنده، حدود 25 درصد سریعتر از آیوی بریج است. بنابراین مدیریت مصرف انرژی بهتر از قبل صورت میگیرد و انتخاب حالات کممصرف با سرعتی بالاتری انجام میشود. در حالت بیکار نیز انرژی مصرفی پلتفرم کاهش زیادی داشته است. در نمودار زیر انرژی مصرف پردازندههای هسول و آیوی بریج در کنار مادربوردهای Z77 Deluxe و Z87 Deluxe ایسوس نمایش داده شده است: البته این تنها به پردازندهی اینتل مربوط نمیشود، ایسوس هم برای ارائهی محصول بهتر و فروش بیشتر، تلاش خود را کرده است اما به هر حال ادعای اینتل مبنی بر اینکه نوتبوکها و اولترابوکهای هسولی 50 درصد کممصرفتر بوده و تا 9 یا 10 ساعت با شارژ باتری روشن میمانند، بیاساس نیست. مصرف انرژی هسول در بار سنگین پردازشی بیشتر از آیوی بریج است، مثلاً بار پردازشی اینکودر ویدیویی x264 که با استفاده از تمام هستهها، ویدیو را تبدیل میکند. بنابراین اگر از نوتبوک هسولی در بار پردازشی سنگین استفاده شود، مصرف انرژی آن کم و بیش مشابه مدلهای آیوی بریجی خواهد بود. Core i7-4770K نسبت به پرچمدار نسل قبل یعنی Core i7-3770K حدود 11 درصد بیشتر مصرف کرده و 13 درصد کارایی بالاتری دارد. لذا کارایی به ازای هر وات برق مصرفی، افزایش کوچکی داشته است. هسول و کنترلر حافظهی بهتر، اورکلاک سادهتردر هسول کنترلر حافظه پیشرفت خوبی داشته است. البته آیوی بریج هم بسیار عالی است اما هسول دیو قدرتمندی در زمینهی اورکلاک کردن حافظه به حساب میآید. هسول و درگاهها و اتصالات جانبی کاملتردر چیپستهای سری 8 اینتل از سوکت 1150 پینی پردازنده استفاده شده است و لذا نمیتوان پردازندههای جدید را در مادربوردهای سری 7 قرار داد. شاید علت این تغییر شدید، تغییرات اساسی به وجود آمده در رابطه با انتقال توان مصرفی است. در چیپست سری 8 نهایتاً 6 درگاه SATA 6 Gb/s وجود دارد، چیزی که در 7 به 2 عدد محدود شده بود. 4 درگاه یواسبی 3 نیز پشتیبانی شده است. اورکلاک کردن یک هسولدر هسول از رگولاتور ولتاژ کاملاً یکپارچه با پردازنده یا به اختصار FIVR استفاده شده است، بنابراین توان مصرفی از 77 واتی که در آیوی بریج دیده بودیم، به 84 وات افزایش یافته است چرا که مدیریت توان مصرفی پیشرفتهتر شده است. محدودیتهای اورکلاکی که با معرفی سندی بریج شروع شد و در آیوی بریج هم ادامه داشت، باز هم وجود دارد. بنابراین تمام مدلهای معمولی از نظر فرکانسی قفل هستند یا به عبارت بهتر، نمیتوان ضریب کلاک پایه را به صورت دلخواه انتخاب نمود. اما در مدلهای سری K باز هم مثل قبل همه چیز کاملاً آنلاک شده است. یکی از تغییرات مهم این است که میتوان برای کلاک پایه یا BCLK سه حالت انتخاب کرد، 100، 125و 167 مگاهرتز. بنابراین هسول در اورکلاک کردن، انعطاف بیشتری از خود نشان میدهد. در هسول با ولتاژ 1.2 الی 1.35 ولت میتوان به سرعت کلاکی بین 4.3 تا 7 گیگاهرتز دست یافت. البته با استفاده از خنککاری با هوا و در نظر گرفتن این موضوع که در سرعتهای بالای 5 گیگاهرتز، خنککاری سیستم باید کارایی بالایی داشته باشد. روند معرفی پردازندههای جدیدامسال اینتل از پردازندههای قدرتمند 4 هستهای شروع میکند و تدریجاً 2 هستهایها و مدلهای ویژه اولترابوکها و نوتبوکهای سبک را روانهی بازار خواهد کرد. خانوادهی جدیدی از محصولات با پسوند R نیز در راه هستند که دارای سوکت معمولی نمیباشند. منظور از سوکت BGA یا Ball Grid Array در این تراشهها این است که سطح زیرین با شبکهای از کرههای لحیم پوشانده شده و مستقیماً روی برد مدار چاپی مادربورد، لحیم میشوند. Core i7-4770R یکی از این مدلهاست که از گرافیک قدرتمند و جدید Iris Pro 5200 استفاده میکند. باقی مدلها از گرافیک GT2 یا HD 4600 بهره میبرند که 20 واحد اجرایی دارد و نسبت به HD 4000 با 16 واحد اجرایی، سریعتر است. GT3e آیریس پرو 5200 دارای 40 واحد پردازشی و حافظهی داخلی DRAM است و در ادامه بیشتر به آن میپردازیم. کش L3 مدل Core i7-4770R نیز به 6 مگابایت تقلیل یافته است. تمام Core i7ها دارای تکنولوژی هایپرتردینگ هستند و به عبارت دیگر 4 هستهی واقعی و 4 هستهی مجازی دارند تا عملکرد بالاتری داشته باشند. مدلهایی با پسوند S نسبت به مدلهای معمولی، کمتر در فرکانس توربوبوست فعالیت میکنند و این به علت مصرف انرژی کمتر است. مدلهایی با پسوند T توان مصرفی پایینتری دارند و لذا مدت زمان کمتری در فرکانس کاری ماکسیمم کار میکنند. پشتیبانی از AVX2، Quick Sync، AES-NI، PCIe 3.0 و تکنولوژی مجازیسازی اینتل در تمام مدلها وجود دارد. در 4770K و 4770R از vPro، TXT، VT-d و SIPP نیز پشتیبانی میشوند. پردازندههای Core i5 با قیمت دو سوم، کارایی بسیار بالایی دارند که اغلب اوقات به مدلهای Core i7 نزدیک است. در این محصولات هایپرتردینگ و به عبارتی هستههای مجازی وجود ندارد. تمام مدلها از گرافیک HD 4600 استفاده میکنند. هیچ یک از مدلها از vPro، TXT و VT-d پشتیبانی نمیکند. فعلاً خبری از مدلهای 2 هستهای و مدلهای Core i3 نشده است. شاید فصل آتی مشخصات این مدلها منتشر شود. مساحت و تعداد ترانزیستورامسال مطابق معمول تعداد ترانزیستور در پردازندههای اینتل افزایش داشته است. مساحت روند نزولی که از سندی بریج تا آیوی بریج دیده میشد را طی نکرده و در بیشتر مدلها، سطح قالب تراشه افزایش داشته است. در مدلهایی که از گرافیک قدرتمند GT3 استفاده میکنند، مساحت 87 میلیمتر مربع بیش از مدلهایی است که از GT2 بهره میگیرند. بنابراین مدلهایی که از 40 واحد پردازش گرافیکی استفاده میکنند احتمالاً افزایش دوبرابری در مساحت دارند یعنی 174 میلیمتر مربع بزرگتر هستند. جالب است که در یک پردازندهی 4 هستهای هسول با گرافیک GT3 حدود 65 درصد سطح قالب به پردازندهی گرافیکی اختصاص مییابد. این رقم در مورد تراشههایی با گرافیک GT2، تنها 33 درصد است. 128 مگابایت حافظهی eDRAM نیز 84 میلیمتر مربع به بستهی کلی تراشه اضافه میکند. اما به یک نکتهی جالب توجه کنید. یک هسول 4 هستهای با گرافیک GT2 و 1.4 بیلیون ترانزیستور مساحت تراشه برابر با 177 میلیمتر مربع است. در یک آیوی بریج با 1.2 بیلیون ترانزیستور و گرافیک GT2، مساحت تراشه 160 میلیمتر مربع بود. بنابراین نتیجه میگیریم که هسول با 17 درصد ترانزیستور بیشتر تنها 11 درصد بزرگتر است. علاوه بر ترانزیستورهای بیشتر، شامل پردازندهی گرافیکی بزرگتر و قابلیتهای دیگری نیز هست. بنابراین به این نتیجه میرسیم که اینتل معماری جدید خود را کوچکتر از آیوی بریجی که خود یک تراشهی فوقالعاده کوچک بود، طراحی کرده است. کارایی پردازندههوسل نسبت به آیوی بریج بین 1 الی 19 درصد سریعتر است و میانگین 8.3 درصدی افزایش سرعت پردازش، یک رکورد خوب است. نسبت به سندی بریج نیز بین 7 تا 26 درصد افزایش سرعت وجود دارد. البته با توجه به نتیجهی بنچمارک Kraken میتوان گفت که افزایش 7.8 درصدی سرعت محاسبات، نشانگر این است که هسول هنوز هم جای بهینهسازی دارد. اولین بنچمارک که سرعت پردازنده را در انجام محاسبات تکتردی و چند تردی نشان میدهد، Cinebench 11.5 است. نتیجه را در نمودارهای زیر ببینید: مشاهده میکنید که فقدان هایپرتردینگ در مدل Core i5 هسول، عملکرد چند تردی آن را نسبت به رقبای نسلهای قبلی که دارای هایپرتردینگ و به عبارتی هستههای مجازی هستند، تا چه حد پایین آورده است. تست بعدی نرمافزار معروف فشردهسازی فایل یعنی 7-zip میباشد، این بار هم عملکرد به صورت تک تردی و چند هستهای مورد مقایسه قرار میگیرد: بنچمارک جاوااسکریپت در مرورگر کروم: بنچمارک تبدیل فایل ویدیویی با اینکدر معروف x264: بنچمارک رمزگذاری TrueCrypt: تست کامپایل کردن موزیلا فایرفاکس در ویژوآل استودیوی 2012: جالب است که هسول در کامپایل کردن 15 درصد سریعتر از آیوی بریج عمل کرده، آن هم با فرکانس کاری یکسان. این تست نشان میدهد که بهینه شدن هسول از نظر تعداد دستوراتی که در یک سیکل کلاک انجام میشود، یا به عبارتی بهبود IPC چه تأثیری در کاربردهای روزمرهی یک برنامهنویس دارد.