• Intel Core i5 – Nehalem

    על מעבדי i5 ו i7 כבר שמעתם? הכירו את המנוע החדש ש intel מציעה לכם

    שלמה מזרחי וגיא זיסקינד
    פורסם ב: 23 פברואר 2010
    הדפס כתבה
    כתוב לעורך
    X

    שלח לחבר

    בחודש נובמבר אשתקד, השיקה אינטל את מיקרו-ארכיטקטורת Nehalem, אשר הליבה הראשונה שהתבססה עליה הייתה ליבת Bloomfield. היא הציגה מבנה מודולרי ויעיל והוכיחה באופן מרשים את עליונותה בביצוע חישובים מורכבים הכרוכים בכמויות נתונות גדולות. מעבדים אלו מותגו כסדרת Core i7 ויועדו לתושבת ה-LGA1366.

    חסרונה המרכזי של סדרת המעבדים החדשה היה מחירה שלא היה שוה לכל נפש – מעבדים יקרים (המעבד הזול ביותר בסדרה, ה-Core i7 920, נמכר ב-284 דולרים בקניית אלף יחידות) בשילוב עם לוחות אם יקרים (בסביבות ה-200 דולרים ללוח בסיסי) ודרישה לסטים משולשים של זיכרון מסוג DDR3 תרמו ליצירת בסיס מערכת יקר שהדיר משתמשים רבים מלקנות מערכת מחשב המבוססת על טכנולוגיה זו.

    אולם לאינטל לא הייתה כוונה להוריד את מחירי מערכות ה-LGA1366 ולכן הפתרון שלה היה להציג גרסה שונה של Nehalem לזרם המרכזי של המשתמשים. היום, באיחור מה – אשר יש האומרים כי נבע מסיבות כלכליות של הורדת מלאי ערכות השבבים מסדרה 4 אצל יצרני לוחות האם – מציגה אינטל גרסה נוספת, חדשה, שאמורה להפוך את המיקרו-ארכיטקטורה המוצלחת לנגישה יותר לקהל הרחב.

    Intel i5 coreסדרת המעבדים החדשה ממותגת בעיקר תחת השם Core i5 והליבה החדשה עצמה נקראת Lynnfield. למרות הסברה הראשונית כי ליבה זו תהיה ייחודית לסדרת ה-Core i5, הרי שבפועל ההשקה כוללת גם מעבדים המבוססים על ליבה זו ומהווים חלק מסדרת ה-Core i7 היקרה יותר. מעבדים אלו כוללים גם את טכנולוגיית ה-Hyper-Threading שאינה קיימת במעבדי ה-Core i5, ועל ההבדלים בין שתי הסדרות נעמוד בהמשך הכתבה.

    כל המעבדים החדשים מיוצרים בליתוגרפיית 45 ננומטר היות וה"טוק" הבא – בתבנית הטיק-טוק (Tick-Tock) של אינטל – מתוכנן לתחילת שנת 2010, או אז תחל החברה בייצור מעבדים בטכנולוגיית ייצור של 32 ננומטר.

    כאן המקום להזכיר כי מיקרו-ארכיטקטורת Nehalem תוכננה בבסיסה להיות מודולרית כך ששינוי של מודולים מסוימים או שילובם בדרכים שונות יאפשר להציג מעבדים המיועדים לטווח רחב של שימושים. במעבדי ה-Core i5 אנו רואים לראשונה ניצול של עיקרון המודולריות, שכן המעבדים החדשים מבוססים על אותה ליבת עיבוד (core) המוכרת של ה-Nehalem אך כוללים מספר שינויים במרכיבי המעטפת (uncore), כפי שנסביר בהמשך.

    עניין נוסף שכדאי לתת עליו את הדעת הוא המיתוג של סדרות המעבדים, נושא בעייתי משהו אצל אינטל. תחילה נוצר הרושם כי סדרת Core i7 תבוסס על ליבת Bloomfield בלבד, ואילו הליבה Lynnfield תמותג כסדרת Core i5. אולם כעת מתברר כי אין כך הדבר והליבה החדשה תפעם במעבדים חדשים משתי הסדרות.

    סדרת ה-Core i7 תכיל מעתה שתי סדרות – סדרת 900 הנוכחית המבוססת על ליבת Bloomfield ומתאימה לתושבת LGA1366, וסדרת 800 החדשה המתאימה לתושבת LGA1156 שתבוסס על ליבת Lynnfield יחד עם ערכת השבבים החדשה P55. מעבדי Core i5 יהיו מסדרה 700 וגם הם פועלים עם ערכת השבבים P55.

    לשם השוואה והבהרה של מיתוג המעבדים ושמותיהם תמצאו בטבלה הבאה את כל מעבדי סדרת ה-Core i7 ו-Core i5 והמאפיינים העיקריים שלהם.

    i5

    ניכר כי הצגת ה-Core i5 מאפשרת הלכה למעשה לקהל הרחב להנות מביצועי מיקרו-ארכיטקטורת Nehalem, שהיו עד עתה מחוץ לתקציב של מרבית המשתמשים. מעבד במחיר הנמוך מ-200 דולרים יחד עם ערכת שבבים זולה מעט יותר בהחלט יקרוץ לרוכשי מחשבים פוטנציאליים רבים. המעבדים שיסבלו בעיקר מתחרות זו הם מעבדי ה-Core 2 Quad, כגון ה-Q9400, אשר כדאיות רכישתם תלויה כעת בהורדת מחיר שלהם או התבססות על פלטפורמה זולה עם ערכת שבבים מיושנת.

    בהמשך תציג אינטל גם את סדרת ה-Core i3, אשר צפויה לחלוק מאפיינים זהים עם ה-Core i5, אך ללא אפשרות ה-Turbo Boost שכפי שנדגים בהמשך, אשר מספקת תוספת ביצועים ניכרת בעבודה עם ליבה בודדת או שתי ליבות.

    i5 core

    במעבד ה-Core i5 750 בפרט ובמעבדים החדשים מבוססי ליבת Lynnfield בכלל, אנו רואים כיצד מושג הארכיטקטורה המודולרית בא לידי ביטוי. כאמור, מיקרו-ארכיטקטורת Nehalem המקורית לא השתנתה והיא עדיין קיימת בליבות העיבוד (core) של מעבדי ה-Lynnfield. אולם רכיבי המעטפת (uncore) השונים דווקא השתנו, ועליהם נרחיב כאן את הדיבור. באופן כללי, אם ניקח ליבת Bloomfield ונוריד מבקר הזיכרון ערוץ אחד, נבטל את אפיקי ה-QPI ונחליפם באפיק DMI, נקבל גירסה "מבויתת" של Nehalem.

    memory controller

    כאן המקום להדגיש כי מעבדי ה-Core i7 בעלי ליבת Bloomfield ימשיכו להיות הבחירה המועדפת למערכות קצה חזקות, שכן תמיכתם בערוץ הזיכרון המשולש (Triple Channel) ויכולות ערכת השבבים המשופרות (בעיקר למערכי כרטיסי מסך חזקים) עדיין מהוות יתרון לאלו שרוצים להפיק את המקסימום האפשרי ממערכת המחשב שברשותם.

    במערכות מחשב חזקות, אפיקי QPI (המתוכננים לקצב העברת נתונים של 25.6 גיגה-ביט בשנייה) יכולים לשמש למערכת עם שני מעבדים ו/או לשימוש עם התקני PCI Express הצורכים רוחב פס גדול, כלומר ניתן להרכיב תחנות עבודה חזקות ושרתים ולא בהכרח מחשב ביתי.

    כפי שזה נראה כעת, מערכות בתושבת LGA775 ימשיכו להתקיים ויהוו את האופציה הטובה והמשתלמת ביותר במערכות מחשב בינוניות וזולות יחסית, בעיקר בכל הנוגע למעבדים כפולי ליבה ולמעבדי ארבע ליבות מוחלשים, עד להיעלמות ההדרגתית של תושבת זו מן השוק.

    פרט חשוב המאפיין את ליבת ה-Lynnfield הוא מעטפת ההספק (TDP, ר"ת Thermal Design Power) שהצטמצמה באופן משמעותי יחסית לליבת Bloomfield ועומדת כעת על 95 וואט בלבד (לעומת 130 וואט), שיפור של כ-27 אחוזים. שיפור זה ניתן לייחס לבקר הזיכרון הפשוט יותר, להיעדרם של אפיקי ה-QPI וככל הנראה גם לשיפור בתהליך הייצור (אם כי עדיין מדובר ב-45 ננומטר). זהו יתרון שאין לזלזל בו שכן הוא מקל באופן משמעותי על עומס החום במארז ומאפשר שימוש באמצעי קירור סולידיים יותר:

    כפי שציינו, המיקרו-ארכיטקטורה Nehalem היא הבסיס לליבת ה-Lynnfield החדשה. משמעות הדבר בפועל היא שליבות העיבוד זהות לליבות ה-Bloomfield ונהנות מאותם יתרונות ביעילות והאצת העיבוד, לרבות מנגנון ה-Turbo Boost המאפשר העלאת תדר דינמית בהתאם לצורך, בגבולות מעטפת ההספק המותרת.

    בסדרת מעבדי ה-Core i5, המבוססת על ליבת ה-Lynnfield, שופרה משמעותית פעולת מנגנון ה-Turbo Boost הפועל באמצעות בקר דינמי פנימי אשר מווסת את תדר המעבד בפרקי זמן קצרים מאוד. התוכנה בעזרתה עקבנו אחר פעולת המנגנון מרעננת את התצוגה 20 פעמים בשנייה, ויש לציין כי על אף שהיא חדשה ועדיין בגרסת בטא, התוצאות עקביות ונראות מדויקות להפליא.

    בחלק מהדוגמאות השתמשנו בתוכנת Cinebench, כאשר הרצת הבדיקה במצב ריבוי ליבות מראה בבירור כיצד הבקר מייצב תדר קבוע לכל ארבעת הליבות, ומקפיץ את המכפלה ל-21 (במקום 20 במקור).

    כמו כן, ב-Core i7 מנגנון ה-Turbo Boost היה סטטי ותמיד הקפיץ ב-1 רק את מכפלת הליבה הפעילה ביישומים שדרשו רק ליבה אחת, בעוד שביתר היישומים לא היה כל שינוי. במעבדי ה-Core i5 ניתן לראות כיצד כאשר מפעילים את המבחן רק על ליבה אחת, הקפיצה דרמטית בהרבה והמכפלה עולה ל-24 (להזכירכם, במקום 20 במקור), וחשוב מכך – מכיוון שהתוכנה מתייחסת למעבד כיחידת עיבוד אחת (ת'רד בודד), בכל רגע נתון רק אחת הליבות פעילה, אם כי לא בהכרח אותה ליבה.

    מהתמונות ניתן לראות בבירור כיצד הבקר מזהה את הליבה הפעילה, ורק אותה הוא מקפיץ לתדר הגבוה ב-533 מגה-הרץ מזה המקורי. במקרה שהמערכת באוברקלוק הקפיצה גדולה אף יותר, לדוגמה בבאס של 200 מגה-הרץ נקבל קפיצה של 200 מגה-הרץ X 4 = 800 מגה-הרץ.

    כדי לבדוק את יעילות המנגנון בדקנו זאת גם עם תוכנת Super PI שפועלת רק על ליבה אחת. גם בבדיקה זו היינו עדים לאותה תופעה, וניתן לראות זאת בתמונה המראה מה קורה כאשר מגבילים את התוכנה (באמצעות מערכת ההפעלה), כך שתשתמש בליבה פיזית אחת.

    התוצאה המתקבלת היא שאין קפיצות מליבה לליבה, וה-Turbo Boost מופעל באופן סטטי על ליבה מסוימת אחת. ניתן לראות שאין הבדל ממשי בין הגבלת התוכנה לליבה אחת (וכך המנגנון לא נדרש "לקפוץ" מליבה לליבה), לבין שימוש סטטי – המשמעות היא שהמנגנון מאוד יעיל, ולא גורם לשום השהיות נראות לעין או לפספוסים.

    יתרונה של ליבת ה-Lynnfield המשויכת לסדרת ה-Core i7 (סדרת 800) היא שמדרגת ה-Turbo Boost שהיא מציעה יכולה להיות 2 בפעולה של ארבע ליבות ועד 5 בפעולת ליבה בודדת.

    נפרדים מ-Hyper-Threading
    את טכנולוגיית ה-Hyper-Threading בחרה אינטל לבטל במעבדי ה-Core i5 ובכך ליצור בידול ממעבדי סדרת ה-Core i7 800 המבוססים גם הם על ליבת Lynnfield.

    טכנולוגיה זו אכן משפרת את יעילות העיבוד במצב של ריבוי נימים אולם כדאי לציין כי מדובר בפרופיל עיבוד מאוד ייחודי ובמרבית המקרים העלאת תדר השעון של הליבות במסגרת מנגנון ה-Turbo Boost תורמת יותר מאשר האפשרות לריבוי נימים.

    כפי שהורגלנו בעבר, בקר הזיכרון המשולב במעבד תומך בשני ערוצי זיכרון בלבד (Dual Channel) ובזיכרון DDR3 בלבד בתדר של עד 1333 מגה-הרץ. כפי שראינו במקרים דומים, זוהי מגבלה מלאכותית של אינטל ויצרניות לוחות האם מציעות בפועל דגמים התומכים בזיכרון DDR3 בקצב של עד 1600 מגה-הרץ.

    הבדל נוסף בין ליבת Lynnfield ל-Bloomfield הוא ויתור על אפיקי התקשורת מסוג QPI ששימשו כבאס מהיר בין המעבד ל-X58 IOH, וכעת אפיק התקשורת לשבב ה-P55 PCH הוא מסוג DMI.

    תכונה חדשה המוצגת לראשונה בליבת Lynnfield היא תמיכה ב-16 אפיקי PCI Express 2.0 במעבד עצמו, אפיקים הנועדו לחיבור כרטיס גרפי. את 16 האפיקים ניתן לנתב לכרטיס בודד או לזוג כרטיסים בשתי קבוצות של 8 אפיקים, על כן לוחות אם מבוססי P55 יכולים לתמוך במערך של שני כרטיסי מסך מסוג CrossFireX או SLI.

    תמיכה בשני כרטיסי מסך חזקים, כאשר כל כרטיס מקבל פיזית 16 נתיבי PCI Express, שמורה לערכות השבבים מסוג X58 בלבד, התומכות כזכור רק במעבדים לתושבת LGA1366. לוחות LGA1156 שירצו להציע תמיכה של 16 נתיבי PCI Express לשני כרטיסים יהיו חייבים להשתמש בשבב נפרד של NVIDIA, שגם יעלה את מחירם בהתאם.

    ערכת השבבים P55 (או כפי שכונתה עד כה, בשם הקוד Ibex Peak) מציגה גם היא חידוש בכך שלראשונה מציעה אינטל פיתרון של שבב בודד ולכן התואר "ערכת שבבים" (Chipset) כבר לא ממש מתאים.

    המעבר לתכנון מערכת בעלת שני שבבים מרכזיים (מעבד ושבב נוסף בודד) מפשט את תכנון לוח האם, חוסך בעלויות הייצור ובסופו של דבר מאפשר שיווק לוחות אם זולים יותר לצרכן, אם כי כפי שזה נראה כרגע, אינטל מוכרת את השבב הבודד במחיר הנמוך רק במעט ממחיר ערכת שבבים מלאה, למרות שהפונקציונליות של ה-P55 מקבילה לפונקציונליות הגשר הדרומי בלבד בערכת שבבים מלאה כמו ה-P45.

    היות ובתכנון הנוכחי נמצא בקר הזיכרון, בנוסף ל-16 אפיקי ה-PCI Express המיועדים לכרטיס המסך, על המעבד, נותרים לשבב ה-P55 PCH רק התפקידים המסורתיים של הגשר הדרומי ועל כן שונה שמו ל-PCH (ר"ת Platform Controller Hub). השבב מקושר למעבד באמצעות ערוץ תקשורת DMI (ר"ת Direct Media Interface) אשר שימש עד כה לתקשורת בין שבב הגשר הצפוני לגשר הדרומי, והוא מספק מעט יותר אפשרויות חיבור מהשבבים הקודמים, כגון ה-P45.

    העובדה ששבב ה-P55 PCH מקביל למעשה לגשר הדרומי במערכות שאנו מכירים, מובילה לכך שצריכת ההספק של שבב כזה נמוכה ולכן, לפחות בלוחות 'השפויים', יסתפקו היצרניות בגופי קירור צנועים ולא נהיה עדים למבנים מורכבים של צינורות ונחושת במערכות הקירור של הלוחות.

    תכונותיו העקריות של שבב ה-P55 Express Chipset:

    •שמונה אפיקי PCI Express 2.0 בודדים לחיבור של מגוון כרטיסי הרחבה.
    •שישה חיבורי SATA 3Gb/s לרבות תמיכה במערכי דיסקים RAID 0/1/5/10.
    •14 חיבורי USB 2.0 עם אפשרות להפעיל או לנעול פורטים בודדים לצרכי אבטחה.
    •רכיב אודיו HD.
    •חיבור רשת Ethernet 1Gbit.
    לעומת ערכות שבבים קודמות, ב-P55 נוספו שני חיבורי USB 2.0 וכן שני אפיקי PCI Express נוספים אשר מאפשרים גמישות גדולה יותר בחלוקת הפורטים לחריצי ההרחבה השונים.

    את יתרונות מנגנון ה-Turbo boost פירטנו קודם לכן, ובהמשך הכתבה התוצאות וניתוחן יוצגו לכל דכפין. בחלק זה, מלבד תיאור סטנדרטי של יכולות האוברקלוק, אנו פונים לבחון כיצד ניתן לרתום את המנגנון החדש לאוברקלוקרים שבינינו.

    ראשית נפרט בכמה מילים על תהליך האוברקלוק "המיסיונרי": הביצוע עצמו זהה ברובו ללוחות ה-X58, ולכן לא נתמקד בפרמטרים הללו הפעם.

    באופן קונקרטי למעבד ה-Core i5 750 אותו קיבלנו לצורך הביקורת, הרי שללא קושי מיוחד התקדמנו עד לתדר אפיק של 200 מגה-הרץ (לעומת 133 מגה-הרץ במקור). מחישוב קצר, בשימוש עם המכפלה הסטנדרטית, הגענו לתדר מעבד יציב של 4000 מגה-הרץ בדיוק (כאמור, לצורך ניסיון זה כיבינו כליל את מנגנון ה-Turbo Boost).

    לצערנו כל ניסיון להתקדם מעבר לערך זה נתקל בקשיי יציבות. נראה שלמרות שהשתמשנו בלוח אינטל סטנדרטי, ידו עודנה נטויה, ועיקר הקושי נבע מטמפרטורת המעבד והמתח הבלתי סביר שהוא דרש. כמו כן, יש לציין שלמרות שהמעבד שמר על יציבותו בתדר זה, הרי שהטמפרטורה הרקיעה לגבהים שאינם מומלצים לשימוש קבוע, פרט אולי להרפתקנים שביניכם, זאת למרות שהשתמשנו בגוף קירור הנחשב לחזק באופן יחסי.

    השלב הבא היה להפעיל מחדש את מנגנון ה-Turbo Boost, על מנת לבדוק את יעילותו בזמן אוברקלוק. התוצאה הייתה משביעת רצון אף היא ועמדה על תדר אפיק של 180 מגה-הרץ. בחישוב רגיל, הרי שמדובר ב-3600 מגה-הרץ בלבד, אך בפועל לכל עומס המושקע באופן אחיד על ארבעת הליבות, המכפלה קפצה ביחידה אחת אשר הובילה לתדר מעשי של 3780 מגה-הרץ, כפי שניתן לראות להלן.

    יש לציין כי ביישומים חד ליבתיים המכפלה גדלה בארבע יחידות, והניבה תדר של 4320 מגה-הרץ שהינו גבוה מהמקסימום שהשגנו בהמהרה ללא Turbo Boost.

    מתוצאות אלה עולות שתי מסקנות ברורות. האחת, אוברקלוק מיסיונרי מאפשר תדר כולל (הן של המערכת והן של המעבד) גבוה יותר. התוצאות משקפות בסך הכול, שכן ניתן בהחלט להניח שהבקר הפנימי שאחראי על מודולציית התדר לא יתפקד כראוי בתדרים גבוהים המתקרבים לקצה גבול היכולת של המעבד.

    המסקנה השנייה עוסקת בכדאיות הכללית של אוברקלוק המשאיר את ה-Turbo Boost פעיל בהשוואה לכזה שאינו. ובכן, אומנם הנושא נתון להעדפה אישית, אך אנו סבורים כי מוטב להיצמד לתדר קבוע ולהשאיר את ה'טורבו' האוטומטי לאלו אשר לא עושים זאת בעצמם. מלבד ירידת הביצועים ביישומים המיועדים לריבוי נימים, ישנה הסכנה הנובעת מהקפצת התדר של ליבה בודדת לערכים גבוהים בהרבה. אומנם המודולציה נעשית רגעית לכל ליבה, כפי שהצגנו היטב בעמודים הקודמים, אך עדיין אנו סבורים כי לשימוש קבוע הדבר אינו מומלץ.

    למעשה הפעם היחידה שבה נמליץ באופן חד משמעי על השארת מנגנון הטורבו על כנו (בעת אוברקלוק לזמן ארוך) היא בשעה שגורם אחר, כגון הלוח או הזיכרון, מגבילים את האוברקלוק. עם זאת, ספק רב שנהיה עדים למקרים אלו, שכן מרבית הלוחות ומודולי הזיכרון יספקו את הסחורה ולא יהוו פקטור מגביל.

    סייג שני מיועד לאלו אשר מעוניינים להשיג תוצאות עדיפות במבחני ביצועים קצרים כגון Super PI – דווקא במקרים מסויימים אלה, היכולת לבצע קפיצות גדולות ורגעיות בפיזור כמעט שווה לכל הליבות מסוגלת להניב תדר מקסימלי גבוה יותר בהשוואה לכיבוי ליבות ב-BIOS או דרך מערכת ההפעלה.

    כדי לקרוא אודות בדיקות הביצועים של המעבד, כנסו לכתבה במקור, שנכתבה ע"י צוות אתר hwzone.co.il .

    תגיות: ,

    הוספת תגובה
תגובה אחת לכתבה זו. הוסף תגובה
תגובה חדשה
בעת שליחת תגובתך הינך מסכים לתנאי השימוש באתר.