Пожалуй, не будет преувеличением сказать, что, начиная с появления процессоров Core 2 Duo, мы отсчитываем новую эпоху в эволюции CPU от Intel. В принципе, именно эти чипы знаменовали переход от высокочастотных и горячих NetBurst к более эффективной и производительной архитектуре.
С тех пор в индустрии произошло немало событий, в частности, де-факто окончательное закрепление Intel в роли доминирующего производителя центральных процессоров. До того момента AMD оставалась весьма конкурентоспособной со своими Athlon 64, но после появления Core 2 Duo компания начала заметно сдавать позиции. Ко всему прочему выход чипов Phenom получился запоздалым, и впечатление было смазано из-за невысокого частотного потенциала и быстродействия в целом.
Тем не менее продукция AMD продолжает оставаться достаточно популярной до сих пор преимущественно в бюджетном и среднем классах благодаря беспрецедентному демпингу. Intel же, со своей стороны, нисколько не уменьшает давления, регулярно представляя улучшенные версии архитектуры Core. Не так давно компания огласила стратегию развития своих чипов под названием «Tic-Toc», в рамках которой новые технологии выводятся на рынок в два этапа – вначале появляется продукт со значительными архитектурными инновациями, но производится он по «обкатанному» и отлаженному техпроцессу предыдущего поколения. Затем происходит второй шаг – внедрение нового техпроцесса, на который переводится зарекомендовавшая себя архитектура (иногда это может сопровождаться небольшими технологическими усовершенствованиями).
Одна плановая итерация уже успешно внедрена – за Conroe последовал Penryn, принесший преимущества 45-нанометрового техпроцесса и без того удачным Core 2 Duo. Теперь же настал черед микроархитектурных инноваций, которые содержат чипы Nehalem. Удивительно, но факт – по масштабам этих инноваций Core i7 (именно таково официальное название процессоров на новой архитектуре) практически не уступает Conroe, а уж тот, как мы помним, произвел, ни больше ни меньше, настоящую революцию.
Конечно, Nehalem все же базируется на наработках Core, в то время как первые Core 2 Duo очень сильно отличались от старых Pentium 4 (Netburst) на архитектурном уровне. И все же количество нововведений и объем проделанной работы впечатляет, в чем мы прямо сейчас и убедимся.
Новая архитектура или новая инфраструктура?
Весьма любопытно название, которое выбрали маркетологи компании для своего CPU. Мы, честно говоря, рассчитывали на нечто вроде Core 3 или обыгрывание в новой торговой марке восьми одновременно поддерживаемых потоков, однако реальность оказалась несколько неожиданной. Сами представители корпорации Intel затруднятся обосновать такое имя какими-то технологическими соображениями, поэтому можно считать, что Core i7 – плод чистого маркетинга и красивое сочетание символов.
До недавнего времени одним из самых мощных и несомненных преимуществ архитектуры Athlon 64 (а затем и Phenom) можно было назвать встроенный контроллер памяти. В процессорах AMD таковой интегрирован непосредственно в CPU, тогда как платформа Intel предусматривала его размещение в северном мосту. Разумеется, благодаря этой схеме решения AMD обладают ощутимо меньшими задержками при работе с ОЗУ. Также микросхема северного моста значительно упрощается (и в ряде случаев вообще может быть объединена с южным мостом).
В большой степени благодаря встроенному контроллеру ОЗУ чипы Athlon 64 в играх (и не только) показывали лучшие результаты, нежели Pentium 4, ну а к заслугам Core 2 Duo смело можно добавить тот факт, что они вырвались вперед, даже невзирая на отсутствие интегрированного контроллера.
Как и ожидалось, это отставание наверстано в Core i7 – процессор содержит встроенный трехканальный (!) контроллер памяти DDR3. Вовсе не обязательно использовать все три канала – падение производительности в двухканальном режиме будет не столь велико, как между одно- и двухканальным. И все же, поскольку на старте Core i7 будут востребованы в первую очередь энтузиастами, скорее всего наборы памяти из трех модулей не утратят популярности.
Полезность и преимущества следующего нововведения, которым Intel также лишь повторяет достижение AMD, не так однозначна. Дело в том, что чип Nehalem представляет собой монолитный кристалл – все четыре ядра реализованы на одной подложке, как и у Phenom. Ранее четырехъядерные процессоры Intel Core 2 Quad были, по сути, «склеены» из двух двухъядерных, что давало AMD повод говорить о том, что только они производят истинно четырехъядерные чипы. Впрочем, бонусы от такой «истинности» были далеко не очевидны, ну а если говорить о самих Phenom, то эти процессоры явно не стали лучшим продуктом для демонстрации преимуществ монокристальной компоновки. Кроме того, вскоре сами представители AMD высказались в том духе, что такой подход оказался чрезвычайно сложным в реализации, и, возможно, стоило пойти по более простому, хоть и не такому изящному пути. Тем не менее новые Core i7 в рамках 45-нанометрового техпроцесса реализуют именно монолитную четырехъядерность, несмотря на сложности и подводные камни в производстве.
Говоря об архитектурных инновациях Nehalem, нельзя не продолжить параллели с CPU AMD. Помимо интегрированного контролера памяти и четырех ядер, размещенных на одном кристалле, в Core i7 появляется общая кеш-память третьего уровня, как и в Phenom. В настольных чипах Bloomfield, которые выходят на рынок первыми, ее размер составляет 8 МБ. При этом кеш L1 остается неизменным – по 64 КБ на ядро, а вот кеш L2, в отличие от Penryn, становится выделенным. Каждое ядро получает в свое распоряжение собственные 256 КБ L2 Cache, латентность которого значительно снижена по сравнению с предшественником.
Еще одно нововведение, которое, несомненно, можно характеризовать как значительное – новая шина для соединения ключевых компонентов по схеме «точка-точка» QPI (Quick Path Interconnect). Данный интерфейс обеспечивает чрезвычайно высокую скорость передачи данных – до 12,8 ГБ/с в каждую сторону, что превосходит показатели не только предшествующей Quad Pumped Bus, но и Hyper-Transport 3.0 в новых Phenom от AMD. Основные преимущества от QPI станут очевидны при серверном применении – прямая независимая шина между несколькими процессорами в рамках одной системы должна обеспечить большой прирост производительности и снять одно из самых серьезных ограничений при проектировании подобных систем.
В рамках архитектуры Nehalem вновь реализована технология Hyper-Threading, которая уже использовалась Intel в позапрошлом поколении процессоров. Теперь возврат произошел на новом технологическом витке, и сама функция подверглась некоторой оптимизации. Новое название – SMT (Simultaneous Multi-Threading), однако суть не изменилась – речь идет о возможности одновременной обработки двух потоков на одном ядре. В случае с четырехъядерным Core i7 это дает нам 8 (восемь!) одновременно исполняемых потоков на один физический процессор. Нетрудно пересчитать эту цифру, например, для четырехпроцессорного (не самого дорогого) сервера, чтобы получить уровень параллельности вычислений, еще недавно доступный только в суперкомпьютерах и кластерах.
Одна из задач, которые были поставлены инженерам при разработке архитектуры Nehalem, – добиться модульности исполнительных блоков ядра. Теперь для разнесения процессоров по ценовым диапазонам и разграничения мобильных, настольных и серверных вычислителей будет применяться не только вариативность размера кеш-памяти, частоты самого чипа и системной шины, но и физическое изменение количества ядер, контроллеров QPI, наличие или отсутствие графического ядра (реализация этой функциональности – в ближайших планах). Таким образом, Nehalem – это универсальный конструктор, который позволит Intel максимально оптимизировать и стандартизировать процесс внедрения новой архитектуры в различных сегментах, а пользователям – получить единое ядро с нужным сочетанием функциональности и производительности в зависимости от стоящих перед ними задач.
Дальнейшее развитие получил набор инструкций SSE – Nehalem поддерживает версию 4.2, которая содержит семь новых инструкций, ориентированных на ускорение выполнения конкретных специфических задач.
Кроме того, помимо кэш-памяти первого, второго и третьего уровней, в Core i7 выросли размеры практических всех внутренних кэшей, а также появились некоторые дополнительные буферы, необходимые для снижения внутренних задержек и оптимизации архитектуры.
Изменениям подверглись и непосредственно вычислительные блоки. Так, декодерам (а их количество осталось прежним: три для сложных команд и один для простых) стало под силу выполнять больше x86 команд одновременно благодаря улучшенной версии технологии MacroFusion. Последняя, кроме того, теперь способна работать и в 64-битовом режиме, тогда как предыдущая версия MacroFusion включалась лишь при обработке 32-битового кода.
Также стал более эффективен алгоритм Loop Stream Detector, предназначенный для определения циклов небольшой длины. Теперь этот блок вынесен за пределы конвейера по декодированию инструкций и обзавелся буфером, в котором хранится 28 микроопераций.
Механизм предсказания ветвлений в архитектуре Nehalem претерпел ряд оптимизаций и должен стать точнее, ведь теперь он состоит из двух уровней. Второй из них предназначен для более глубокого анализа ветвлений и накопления их статистики, что принесет большие плоды при выполнении серверных задач.
Энергоэффективность архитектуры Nehalem продолжает оставаться приоритетным направлением для Intel. В Core i7 содержится специальный блок PCU (Power Control Unit), предназначенный для мониторинга и управления питанием процессора. По сути, PCU – это целый микроконтроллер, т. е. процессор в процессоре. На его реализацию потрачен 1 млн транзисторов. PCU, основываясь на данных сенсоров и датчиков, может полностью выключать отдельные ядра и блоки CPU. Благодаря этой функциональности инженеры Intel смогли внедрить в Core i7 технологию, которую особенно активно будут применять маркетологи в пропагандистских материалах, – Turbo Boost. Сущность ее в том, что при работе в приложениях, не (полностью) использующих многозадачные способности Nehalem, часть ядер отключается, а частота оставшихся – повышается, при этом центральный процессор в целом не выходит за рамки своего TDP. За счет этого достигается прирост производительности в неоптимизированных под многопоточность задачах. В четырехъядерных Core i7 могут быть полностью отключены два либо три ядра, и во втором случае частота оставшегося единственного ядра будет поднята еще больше. Таким образом, речь, по сути, идет о динамическом «саморазгоне» процессора, реализованном на аппаратном уровне! Любопытное явление, ранее в истории ИТ не встречавшееся, однако, судя по всему, технология будет в дальнейшем использоваться и развиваться, так что остается только привыкать к новым возможностям.
Еще одно, вероятно, самое главное для ИТ-рынка нововведение – процессорный разъем Socket LGA1366. Это автоматически означает отсутствие совместимости со старой платформой и много последствий для производителей-партнеров. На данный момент Core i7 поддерживаются только чипсетом X58, ориентированным, как и следовало ожидать, на энтузиастов и геймеров. И в то же время нужно отметить, что младший Core i7-920 с частотой 2,66 ГГц будет со старта предлагаться по цене $284! Так что из сегмента high-end чипы Nehalem смогут при необходимости быстро переместиться в класс performance-решений.
Выводы
С результатами тестирования нового процессора можно ознакомиться на соседних страницах, тут же мы поговорим о рыночных перспективах и архитектуре как таковой.
В целом, понятно, что с выпуском Core i7 Intel вроде бы устраивает для своих CPU «внутривидовую конкуренцию» – «старые» 45-нанометровые чипы Penryn пользуются огромной популярностью, угроз со стороны AMD нет и пока не предвидится. В то же время компания получает в свое распоряжение модульную, масштабируемую архитектуру, которая закроет практически все сегменты использования CPU, а это в определенном смысле заметно оптимизирует «совокупную стоимость владения» платформой для Intel.
Ясно также, что распространение нового процессорного разъема, самих чипов Nehalem и платформы в целом будет идти очень неспешно, чтобы дать возможность решениям предыдущего поколения отыграть по максимуму. В начале Core i7 будут приобретать исключительно для ПК наивысшего ценового диапазона – это либо энтузиасты, либо просто богатые люди, потребители продукции премиум-сегмента. Также эту платформу выберут те, кому нужна мощная рабочая станция, особенно с акцентом на многопоточные вычисления.
Помимо фактора стоимости, не следует недооценивать «культурный шок» от смены процессорного разъема. Событие это для любой платформы весьма нерядовое, например Socket LGA775 продержался, ни много ни мало, свыше четырех лет. Инерционность рынка в таких случаях чрезвычайно высока, особенно если речь не идет о массовом слаженном переходе, а всего лишь об осторожном выходе в high-end-класс. Тем более что в данной ситуации потребуется и новая оперативная память – DDR3, которая пока далека от желаемой стоимости, да и производительность ее не так впечатляет, как хотелось бы. Таким образом, по нашему мнению, говорить о массовости новой платформы в целом и CPU Core i7 в частности можно будет не ранее чем через год, когда появятся бюджетные представители центральных процессоров на базе Nehalem. А к тому времени конъюнктура наверняка сильно изменится.
Ну а сами процессоры, несомненно, получились чрезвычайно удачными. Двигаясь в запланированном темпе, Intel неотвратимо улучшает свое и без того отличное предложение, оставляя AMD все более узкую нишу для конкуренции.
Интересно вот что: уместно ли говорить о плагиате со стороны Intel, которая применила для Nehalem целый ряд технических решений, ранее уже воплощенных AMD для своих чипов ? По нашему мнению, это было бы не совсем корректно. Обычно инновации как в ИТ, так и, например, в конструировании автомобилей, да и любой другой отрасли «витают в воздухе» и разрабатываются ведущими игроками параллельно. В данном же случае речь не идет о каких-то уникальных и неожиданных инженерных находках; в то же время нельзя отрицать первенства AMD в их реализации. Другое дело – что еще недавно Intel критиковала некоторые решения, применяемые конкурентом, теперь же сочла возможным и необходимым применить аналогичные в своих разработках.
Как бы там ни было, технически и с точки зрения производительности Nehalem – это архитектура будущего, которая, по всей видимости, будет в дальнейшем оптимизироваться и эволюционировать, но пока без радикальных изменений. Прежде всего в ближайшее время следует ожидать увеличения количества физических ядер до 8.
Что же касается рынка, то чипы Core i7 пока также не инициируют резких перемен. Для многих вендоров это даст время подготовиться и перестроиться, например, производителям кулеров и материнских плат, ну а пользователи смогут делать свой выбор прямо сегодня, благо при необходимости вся требующаяся инфраструктура для новой платформы может быть найдена на рынке уже сейчас.
(c)ko-online.com.ua/core-2/node/39459 Eвгeний Cлoбoдянюк
- 11234 просмотра