Большое практическое сравнение. Февраль 2001
Процессор AMD Athlon 1.2ГГц против Pentium 4 и Pentium III:
Чипсет AMD-760 против Ali MAGiK 1:
DDR-память против SDRAM:
Посмотрим, что из этого вышло.
Ну вот, наконец, и настал черед долгожданного обзора, который расставит практически все точки над "Е" в противостоянии новейших процессоров и чипсетов. В надежде охватить все перспективные технологии, представленные производителями чипсетов и процессоров на текущий момент, выход обзора затянулся, зато благодаря предыдущим публикациям практически вся теоретическая информация относительно участников тестирования уже доступна. Незаслуженно обделенным в данном случае остался лишь DDR-чипсет от компании AMD - AMD-760, которому и будет отведена отдельная глава нашего повествования.
Для начала проясним основные моменты данного тестирования. Во-первых, о чем собственно обзор? Так уж
получилось, что доступность процессора Intel Pentium 4 предопределила появление на нашем сайте
достаточно большого количества информации о нем (ASUS P4T, Gigabyte 8TX,
Pentium 4) и единственным пробелом в ней остается именно полноценное сравнение с конкурентами. А вот процессорам AMD уделено значительно меньшее внимание, так что будем считать, что обзор все-таки посвящен процессору AMD Athlon 1.2 ГГц и DDR-чипсетам для него.
В тестировании принимают участие следующие процессоры: Intel Pentium 4 1.5 ГГц, Intel Pentium III 1 ГГц и два процессора AMD Athlon 1.2 ГГц, рассчитанные на 200 Мгц и 266 МГц шину- процессоры, находящиеся на вершинах своих линеек и являющиеся, с некоторой натяжкой, доступными для конечных пользователей. Справедливости ради, стоит отметить, что топ-версии процессоров от Intel сейчас намного более доступны, нежели Athlon на 1.2 ГГц, особенно на 133 МГц шину, а на момент сравнения гигагерцовых процессоров от Intel и AMD ситуация была диаметрально противоположной.
Возникает резонный вопрос о том, насколько правомерно сравнение процессоров, работающих на разных
частотах и вообще целесообразности такого подхода. На данный вопрос нет однозначного ответа, хотя,
как представляется автору, все же имеет смысл сравнивать не теоретическую производительность
процессоров на одинаковых частотах, а практические результаты, которые демонстрируют сегодняшние
флагманы рынка. Во многом этим также объясняется набор тестов, основанный только на реальных
приложениях. Совершенно бессмысленно применение синтетических тестов типа Sandra, которые
демонстрируют пиковое, несуществующее в действительности 50% превосходство DDR памяти над SDRAM,
подтверждающее возросшую в 2 раза пропускную способность памяти, и полученное благодаря "тепличным",
оторванным от реальности тестам, основанным на последовательном чтении/записи 8-блоков данных, семь
из которых выдаются за полтакта : Подробнее можно прочесть здесь. В действительности все намного прозаичнее - одной пропускной способностью памяти сыт не будешь. Постараемся объяснить ситуацию на примере весьма распространенного вопроса:
"Почему система на чипсете КТ133А при использовании процессоров Athlon c 266МГц шиной, оказывается быстрее, чем та же система при использовании процессоров со 200 МГц шиной - естественно, с памятью PC133 SDRAM?"
Казалось бы, результаты должны быть совершенно одинаковы - что 200 МГц, что 266 МГц EV-6 шина на участке "процессор-чипсет", обеспечивает куда большую пропускную способность, чем 133 МГц участок "чипсет-память" при использовании 133 МГц SDRAM. Не стоит забывать, что термин "пропускная способность" какой-либо шины относится непосредственно к данным и не в состоянии однозначно охарактеризовать производительность той или иной подсистемы. Рассмотрим упрощенный случай, который, тем не менее, позволит целиком понять суть процесса. При чтении или записи блока данных в память возникает необходимость выдачи целого ряда управляющих сигналов и собственно адреса, по которому будет произведена операция, что обуславливает определенную задержку по времени до начала того момента, пока не будет произведена операция собственно с данными. Но в случае с процессором, работающим на 200 МГц шине, все управляющие сигналы и адрес передается на частоте 100 МГц, а чипсет выполняет согласующую роль, принимая 100 МГц сигналы и преобразуя их для 133 МГц шины памяти. В результате из-за определенных временных несогласований 100 МГц шины "процессор-чипсет" и 133 МГц канал передачи данных "чипсет-память", а также задержек распространения сигналов в согласующей логике чипсета, некоторые такты пропадают впустую, что приводит к снижению эффективности взаимодействия с памятью. При этом достоинство 266 МГц EV-6 шины в сравнении со 200 МГц заключается не в большей пропускной способности, а именно в том, что адреса и управляющие сигналы выдаются на 133 МГц, что позволяет максимально эффективно взаимодействовать с 133 МГц SDRAM памятью.
Но даже в ситуации, когда все сигналы поступают в чипсет и выдаются на одной частоте - взять,
например чипсеты i815E и VIA Apollo Pro133A при работе с процессором с частотой шины 133 МГц и 133
МГц памятью - реализация взаимодействия памяти и процессора может быть совершенно различной, что
приводит к определенной разнице в производительности систем, основанных на этих чипсетах при прочих
равных условиях. Создание максимально эффективного контроллера памяти в чипсете - пожалуй, самая
сложная задача для производителей чипсетов. Одним из методов является конвейеризация потоков адресных
сигналов и данных, удачно реализованная в чипсете i850, а еще - известный со времен i440BX синхронный
способ построения контроллера памяти, при котором участки "процессор-чипсет" и
"чипсет-память" могут функционировать только на строго одинаковых частотах, зато задержки
максимально оптимизированы, и у таких чипсетов производительность достигает максимума в сравнении с
конкурентами. Скорее всего, именно желание создать чипсет с более эффективным контроллером памяти
продиктовало лишь частичную асинхронность i815E в сравнении с конкурентом VIA Apollo Pro133A, зато
производительность оказалась повыше. В довершение всего, еще один тонкий момент - кому, как не
производителю процессоров, дано досконально знать все особенности своего детища, и оперировать
минимальными задержками без боязни нанести ущерб стабильности будущей системы?
Кстати, насчет невозможности на чипсете i815 выставить частоту SDRAM 133 MHz при 100 MHz FSB
существует еще одна версия, вполне имеющая право на жизнь. Данное ограничение - всего лишь
проталкивание "новых" 133 MHz FSB процессоров Pentium III путем искусственного ограничения
производительности "старых" Pentium II/III и новейших Celeron, рассчитанных на 100 MHz FSB.
Вот почему все ждали системных плат на чипсете AMD-760 с таким нетерпением - именно этот чипсет поможет в полной мере раскрыть потенциал, который сулит взаимодействие нового процессора AMD Athlon с частотой 1.2 ГГц, рассчитанного на 266МГц шину EV-6, имеющую пропускную способность 2.1 ГБ/сек и 266 МГц PC2100 DDR-память с такой же пропускной способностью, позволяющей получить идеально сбалансированную синхронную систему. Очевидно, что именно чипсет AMD-760 будет устанавливать рубежи производительности, на которые будут равняться сторонние производители чипсетов - ALi, VIA, SiS и т.д. при производстве новых ревизий своих DDR-чипсетов и усовершенствованных драйверов для них.
И совершенно очевиден второй вывод - разница в производительности между чипсетами i815E и VIA Apollo Pro133A - это крайне малая величина по сравнению с разбросом производительности, демонстрируемой DDR-чипсетами, особенно сейчас, в момент отладки производителями чипсетов и системных плат драйверов и BIOS'ов для своих продуктов. Тем не менее, уже не приходится говорить о том, что перед нами - "сырые" продукты, показатели которых существенно изменятся в будущем - общая картина, которую мы получим в результате данного тестирования, позволит достаточно серьезно рассуждать о потенциале каждого из продуктов. Хотя представляется вполне возможным выжать еще несколько процентов прироста общей производительности - определенный потенциал еще есть.
О результатах производительности, демонстрируемых системой с процессором Pentium 4 на базе чипсета i850 такого сказать нельзя - они практически достигли максимальной отметки и вряд ли новые версии BIOS или драйвера смогут существенно изменить картину. Зато эту платформу на данный момент уже вполне можно считать законченным продуктом, не уступающим в стабильности системам на базе i815E. А вот у плат на DDR-чипсетах пока не все гладко, и состязаться с КТ133A им пока рано - но, скорее всего, через месяц-другой и они будут проходить все наши Stress тесты без всяких сбоев:
Лучше поздно, чем никогда. Коль уж поднялась тема процессора Pentium 4, то этот обзор в частности и для тех, кто ждет - не дождется обещанного два месяца назад крупномасштабного тестирования процессора Pentium 4. А автору лишь остается принести свои извинения за столь существенную задержку, обусловленную большим количеством новинок и затянувшимся отсутствием конкурентов в лице топовых версий процессоров от AMD. Но все же оба процессора Athlon разными путями добрались до нас, и готовы дать бой флагману Intel.
Процессоры отличаются друг от друга лишь частотой шины и множителем - первый, рассчитанный на частоту FSB 100МГц и множитель 12, имеет Ordering Part Number - первая строка маркировки - A1200AMS3B, а второй, рассчитанный на частоту FSB 133 МГц и множитель 9 - A1200AMS3С.
Именно последняя буква и является определяющей при решении вопроса о частоте процессорной шины. Незначительные отличие внешнего вида кристаллов обоих процессоров связаны с тем, что первый процессор уже не одни сутки проработал в тестовых стендах нашей лаборатории, а второму довелось сняться на фото, будучи абсолютно новым.
Нетрудно заметить, что мостики L1 и того, и другого процессора замкнуты, что свидетельствует о разблокированном коэффициенте умножения и косвенно подтверждает относительную редкость процессоров Athlon с частотой 1.2 ГГц. Более того, процессор Athlon на 133 шину достался нам в совершенно уникальном боксовом варианте.
И последний момент, заслуживающий внимания - позиция компании VIA по отношению к своим DDR чипсетам. Казалось бы, все предельно просто - благодаря Double-Data-Rate FSB преимущества от использования процессоров Athlon c DDR памятью гораздо более очевидны, чем в случае с Pentium III, когда узким местом, ограничивающим производительность, становится именно 133 МГц FSB шина "процессор-чипсет". И в соответствии с этим спрос на чипсет KT266 должен быть существенно выше, чем на Apollo Pro266. Но, несмотря на это, первым выходит именно Pro266, платы на котором уже доступны, а вот KT266, наоборот, задерживается. Конечно, точного объяснения такому положению вещей нет, но кое-какие предположения сделать можно.
Компании Intel и AMD заявили о количестве процессоров, проданных за 2000 год, причем результаты, представленные обеими компаниями, оказались на удивление похожими, что позволяет считать их истиной в последней инстанции. Так вот, показатели Intel превышают показатели AMD более чем в 4 раза, так что рынок для чипсета Pro266, пожалуй, все-же побольше, чем для KT266.
А вторая причина такова - все понимают, что Pentium III связан своей 133 МГц FSB по рукам и ногам, и никто не ждет революционного прироста производительности в DDR системах, основанных на этом процессоре. Это скорее имиджевый продукт, подогревающий интерес к VIA и являющийся одной из ступенек на нелегком пути к завоеванию титула "Производитель чипсетов N1". Да и сравнивать особо не с чем - получается, что и с имеющейся производительностью это самый быстрый и функциональный чипсет под процессоры для Socket-370. C KT266 такой номер не пройдет - чипсет должен обеспечивать производительность на уровне AMD-760, и шлифовка контроллеров процессорной шины и памяти идет полным ходом.
Поэтому, не остается ничего другого, как перейти к подробному рассмотрению чипсета AMD-760.
Чипсет AMD-760
Компания AMD не стремится зарабатывать деньги на своих чипсетах и в большей степени рассчитывает на своих партнеров, в первую очередь - VIA. Для AMD новый чипсет - лишь обкатка новых технологий и, при необходимости, резервный вариант в случае задержек появления чипсетов от сторонних компаний. Этот факт заодно подтверждается крайне прохладным отношением компании к разработке и внедрению новых технологий при производстве южных мостов - как правило, при использовании чипсетов от AMD, в паре с северным мостом производители системных плат почти всегда предпочитают применение более функциональных южных мостов от VIA. Так было с AMD-750, тоже самое наблюдается и сейчас с чипсетом AMD-760, о котором идет речь.
Итак, разработка банальных южных мостов, которые научились делать все, кому не лень, отошла на второй план, и ничего не мешает инженерам-творцам из AMD предаться полировке оправы для своего бриллианта по имени "Athlon" - северного моста AMD-761.
Прежде чем продолжить, вспомним одну поучительную историю:
"Процессор с ядром К7 и с именем Athlon дебютировал на рынке в августе 1999 года с частотами 500, 550 и 600 мегагерц, а к марту 2000 года безумная гонка вооружений подняла частоту главного оплота AMD в битве за мировое господство до заветного 1 гигагерца. Однако, после триумфального 700 мегагерцового процессора, чей 512 килобайтный кэш второго уровня работал на максимальной для Athlon частоте в 350 мегагерц, каждый следующий новый Athlon с повышенной на 50 мегагерц частотой давал все меньший прирост по производительности и становился все большим разочарованием.
В чем же причина, спросите Вы? Все просто - частота процессора росла, штурмовались все новые десятки мегагерц, поменялся техпроцесс и даже изменилось кодовое название ядра - изготовленное по .18 микрон техпроцессу ядро получило имя К75, но: Оказалось, что никто и не думает соблюдать традиции первых Athlon, кэш L2 которых работал на 1/2 частоты ядра. Да и невозможно было этого сделать - микросхемы кэш-памяти, стабильно работающие на частоте более 350 мегагерц, найти практически невозможно. Вот так и стал процессор Athlon 700 тем последним из собратьев, чей делитель кэша был равен двум. Дальше - хуже. Сначала появились полувялые 750, 800 и 850 мегагерцовые процессоры с делителем 2/5 и частотами кэша от 300 до 340 МГц. Потом и вовсе колоссы на глиняных ногах - 900, 950 и гигагерцовый монстры несли на своей плате "тормоза" в лице кэша, работающего на 1/3 частоты ядра, что составляло всего от 300 до 333 МГц..."
В данном случае, пусть и не столь ярко, нарисовалось продолжение данной истории - разница в частоте памяти и частоте процессора, например для 1.2 ГГц Athlon и PC133 SDRAM, достигла ужасающей величины - 9 раз. Проще говоря, проблема неспособности своевременного снабжения процессора данными плавно перетекла с кэша процессора на системную память. Причем из авторитетных изданий это заметили только коллеги с AnandTech, но тему решили не развивать. Так вот, разница в девять раз - много это или мало?
Конечно, если бы не иерархическая организация памяти, то такая разница была бы не просто большой, а фатальной для процессора, но, несомненно, частично спасает ситуацию бастион в лице L1 и L2 кэшей. Если уж быть совсем точным, сравнение частоты памяти и частоты процессора неправомерно - на самом деле, это разница именно в частоте памяти и частоте кэша L2 процессора, которая составляет те же 9 раз.
При выполнении кода промахи в кэш команд составляют порядка 10 процентов с использованием самых совершенных алгоритмов предсказания ветвлений. При операциях с данными, когда их объемы в современных приложениях растут в геометрической прогрессии, промахи в кэш данных - собственно L2 кэш, разогнавшийся до космических 1.2 ГГц - могут достигать 20-40 процентов!!! Надо ли
говорить, что извлечение данных будет происходить уже из памяти, работающей на частоте 133 МГц и
имеющей пропускную способность в жалкий гигабайт в секунду. Проще говоря, с увеличением частоты
процессора и, соответственно, частоты L2-кэша, рост производительности будет все сильнее
лимитироваться медленной системной памятью. При этом, чем меньше объем L2 кэша, тем бОльшее значение
для производительности приобретает скорость основного ОЗУ. Именно поэтому Duron и Celeron выиграют от
повышения частоты SDRAM или переходе на DDR-память несколько больше, чем, к примеру, Athlon и
Pentium III. Кэш выздоровел, пора лечить память!
Идеальным вариантом, является, конечно же, увеличение тактовой частоты SDRAM, при котором адекватное уменьшение временных задержек распространяется на все сигналы - и управляющие, и адресные, и, собственно, данные. Но сколько это будет стоить? Значительно дешевле при минимальных переделках и сохранении базовой частоты уплотнить в 2 раза только данные, и получить определенный прирост производительности при минимальной разнице в цене. Данная временная мера позволит процессорам еще некоторое время наращивать частоты, не испытывая серьезных проблем со своевременными поставками данных для L2-кэша. Пока постарались отделаться малой кровью, а серьезные переделки с увеличением базовых частот памяти перенесены на определенное время - время DDR II. Но малой кровью не получилось - цена на DDR память ужасающе велика - но это другая история:
Итак, производители чипсетов под знаменем AMD ринулись спасать положение - в ход пошел новый тип памяти - DDR SDRAM и чипсеты под них. Intel спасает Pentium 4, развивший еще более огромные частоты, по своему - 400 МГц двухканальным RDRAM, у которого тоже хватает своих проблем (с латентностью), но тоже заинтересованно поглядывает в сторону DDR.
Несомненно, ни о каком революционном сокращении разрыва в случае применения DDR-памяти говорить не приходится - но эволюция налицо, пропасть уже не столь велика, и тенденция намечена.
Ура - лекарство найдено и одобрено. Осталось лишь подождать, пока оно станет доступно массовому покупателю и посмотреть, насколько хорошо оно помогает.
С теоретической точки зрения ответ однозначен - память PC133 SDRAM постепенно будет становиться уделом систем для нижнего сегмента рынка, а мы вместе с AMD говорим "ДА" новой технологии. Ждем падения цен на DDR-память - тайваньские производители памяти уже объявили о начале массового производства микросхем DDR памяти, и лед вот-вот тронется. А мы возвращаемся к рассмотрению чипсета AMD-760.
Итак, чипсет AMD-760 состоит из северного моста AMD-761 System Controller, в 569-пин корпусе PBGA и южного моста AMD-766 Peripheral Bus Controller в 272-пин корпусе PBGA.
Северный мост AMD-761 состоит из контроллера системной шины процессора Athlon, контроллера памяти,
контроллера AGP и PCI. Начать стоит с памяти - северный мост поддерживает до 2-х гигабайт как PC1600,
так и PC2100 DDR-памяти в случае использования обычной DDR SDRAM, и до 4-х гигабайт при применении
Registered DDR модулей памяти. При этом объяснение данному факту весьма банально - для обычной
PC1600 и PC2100 DDR-памяти северный мост поддерживает только два слота, именно этим и объясняется
такое их количество для плат на AMD-760, принявших участие в тестировании. Ну а Registered DDR память
можно устанавливать в четыре слота, что при максимально емких модулях и дает 4 гигбайта. Не забыта и
поддержка ECC - рынок High-End систем, требующих максимальной производительности и надежности, и
приносящий максимальные дивиденды, не дает покоя компании AMD. Уже и до прекрасного (760MP) подать
рукой:
Но чего бы стоила поддержка PC2100 DDR-памяти при повсеместно распространенной 200 МГц системной шине EV-6 ? Не надо быть гением, чтобы учесть и это - чипсет, наряду со 200 МГц FSB поддерживает и 266 МГц системную шину, процессоры для которой начинаются с частоты 1 ГГц. При этом чипсет допускает исключительно синхронное взаимодействие памяти и процессора - с процессором, имеющим 200 МГц шину, возможно использование памяти только как PC1600, даже если она PC2100, а имея память PC1600, не получится заставить работать процессор на 266 МГц шине. И если платы с возможностью смены множителя для процессоров Athlon не редкость, и установив меньший множитель, не трудно заставить процессор работать на той же частоте, что и раньше, но с 266 МГц шиной, то покупка PC1600 DDR-памяти, не способной работать на 266 МГц, камнем потянет производительность всей системы на дно: Вряд ли создание асинхронного чипсета под DDR-память для инженеров AMD- столь непреодолимая задача, как считают многие. Скорее, дело в другом - задержки на синхронизацию сигналов и неизбежное влияние любой 200 МГц шины на производительность магистрали "процессор-память" столь велики, что применение на любом из двух участков 266 МГц шины не дает никакого прироста относительно 200 МГц синхронного режима, и, как результат, от асинхронных режимов решено отказаться.
Еще один довод в пользу синхронности чипсета - технология Super Bypass, смысл которой состоит в том, что чипсет вообще не конвейеризует некоторые виды взаимодействий памяти и процессора, становясь абсолютно прозрачным для сигналов и не вносящим никаких задержек в их распространение. Естественно, применение Super Bypass возможно только при синхронной работе шин процессора и памяти - кстати, она применялась и на AMD-750.
И последний штрих - в отличие от других DDR-чипсетов, например, Ali MAGiK 1 или VIA Apollo Pro266, AMD-760 поддерживает только DDR память.
Северный мост AMD-761 удался на славу и полностью лишен недостатков своего предшественника - северного моста AMD-751. Контроллер системной шины обрел поддержку 266 МГц шины, контроллер памяти
работает с DDR-памятью на частотах 200 MHz (PC1600) или 266 MHz (PC2100), и, наконец, последнее, чего так не хватало северному мосту предыдущего чипсета AMD-750 - поддержки AGP 4x, теперь присутствует. Единственный недостаток заключается в следующем - инженеры AMD решили не разрабатывать высокоскоростную шину передачи данных между мостами и ограничились обычной PCI шиной, что на данный момент выглядит анахронизмом.
Очень может быть, что PCI шина c пропускной способностью в 133 МБ/сек вполне справится с нагрузкой, которую способен обеспечить южный мост AMD-766, о котором пойдет речь ниже, и даже с нагрузкой более функционального VIA 686B - последнего южного моста от VIA, взаимодействующего с северными посредством PCI шины. Но вот южные мосты нового семейства от VIA, которые компания поставляет со своими DDR чипсетами и обладающие множеством новых и полезных нововведений, в паре с AMD-761 работать уже не смогут - они рассчитаны на шину V-Link - фирменную разработку от VIA, обеспечивающую вдвое большую пропускную способность - 266 МБ/сек, чем PCI. Так что пределом мечтаний покупателя платы на чипсете AMD оказывается южный мост 686B - достаточно современный, поддерживающий ATA-100 продукт, но не располагающий, например, шестиканальным AC'97 звуком, или поддержкой нового слота ACR.
Будем надеяться, что в следующем чипсете от AMD мосты будут соединены посредством революционной LDT шины, которая позволит встраивать в южный мост и USB 2.0, и Serial ATA без боязни стать узким местом. Тем более что в Crush от Nvidia уже планируется ее использование.
Но так ли уж плох AMD-766, что его стоит непременно сменить на 686B? Посмотрим внимательнее - да нет, в целом все в порядке.
В наличии и самый современный на сегодняшний день ATA-100 контроллер, и поддержка 4 USB портов. А не хватает поддержки каких бы то ни было райзеров, что, впрочем, абсолютно неважно ввиду отсутствия карт для них, AC'97 звука, который жрет ресурсы процессора и используется только самыми непритязательными пользователями, и аппаратного мониторинга, реализация которого требует дополнительной микросхемы. Здоровый минимализм, но все вполне на уровне, и только большие объемы производства, а, следовательно, и меньшая цена, склоняют производителей использовать изделия VIA. Такое положение вещей вполне устраивает обоих партнеров, и, скорее всего, все кончится тем, что AMD будет производить только северные мосты AMD-761, а платы с южными мостами от AMD будут музейной редкостью - сродни коллекционным изделиям типа "Black Pearl" от ASUS или "Sweet Kiss" от AOpen.
И напоследок - сравнительная таблица протестированных DDR чипсетов:
ALI MAGIK 1 Северный мост | AMD-760 Северный мост | VIA Apollo Pro266 Северный мост |
M1647 Super North Bridge 528-pin 35x35mm BGA | AMD-761 North Bridge 569-pin BGA | VT8633 North Bridge 552-pin BGA |
Поддержка процессоров AMD Athlon и AMD Duron | Поддержка процессоров AMD Athlon и AMD Duron | Поддержка процессоров Intel Pentium III, Intel Celeron и VIA Cyrix III |
Поддержка FSB 200/266 МГц EV-6 DDR | Поддержка FSB 200/266 МГц EV-6 DDR | Поддержка FSB 66/100/133 МГц |
Поддерживаемая память: до 3 ГБ PC1600/PC2100 DDR SDRAM, 66/100/133 МГц SDRAM | Поддерживаемая память: до 4 ГБ PC1600/PC2100 DDR SDRAM | Поддерживаемая память: до 2 ГБ PC1600/PC2100 DDR SDRAM, 66/100/133 МГц SDRAM и VCM SDRAM |
Поддержка режима AGP 4x | Поддержка режима AGP 4x | Поддержка режима AGP 4x |
Нет поддержки двухпроцессорных конфигураций | Поддержка двухпроцессорных конфигураций в AMD-760 MP | Поддержка двухпроцессорных конфигураций |
Связь между мостами - шина PCI с пропускной способностью 133 МБ/сек | Связь между мостами - шина PCI с пропускной способностью 133 МБ/сек | Связь между мостами - шина VIA V-Link с пропускной способностью 266 МБ/сек |
|
ALI MAGIK 1 Южный мост | AMD-760 Южный мост | VIA Apollo Pro266 Южный мост |
M1535D+ 352-pin (27mmx27mm) BGA | AMD-766 South Bridge 272-pin BGA | VT8233 South Bridge 376-pin BGA |
Поддержка ATA 33/66/100 | Поддержка ATA 33/66/100 | Поддержка ATA 33/66/100 |
Поддержка 6 USB портов | Поддержка 4 USB портов | Поддержка 6 USB портов |
Нет встроенного сетевого контроллера | Нет встроенного сетевого контроллера | Встроенный контроллер 10/100 BaseT Ethernet и 1/10 Home PNA |
Поддержка AC'97 звука/модема | Нет поддержки AC'97 звука/модема | Поддержка 6 канального AC'97 звука и модема |
Поддержка AMR (Audio/Modem Riser) слота | Нет поддержки Riser-слотов | Поддержка ACR (Advanced Communications Riser) слота |
Встроенный контроллер портов ввода/вывода | Встроенный контроллер портов ввода/вывода | Встроенный контроллер портов ввода/вывода |
Встроенный аппаратный мониторинг | Нет аппаратного мониторинга | Встроенный аппаратный мониторинг |
В нашей лаборатории побывали сразу две платы на чипсете AMD-760 и обе используют связку, ставшую стандартом "де-факто" - AMD-761 + VIA 686B. Конечно же, это - ASUS A7M266 и Gigabyte 7DX.
Платы
Посмотрим на спецификации плат, а потом рассмотрим их основные особенности.
Плата | ASUS A7M266 | Gigabyte 7DX |
Процессор | Поддерживаются Socket462 процессоры AMD Athlon и AMD Duron с частотой шины 200/266 МГц |
Чипсет | Северный мост AMD 761, южный мост VIA 686B |
Системная память | Два 184-контактных разъема DIMM, поддерживающих PC2100/DDR266 и PC1600/DDR200 модули памяти Максимальный объем поддерживаемой памяти - 2 ГБ Поддержка ECC |
AGP | Слот AGP Pro с поддержкой режима 4x | Слот AGP с поддержкой режима 4x |
Слоты расширения | 5 32-битных слотов PCI 2.2 1 слот AMR (Audio Modem Riser) |
Порты ввода-вывода | Один порт для FDD, два последовательных и один параллельный порты, порты для PS/2 мыши и клавиатуры, один игровой порт Два встроенных порта USB и два дополнительных порта USB |
IDE контроллер | 2 канала IDE, поддерживающие протоколы ATA/33/66/100 (с поддержкой до 4 ATAPI-устройств) |
BIOS | 2-х мегабитный Flash EEPROM Award BIOS с поддержкой Enhanced ACPI, DMI, Green, PnP Features и Trend Chip Away Virus |
Звуковой контроллер | CMI 8738-PCI-X, поддержка схемы 4.1 | Creative CT5880 |
Размер | ATX форм-фактор, 30,5x24 см | ATX форм-фактор, 30.5x23.2 см |
Разное | STR (Suspend to RAM) Аппаратный мониторинг Пробуждение от модема, мыши, клавиатуры, сети, таймера и USB |
Комплектация сэмпла системной платы от ASUS заслуживает уважения - в стандартную красную коробку с надписью "Motherboard Manufacturer N1" педантично уложен полный комплект, предусмотренный для серийной платы. Посмотрим, что в него входит - собственно системная плата ASUS A7M266, планка с двумя дополнительными USB портами и шлейфы USB, FDD, 40-жильный и 80-жильный IDE. Принадлежность платы к предсерийным экземплярам выдает лишь отсутствие руководство пользователя и компакт-диск, представляющий собой обычную CD-R болванку.
Вообще применительно к платам на чипсетах с поддержкой DDR памяти прослеживается весьма интересная тенденция. Очевидно,
что производители системных плат пока не в состоянии даже приблизить цену плат на DDR чипсетах к цене плат, основанных, например, на KT133A. И как следствие, стремятся компенсировать дороговизну плат, предельно расширяя их возможности за счет применения копеечных дополнительных контроллеров для реализации внешних IDE RAID, более-менее полноценного звука и т.д.
Посмотрим, чем же оснастил свою плату ASUS для привлечения внимания покупателей. На ней есть полноценный 4.1 звук от C3D на микросхеме CMI8738 - это решение позволит на несколько процентов повысить производительность системы относительно встроенного AC'97 кодека при использовании приложений с использованием аудиоконтроллера. Есть место под сетевой контроллер от компании 3Com 3С920 - и он определенно появится в следующих ревизиях этой платы - возможно и с другим названием платы. Обычно ASUS в таком случае добавляет буковку "L" к названию.
Есть слот AGP Pro, позволяющий использовать видеокарты с повышенным потреблением мощности. Радиатор чипсета теперь не просто радиатор, а полноценная охлаждающая система с функцией отвода нагретого воздуха, чему мы обязаны установкой на этот радиатор вентилятора, хотя нам показалось что это было излишеством - не так сильно грелась микросхема, чтобы ее охлаждать такими методами.
К сожалению, пока нет возможности менять коэффициент умножения, а мы помним, что хоть он и заблокирован на процессорах фирмы AMD, но это ограничение легко обходится с помощью нехитрой операции с использованием обычного графитового карандаша или заточенного кусочка припоя. То есть место-то под переключатели есть, но видимо они появятся в ближайшем будущем - а пока даже впаивание своего DIP переключателя на место не дало нам никакого эффекта.
Вообще на плате на данный момент находятся четыре блока переключателей - один отвечает за частоты FSB, второй за напряжение на ядре процессора, третий за напряжение на памяти, и четвертый за напряжение на чипсете. Первые два из них, как принято у Asustek, дублируется в BIOS, который основан на Award Medallion BIOS v.6.0. В нем также можно тонко настроить функционирование памяти, назначить прерывания слотам PCI и настроить режимы работы AGP - в остальном это уже ставший привычным BIOS от Asustek, имеющий как всегда достаточно много настроек системы. Достаточно интересно выполнено решение по изменению частот FSB - в BIOS можно задавать частоту от 100 до 180 МГц, но сделано это не очень удобно - частоту можно либо прибавлять, либо уменьшать на 1МГц путем выбора соответствующего пункта в меню, соответственно для того чтобы задать частоту больше, допустим, на 10 МГц, придется проделать это действие 10 раз.
Компания Gigabyte тоже держит марку - фирменная коробка, системная плата Gigabyte 7DX, упаковка со шлейфами FDD, 40-жильный и 80-жильный IDE, и даже фирменный диск. Не хватает лишь руководства пользователя, хотя вполне можно обойтись и без него.
Gigabyte встроила в свою плату альтернативное дешевое звуковое решение на основе микросхемы CT5880 от компании Creative, которое также, как и решение от C-Media позволяет подключать пятиколоночные аудиосистемы. Плата также оснащена кулером для чипсета, хотя, если отсоединить радиатор, видно, что он приклеен на прозрачную липучку, теплопроводящие свойства которой вызывают серьезные сомнения. Кстати, у ASUS такая же.
На слот AGP установлена защелка для карт, что иногда бывает удобным - в некоторых дешевых корпусах платы упорно пытаются выскочить из слота. Впрочем, как кажется, для человека сделавшего покупку достаточно дорогой материнской платы, не составит труда найти несколько десятков долларов для покупки и качественного корпуса.
Интересно выполнена функция Suspend to RAM - практически у всех производителей материнских плат она реализуется через BIOS Setup, где в соответствующем разделе меню можно выбрать эту функцию - Gigabyte же, видимо решив что это функция составит некие сложности пользователям реализовал ее через джампер на материнской плате, снабдив подробнейшим описанием того как, что и когда делать в описании к материнской плате. Еще одной интересной особенностью материнской платы Gigabyte 7DX является то, каким образом реализована поддержка unbuffered, либо registered модулей памяти - и опять все сделано посредством переключателя на материнской плате, что в принципе может быть затруднительно для человека, далекого от таких вещей. Похоже что мы снова возвращаемся в то время, когда на материнских платах была масса переключателей, от которых у обычного пользователя в виду их обилия опускались руки:), что несколько расходится с общей тенденцией отказа от каких бы то ни было переключателей.
На материнской плате присутствует блок DIP-переключателей, ответственных за выставление частот FSB - набор состоит из частот 95,100.7,100.9,103,105,110,115,133 МГц, причем эта функция не дублируется в BIOS, и настройка частоты может быть выполнена либо джамперами, либо с помощью фирменной утилиты от Gigabyte - EasyTune III. Зато в BIOS можно найти настройки памяти, и они даже богаче чем у платы A7M266 от ASUS, но это лишь намного компенсирует минусы отсутствия многих вещей на плате.
У Gigabyte 7DX нельзя менять напряжение подаваемое на чипсет и на память, а также отсутствует (как впрочем и у платы Asus) возможность задавать коэффициенты умножения - но если у платы ASUS эта возможность думается появится - то здесь не видно путей ее решения, единственно возможным кажется новый BIOS, в который встроят эти функции - но появится ли он когда-нибудь, или нет - судить сложно, особенно зная нелюбовь Gigabyte к всяческим разгонам. В общем, плата выглядит как решение для человека, один раз купившего компьютер и решившего больше ничего в нем не менять, в качестве решения для компьютерного энтузиаста Gigabyte 7DX выглядит малопригодной.
Производительность
Итак, после набившей оскомину теории самое время посмотреть, на что способны наши претенденты на практике. Кстати, мы забыли представить некоторых из них.
В тестировании принимают участие:
Процессор Intel Pentium 4, в распоряжении которого всего одна платформа - на чипсете i850 и, как следствие, с RDRAM памятью.
Процессор Intel Pentium III, в распоряжении которого две платформы - на чипсете i815EP с памятью SDRAM и на чипсете VIA Apollo Pro266 c DDR SDRAM.
Процессор AMD Athlon, в распоряжении которого четыре платформы - на чипсете VIA KT133A с памятью SDRAM, на чипсете AMD-760 c DDR SDRAM, на чипсете Ali Magik 1 c SDRAM и на чипсете ALi Magik 1 c DDR SDRAM.
Две последние платформы представлены в лице одной системной платы, располагающей как слотами для SDRAM, так и для DDR памяти.
Обе платы на чипсете AMD-760, рассмотренные в предыдущей главе, продемонстрировали завидную идентичность показанных результатов, поэтому на диаграммах их результаты представлены от имени чипсета.
Для уменьшения влияния видеоподсистемы на результаты, демонстрируемые конкурентами, в тестах применяется современный видеоадаптер на базе GPU GeForce2 Pro, с 64 мегабайтами 400 МГц DDR памяти, но это - временное явление. В самое ближайшее время - сразу после объявления - планируется ввести в строй стенды, основанные на GPU GeForce3 (NV20).
Все тестовые системы оснащены 256 мегабайтами памяти, что достаточно существенно разгружает дисковую подсистему и минимизирует ее влияние на производительность платформы в целом. Данное нововведение наиболее существенно отражается на офисных приложениях, что позволяет в них получить прирост производительности порядка 5-8 процентов. Таким образом, не стоит сравнивать результаты, полученные на офисных приложениях в ходе этого тестирования с предыдущими тестированиями, в которых использовалось 128 мегабайт памяти.
Все системные платы с DDR чипсетами, принимавшие участие в данном тесте, не являются серийными образцами, в следствие чего данное тестирование не ставило задачей выявление стабильности используемых платформ. Неожиданностью оказалось другое - для некоторых систем даже прохождение офисных или игровых бенчмарков становилось существенной проблемой. С выходом новых ревизий плат и новых версий BIOS эти проблемы будут решены, и можно будет окончательно вернуться к вопросу стабильности. При этом надо заметить, что на системных платах на базе чипсета AMD-760 сбои в работе происходили не только при частоте шины 266 МГц, но и при 200 Мгц с примерно равной периодичностью. Можно сделать вывод о том, что проблемы с частотой шины 266 МГц в чипсете AMD-760 успешно решены, и вся вина ложится на производителей системных плат. Но не будем судить строго - образцы плат на AMD-760 получены нами еще в прошлом году, так что, вероятнее всего, проблемы уже решены и серийные образцы плат не уступят в стабильности работы всем остальным платформам.
И, наконец, разочаруем фанатов Intel, которые спешат закричать, что все дело в процессоре - система на КТ133A продемонстрировала великолепную стабильность, причем как с 200 МГц, так и с 266 МГц версиями процессора AMD Athlon 1.2 ГГц.
При оценке производительности использовалось следующее оборудование:
- Процессоры:
- Intel Pentium III Coppermine 1000 МГц, шина 133 МГц, Socket-370
- Intel Pentium 4 1500 МГц, шина 400 МГц, Socket-423
- AMD Athlon Thunderbird 1200 МГц, шина 200 МГц, Socket-462
- AMD Athlon Thunderbird 1200 МГц, шина 266 МГц, Socket-462
- Материнские платы:
- ASUS CUSL2-C на чипсете i815EP
- Chaintech 6VJD на чипсете Apollo Pro266
- ASUS P4T на чипсете i850
- Soltek 75KAV-X на чипсете VIA KT133A
- ASUS A7A266 на чипсете ALi Magik 1
- ASUS A7M266 на чипсете AMD-760
- Gigabyte 7DX на чипсете AMD-760
- Память:
- Samsung Original PC2100 CAS2.5 2x128Mb DDR SDRAM
- Buffalo PC800 ECC 2x128Mb RDRAM
- Samsung Original PC133 CAS2 2x128Mb SDRAM
- Жесткие диски: IBM Deskstar 75GXP 45Gb 7200RPM Ultra ATA/100
- Видеокарта: ASUS V7700 Pro 64Mb на базе GeForce2 Pro (Core:200MHz; Mem:200MHz DDR)
И программное обеспечение:
- Windows ME final release build 3000
- NVIDIA Detonator 3 v.6.67
Офисные приложения:
- BapCo & Mad Onion SysMark 2000 Internet Content Creation v1.0 patch 5
- BapCo & Mad Onion SysMark 2000 Office Productivity v1.0 patch 5
- Ziff-Davis Media Business Winstone 2000 v1.0
- Ziff-Davis Media Content Creation Winstone 2000 v1.0
Профессиональные приложения:
- SPECviewperf v6.1.2 (OpenGL performance)
- 3DStudio MAX R3.1
Игры:
- idSoftware Quake III Arena v1.17 (OpenGL performance)
- Unreal Tournament v4.36 (Direct3D performance)
- Rage Expendable Demo (Direct 3D performance)
Постараемся вкратце пояснить, что влияет на прирост производительности в игровых приложениях. Тем более, что автору надоело писать, как большинство аналитиков в сети, что причиной всего является "большая нагрузка на шину памяти", а значит если мы используем DDR SDRAM, то нагрузка автоматически снизится. Автор предлагает собственное видение физики процесса
(разумеется, мнение не претендует на истину в последней инстанции и комментарии специалистов приветствуются).
Сразу заметим, что вообще говоря доказывать что-либо на экспериментах с играми, движки которых неясно как устроены (да и с устройством драйверов нет ясности) - весьма сложная задача. Даже неблагодарная. Но из общих соображений понятно, что
переход на использование DDR памяти для игр несомненное благо. Соображения простые: многопроходность и многотекстурность для различных световых эффектов и тумана, всевозможные тени и блики, много-много больших текстур, которые надо мгновенно подгружать. Все это будет реализовываться быстрее при использовании DDR памяти, т.к. на стадии CPU
stage мощный процессор будет меньше простаивать в ожидании памяти, что происходит в случае SDR SDRAM. Меньше простоев CPU означает большую производительность.
Визуализация сцены в упрощенном виде требует передачи огромного объема данных из системной памяти -
текстур и координат всех вершин, использующихся на уровне (задействуются шины "память-чипсет" и
"процессор-чипсет"), конечно, при условии, если не используется HW T&L с данными в
локальной видеопамяти.
Сопроцессор CPU рассчитывает освещенность каждой вершины (lightning), При этом существенную роль играет оптимизация драйверов и приложения под наборы инструкций 3DNow! и SSE, по сути являющихся расширителями возможностей сопроцессора. Начнем с Quake 3, как широко применяемоего игрового бенчмарка. Хотя Quake 3 плохой пример, т.к. он не делает освещение и single-skin через HW T&L, поэтому даже на GeForce 256 получается 100-120 fps в 1280х1024, в то время как в Q2 получается около 300 fps, но,
других, более приемлемых и распространенных для использования в качестве теста OpenGL игр у нас нет.
В связи с тем, что движок Quake 3 поддерживает аппаратную трансформацию (transformation) координат вершин в пространство наблюдателя с помощью встроенного в чип GeForce2 геометрического сопроцессора, полученные от CPU данные передаются в GPU (задействуются шины "процессор-чипсет" и "чипсет-AGP"). Здесь осуществляется преобразование координат вершин (перемножение векторов, т.к. GeForce не умеет перемножать матрицы, а
перемножение вектора на матрицу у него занимает 4 операции) и окончательные этапы geometry stage - отсечение вершин (clipping), не попадающих в кадр и проецирование в систему координат экрана. Все, что происходит дальше, интересует нас в меньшей степени.
В игровых приложениях Unreal Tournament и Rage Expendable, использующих API Direct3D 6.0, ситуация
несколько иная, главным образом потому, что ни одна из функций geometry stage не имеет аппаратной поддержки в движках этих игр и все этапы выполняет центральный процессор, оказываясь загруженным в большей степени (~40-50% на сложных сценах в 30 тыс. треугольников).
Отметим, что использование D3D не приводит к невозможности использовать HW T&L (начиная с DX7 в D3D есть поддержка HW T&L), а для UT вообще готовится к выходу патч для работы на D3D8 с использованием не только HW T&L, но и vertex/pixel shader'ов.
С другой стороны, последовательность выполнения операций geometry stage (TCL) остается неизменной, и данные передаются по шинам аналогично, с той лишь разницей, что в данном случае объем данных, передаваемый в видеоадаптер, будет существенно ниже. Заметим, что при использовании HW T&L можно положить все данные в
локальную видеопамять и после этого ничего через AGP передаваться не будет.
Мы протестировали Quake3 с использованием demo001 во всех разрешениях от 640 до 1280 с разными настройками и глубиной цвета 16 и 32 бит - в основном для демонстрации того, при переходе с какого режима на какой наблюдается существенное снижение производительности. Тестирование UT осуществлялось в режиме 1024x768x32 c использованием Reverend's Thunder.dem и UTBench.dem. Первое демо достаточно простое и представляет собой сражение двух соперников, редко покидающих одну круглую комнату несложной архитектуры, а второе весьма похоже на Quake3 demo001. Тестирование Expendable проводилось в двух режимах - 640х480х16 и 1024х768х32 с использованием встроенного Timedemo.
Итак, начнем с Quake3. Основные потребности этой игры - высокая пропускная способность магистрали
"процессор-память" и мощные вычислительные ресурсы для чисел с плавающей точкой на стадии
CPU stage. Например, Quake 3 весьма активно использует CPU для различных схем culling. Кроме того в
Quake 3 используются большие объемы текстур, так что и шина видео памяти нагружается весьма активно.
Набор SSE команд процессоров Intel более разнообразен, чем 3DNow! от AMD, но для операций, применяемых
в Quake 3 вполне достаточно и 3DNow!. Оба набора имеют сравнимую производительность при обработке
массивов данных (вершин) достаточно больших размеров. Беда в отсутствии нормальных компиляторов.
Разработчики не хотят возиться с оптимизацией на ассемблере из-за огромного объема работ.
Теоретически поддержка SIMD инструкций должна выполняться автоматически в компиляторах (наиболее
распространен Microsoft Visual C) и целочисленные операции выполняться на MMX, плавающие (32бит
точности) на SSE/3DNow!. При этом, выигрыш в производительности будет достигнут в любых приложениях,
а не только в MultiMedia и игровых программах. Тем не менее, Microsoft лень реализовать автоматическое
выполнение SIMD инструкций. AMD и Intel не конкурируют за улучшение компилятора Visual C++ под свой
процессор. У Intel есть свой компилятор ICL с поддержкой векторизацией вычислений (группировка
операций над однотипными данными (вершинами) для исполнения на SSE/SSE2). Векторизация производиться
только на простых операциях и при специальной организации данных.
Наверно поэтому, г-н Кармак выбрал (из двух зол) более удобный набор SSE (в свое время он не сумел
воспользоваться возможностями MMX - дающий рендеринг с качеством аппаратного, хотя работающий быстро
только в низких разрешениях). В результате поддержка SSE реализована в Quake 3 существенно лучше, а
OpenGL драйвер от NVIDIA оптимизирован и под то, и под другое (включая и сам движок Quake3).
В итоге получаем, что легендарная производительность сопроцессора от AMD нивелируется. В битву
вступают наборы SIMD-инструкций, шины с высокой пропускной способностью и собственно тактовые
частоты процессоров.
Здесь Pentium 4 выглядит фаворитом - у него есть все перечисленное и он без труда обходит конкурентов. За счет SSE выезжает и Pentium III - если бы не разница в 200 МГц с процессором Athlon в пользу последнего, то он бы, пожалуй, смог даже обойти его на SDRAM платформе - KT133A.
Здорово показывает себя Athlon 1.2/266 на AMD-760 c PC2100 памятью - вот что значит сбалансированная система. Пока неважно обстоят дела у чипсета Apollo Pro266, не позволяющего выставить оптимальные тайминги для DDR памяти, и ALi Magik 1 по той же причине. Производительность ALi Magik 1 с SDRAM памятью и вовсе разочаровывает. Достойные результаты и у KT133A, но это уже точно предел возможностей. Больше из него выжать просто нереально, притом, что тайминги памяти выставлены по минимуму и для памяти используется 4-way interleave.
В разрешениях 1280х1024 производительность лимитируется величиной fillrate видеоадаптера на базе GeForce2 Pro.
Несколько по-другому выглядит ситуация в Unreal Tournament, что вызывано, прежде всего особенностями движка этой игры.
В UT очень много программных вычислений и они плохо оптимизированы. А написанный изначально под
Glide код движка был позднее с трудом адаптирован под OpenGL/D3D. Часть операций быстрых на
3dfx+Glide медленно работает на OpenGL/D3D + TNTxxx/GeForcexxx.
В Unreal Tournament весьма эффективная схема culling, построенная на порталах. Так что в этой игре
HW T&L нагружался бы не сильно (если бы использовался) - все делает CPU. Никакие оптимизации под
SIMD тут не помогают. Вообще, говорить о каких-то выигрышах за счёт использования SIMD можно только в
сложных моделях. Практика показывает, что если одной матрицей обрабатывать 10-15 вершин, то затраты
на формирование матрицы в удобном виде на Pentium III с SSE превышают получаемый выигрыш и вместо
ожидаемого увеличения fps, мы получаем снижение на ~2-3%.
В Unreal Tournament нагрузка на шину "процессор-память" оказывается еще более серьезной, чем
в Quake3, например, за счет применения палитровых текстур и процедурных текстур (генерируемые и
пересылаемые в карту на каждый кадр) - в результате всего этого картина с производительностью
существенно меняется. Ну и в отличие от Quake3, под UT перестали оптимизировать драйверы.
На более простом тесте Thunder определяющим фактором является пропускная способность системной
памяти, которая выводит в лидеры Pentium 4 и Athlon на 266 МГц шине с DDR памятью на обоих
чипсетах - AMD-760 и ALi Magik 1.
На более сложном тесте UTBench с большим количеством играющих свой вклад внесла производительность
сопроцессора из-за более сложных схем обсчета collisions между игроками - Athlon здесь нет равных.
Игра Expendable, также использующая API Direct3D, вообще ставит все с ног на голову. Специально оптимизированная под 3DNow!, Expendable даже не стесняется демонстрировать это при загрузке, что обуславливает подавляющее преимущество процессора Athlon. Нагрузка на память тоже хоть куда - кстати, именно в Expendable системе на Pentium III с DDR памятью на Apollo Pro266 удалось обойти i815 c SDRAM.
В запасе у Pentium 4 есть набор команд SSE2, что позволит ему "выстрелить" еще раз, по мере
оптимизации драйверов и игровых движков под новые инструкции. Этот набор команд позволит
оптимизировать те части программного кода, для которых была недостаточна точность 32бит вещественных
чисел SSE/3DNow!. Например, расчеты (итерационные) по физическим законам, скелетная анимация
(совместно с инверсной кинематикой), обработка столкновений.
AMD Athlon демонстрирует не только высокую, но и достаточно ровную производительность от игры к игре, особенно с новым типом памяти и
на 266 МГц шине. Процессор Pentuim III окончательно покинул игровой Олимп, уступив пальму первенства
как Pentium 4, так и Athlon, и пребывает в ожидании реинкарнации под именем Tualatin по новой
технологии 0.13 микрон, которая сделает возможным дальнейшее повышение тактовых частот.
Великолепную производительность демонстрирует чипсет AMD-760, а вот ALi Magik 1 выглядит похуже, но и у того, и у другого (у последнего, думается, побольше) еще есть потенциал по увеличению производительности. DDR-память - прекрасное лекарство для энтузиастов игровой индустрии. Уже сейчас, память PC2100 при CAS 2.5 и настройках таймингов, направленных на получение максимальной стабильности в ущерб производительности, демонстрирует весьма впечатляющие результаты. Уже не за горами те дни, когда появятся CAS 2 модули, отконфигурированные с минимальными задержками - они позволят совершить еще один небольшой скачок в росте производительности. И пусть проблема высоких цен на DDR память еще месяц удержит вас от приобретения системы на DDR чипсете - не стоит разочаровываться в действительно хорошем продукте из-за его недоработок, обусловленных непрекращающейся технологической гонкой вооружений.
Ну, хватит играть - теперь самое время посмотреть, как показывают себя конкуренты в офисных приложениях.
О тесте SYSMARK 2000 уже написано достаточно много и вы наверняка к нему привыкли. Напомним основные моменты. Тест состоит из двух наборов приложений - Office Productivity и Internet Content Creation - которые по очереди устанавливаются, запускаются и хронометрируются, и удаляются перед установкой следующего приложения. Таким образом, измеряется производительность системы на каждом из приложений в отдельности.
Набор распространенных приложений весьма удачен и позволяет пользователю оценить, насколько его система подходит к применению в тех или иных целях. Результат каждого приложения выдается в баллах - чем больше, тем лучше. Общий балл по каждому набору и тесту в целом выводится как среднее арифметическое от баллов, набранных каждым тестом в отдельности.
Тесты Ziff-Davis Media (ZDM) Business Winstone 2001 и Content Creation Winstone 2001 как нельзя лучше дополняют тест SYSMARK 2000 - они располагают похожим набором приложений с поправкой на 2001 год, и запускают все приложения одновременно, переключаясь между ними и передавая результаты своей работы друг другу. В итоге получается усложненная (для полноценной загрузки системы) модель практически реального процесса создания документов или контента. При этом хронометрируется общее время работы каждого из тестов и выдается финальный результат в баллах - чем больше, тем лучше.
Набор тестов ZDM Business Winstone 2001 включает в себя следующие приложения:
- Microsoft Word 2000
- Microsoft Access 2000
- Microsoft Powerpoint 2000
- Microsoft Frontpage 2000
- Microsoft Excel 2000
- Microsoft Project 98
- Lotus Notes R5
- Netscape Navigator 4.73
- Winzip 8.0
Набор тестов ZDM Content Creation Winstone 2001 включает в себя следующие приложения:
- Adobe Photoshop 5.5
- Adobe Premiere 5.1
- Macromedia Director 8.0
- Macromedia Dreamweaver 3.0
- Netscape Navigator 4.73
- Sonic Foundry Sound Forge 4.5
При оценке производительности в офисных приложениях используется одно из наиболее распространенных разрешений - 1024 на 768 при глубине цвета 16 бит.
Итак, в активе Pentium 4 - большая тактовая частота и идеально сбалансированная 400 МГц подсистема памяти, обеспечивающая максимальную скорость потоковой обработки данных (SYSMARK.Windows Media Encoder), SSE оптимизированный код части приложений (SYSMARK.Photoshop), а в пассиве - огромный конвейер, сводящий на нет все остальные преимущества архитектуры в офисных приложениях. В результате процессор достаточно неплохо чувствует себя в части создания интернет контента, на равных сражаясь с AMD Athlon, но в бизнес приложениях демонстрирует весьма посредственные результаты, проигрывая даже младшему брату - Pentium III.
Процессор Pentium III с повышением тактовых частот соперников ушел в тень - хотя совсем недавно играл на рынке первую скрипку. В результате он будет пользоваться спросом только в двух случаях - при необходимости работы в SSE оптимизированном Photoshop, либо при весьма конкурентоспособной цене. Кстати, Intel уже делает весьма серьезные шаги в этом направлении, переводя старшие модели Pentium III в средний сегмент рынка.
В принципе, сомнений в победе процессора Athlon не возникало, а перевод на 266 МГц шину и использование DDR-памяти и вовсе делает этот процессор недосягаемым для конкурентов в большинстве офисных приложений. Однако, при создании контента в ZDM Content Creation Winstone 2001, при одновременной работе нескольких потоковых приложений, разрыв с Pentium 4 оказывается минимальным. Так что гонка за частотами вполне себя оправдывает, и AMD нельзя отставать - надо неуклонно наращивать частоту для поддержания лидерства.
Переход на 266 шину и/или DDR память влечет за собой примерно одинаковый прирост производительности для наборов офисных приложений, причем характерно, что прирост для системы на базе чипсета Ali Magik 1 намного более сильный, нежели для систем на базе AMD-760 или KT-133A. Придется еще поработать над драйверами и BIOS. Хорошо, если не над контроллером памяти и системной шины:
Ну и самое интересное - профессиональные тесты SPECviewperf v6.1.2 и 3DStudio MAX R3.1.
Все программы теста SPECviewperf v6.1.2 представляют собой максимально ресурсоемкие Hi-End OpenGL приложения и в основном производят рендеринг сложнейших структур, состоящих из нескольких сотен тысяч полигонов, с использованием освещения, плавного затенения, альфа-канала, краевого антиалиасинга и наложения текстур.
Все приложения осуществляют рендеринг в реальном времени, используя OpenGL драйвер. Основным отличием
от игр является следующее - во-первых, структуры содержат все-таки меньше вершин, нежели уровни
Quake3 или UT, поэтому нагрузка на шину памяти не столь велика, но зато количество видимых и перекрываемых
полигонов в кадре очень большое. Это значит, что величина overdraw высока и fillrate графического
ускорителя расходуется в наибольшей мере на отрисовку пикселей, которые будут не видны в конечном счете. В
профессиональных OpenGL приложениях не требуется высокая скорость смены кадров, там требуется высокая
точность и качество моделируемого изображения. В играх же всегда используются различные схемы оптимизации,
чтобы fillrate графического ускорителя использовался с максимальной эффективностью. В результате мы
имеем к примеру 200000 текстурированных полигонов в кадре против 20000, например, в Quake 3. Как
следствие серьезно возрастает нагрузка на шину локальной видеопамяти и на центральный процессор
системы, а количество кадров в секунду падает в итоге до 20 и ниже, и только первый тест,
представляющий собой достаточно простую модель человека, "бегает" с приемлемым FPS на
GeForce2 Pro. Надо ли повторять, что на первое место выходит SSE и 3DNow! оптимизация OpenGL
драйверов и частота процессора, на которой и работает блок исполнения SIMD инструкций, так как
fillrate нашего графического ускорителя одинаков у всех тестируемых платформ. В подтверждение этого практически все тесты демонстрируют
превосходство Pentium 4 1.5 ГГц над Pentium III 1 ГГц в полтора раза. Финальный результат в FPS - чем
больше, тем лучше.
Второй профессиональный тест в представлении не нуждается - это 3DStudio MAX R3.1. К сожалению, воспользоваться выпущенным фирмой SPEC бенчмарком мы не успели, поэтому непременно выпустим Update к этому обзору, в котором Вас ждет еще один, не менее интересный профессиональный тест, основанный на реальном приложении.
А пока в тестах участвовали две сцены из набора для измерения OpenGL производительности видеоподсистемы - 4views.max, представляющий собой анимацию из 90 кадров вращающегося стола с несколькими объектами (количество полигонов - 40000), и geom1.max, представляющий собой полет камеры над сглаженным ландшафтом из 150 кадров (количество полигонов - 200000). Так вот, мы их просто рендерили с разрешением 640х480 и хронометражом времени. А Вы что подумали? Финальный результат представлен в секундах - чем меньше, тем лучше.
Данные скриншоты представляют собой отрендеренные кадры из файлов 4views.max и geom1.max
Очевидно, что при полноценном программном рендеринге вся нагрузка ложится на плечи сопроцессора и, пожалуй, Athlon покажет себя.
При использовании SPECviewperf v6.1.2 и 3Dstudio использовалось разрешение, близкое к реальным условиям работы дизайнеров - 1280 на 1024 при глубине цвета 32 бит.
Для профессионального применения в системах 3D моделирования Pentium 4 подходит как нельзя лучше, более того, по мере оптимизации под SSE2 и увеличении тактовых частот он проявит себя еще лучше. Но работяга Athlon старается не отставать и практически наступает на пятки своему конкуренту. При этом прирост от использования DDR памяти и 266МГц шины весьма незначителен, основываясь на результатах чипсетов от AMD и VIA, зато волшебный Magik 1 демонстрирует обратное. Кстати, это практически единственный тест, где проявляется превосходство DDR памяти над SDR для процессора Pentium III. Надеемся, что по мере оптимизации драйверов и BIOS чипсет Apollo Pro266 все же проявит себя с лучшей стороны и окажется востребованным не только за свою широчайшую функциональность, но и за достойную производительность - хотя бы процентов на пять больше, чем у i815EP.
И напоследок - 3Dstudio MAX. Мы намеренно использовали две сцены разной сложности в надежде получения разных результатов и прогнозирования, какой из процессоров будет вести себя лучше при просчете сложнейших анимаций, занимающих не один час. Но все напрасно - результаты на удивление похожи, и, например, результаты Athlon 1.2 ГГц / 266 МГц на AMD-760 на 17% превысили показатели Pentium 4 в обоих тестах. И если оптимизация под наборы инструкций не является сильной стороной пакета, то масштабируемость на многопроцессорных системах просто потрясающая. Так что если заниматься рендерингом анимации на профессиональной основе, то без двухпроцессорной системы не обойтись, а среди однопроцессорных выбор очевиден - Athlon.
Выводы
Очевидно, что для комфортной работы обычного пользователя, занимающегося всем понемногу, за глаза хватит любого из этих процессоров, и ему стоит выбирать исходя из личных предпочтений и цен на систему в целом.
Другое дело - профессионалы, занимающиеся компьютерным моделированием, рендерингом и математическими расчетами. Но у них при выборе стоит и другая проблема - предельно возможная производительность системы ни коим образом не должна наносить удар по надежности и стабильности, которая подчас даже важнее. Исходя из этого аспекта, можно рекомендовать к приобретению сейчас системы, использующие доступный SDRAM - Athlon в паре с KT133A и Pentium III в паре с i815 или Apollo Pro 133A, и RDRAM систему Pentium 4 на i850. А вот с приобретением системы на любом из DDR чипсетов - Ali Magik 1, AMD-760 или VIA Apollo Pro266 стоит повременить - время избавления от "детских болезней" еще не закончилось, и нет никакого смысла пытаться лечить их самостоятельно. Очевидно, что к концу февраля все образуется, появятся отлаженные коммерческие ревизии плат и доработанные BIOS и драйверы.
А если еще и цены на DDR память серьезно снизятся, то можно с большой уверенностью утверждать, что нас ждет весенний бум DDR: Да и Pentium 4 с RDRAM в комплекте уже подешевел достаточно, чтобы стать доступным для масс:
Ну что-же, посмотрим, насколько сильно посторонится SDRAM - грядет время перемен.
P.S. Автор приносит свои глубочайшие извинения читателям, которые надеялись увидеть конкретные рекомендации по приобретению того или иного процессора. Им можно посоветовать просмотреть результаты тестирования еще раз.
Оборудование для тестовых испытаний предоставлено компанией "Олди"
Процессор AMD Athlon 1.2 GHz @ 200 MHz FSB предоставлен компанией "IPLabs"
Александр Полувялов (bhd@ixbt.com)
Опубликовано -- 15 февраля 2001 г.
Комментарии? Поправки? Дополнения? bhd@ixbt.com
|