Користувач форумів TechPowerUP виявив, що у його відеокарти ZOTAC RTX 5090 SOLID відключена частина блоків растрових операцій (ROP). Замість заявлених 176 активними виявилися лише 168. «Нестача» становить 4,5% від загальної кількості.
TechPowerUP, що є розробником утиліти GPU-Z та має велику базу BIOS для GPU, протестував цю карту та підтвердив, що їхній екземпляр має таку саму проблему.
Як нестача ROP впливає на продуктивність?
Блоки ROP відповідають за обробку піксельних даних, виконуючи такі завдання, як змішування та згладжування. Це одна з ключових частин архітектури GPU, і NVIDIA часто штучно обмежує їхню кількість, щоб розділяти моделі відеокарт. Проте в рамках однієї модельної лінійки кількість блоків растрових операцій повинна бути однакова.
У початковому огляді TechPowerUP виявилося, що відеокарта ZOTAC 5090 SOLID має дещо нижчу продуктивність та відстає від RTX 5090 Founders Edition. Спочатку оглядачі не помітили, що їхня відеокарта страждає на нестачу ROP, і лише після відкриття учасника форуму Wuxi Gamer вони підтвердили, що у їхнього пристрою була та сама проблема.
Різна продуктивність RTX 5090
Менша кількість ROP помітно впливає на продуктивність. На прикладі гри Elden Ring у 4K UHD (максимальні налаштування, без DLSS) відеокарта Zotac RTX 5090 SOLID поступилася всім іншим RTX 5090, включаючи Founders Edition. Вона показала:
на 5,6% гірший результат, ніж Founders Edition,
на 8,4% гірший результат за ASUS ROG Astral RTX 5090 OC – найшвидшу модель у тесті.
Оскільки частота GPU у ZOTAC 5090 SOLID відповідала заявленим 2407 МГц (як і у Founders Edition), вона не повинна бути суттєво повільнішою за інші моделі. Цікаво те, що втрата продуктивності не помітна під час моніторингу тактових частот, оскільки вони настільки високі, як і очікувалося, — просто менше доступних одиниць для обробки робочого навантаження візуалізації.
Є дві можливі причини такої ситуації з нестачею блоків растрових операцій.
Помилка в BIOS – у такому разі її можна виправити оновленням прошивки, хоча це не найкращий сценарій для відеокарти за $1999+.
Дефект самого GPU – якщо це так, проблема серйозна і не підлягає виправленню.
Поки що ZOTAC не зробила офіційної заяви, але TechPowerUP працює з ZOTAC та NVIDIA, щоб з’ясувати всі подробиці.
Спочатку у TechPowerUP підтвердили, що ця проблема поки виявлена лише у ZOTAC SOLID RTX 5090. Відеокарти від ASUS, Gigabyte, MSI, Palit та самої NVIDIA не мають такого дефекту.
Та згодом виявилося, що проблема з нестачею ROP стосується карт від ZOTAC, MSI, MANLI та Gigabyte. За даними MEGAsizeGPU, проблема пов’язана не з BIOS, а з дефектом графічного чипа. Отже, її не можна буде виправити без заміни GPU.
The root cause is the chip. A small batch of GB202 is defective, and the bios can not do anything with this issue.
Apple Mac mini – це компактний пристрій, але його мінімалістичний дизайн має істотний недолік: повна відсутність портів на передній панелі. Хоча на задній панелі розташовано безліч роз’ємів, передня панель залишається голою, на ній є тільки індикатор живлення. Цей разючий контраст з Mac Studio, який оснащений фронтальними портами для більшої зручності, наголошує на недоліку Mac mini.
Пвідставка та концентратор Satechi для Mac mini вирішує цю проблему, пропонуючи витончене та функціональне рішення. Цей багатоцільовий аксесуар піднімає Mac mini, забезпечуючи йому стійку основу та одночасно додаючи безліч можливостей для підключення спереду.
Розширення можливостей підключення та підвищення зручності використання
Satechi Stand & Hub пропонує набір портів:
1x USB-C (10 Гбіт/с): Забезпечує високошвидкісну передачу даних, зарядку та виведення зображення на дисплей.
3x USB-A (10 Гбіт/с): Забезпечують достатню сумісність з периферійними пристроями, такими як клавіатури, миші та зовнішні жорсткі диски.
Пристрій для читання карт пам’яті SD (UHS-I, 104 Мб/с): Дозволяє зручно переносити дані з SD-карт, що широко використовуються у фотоапаратах та інших пристроях.
Пристрій для читання карт пам’яті microSD (UHS-I, 104 МБ/с): Забезпечує сумісність зі все більш популярним форматом microSD, що ідеально підходить для смартфонів та екшн-камер.
3,5-мм аудіороз’єм: забезпечує стандартне підключення навушників або зовнішніх динаміків.
Увімкнення пристроїв для читання карт пам’яті SD і microSD заслуговує на особливу увагу, оскільки Mac mini позбавлений цієї важливої функції для доступного та портативного зберігання даних. Хоча специфікація UHS-I забезпечує гідні швидкості, реалізація UHS-II дозволила значно збільшити швидкість передачі. Втім, для більшості користувачів різниця може виявитися непомітною.
Збільшення обсягу пам’яті завдяки внутрішньому твердотільного накопичувача NVMe
Підставка та концентратор Satechi виходить за рамки простого розширення портів. У його останній версії з’явився вбудований корпус, в який розміщуються як SATA, так і, що особливо важливо, високопродуктивні NVMe M.2 SSD. Це дозволяє користувачам Mac mini значно збільшити ємність сховища і досягти неймовірно високих швидкостей. Накопичувачі NVMe забезпечують значно більшу швидкість читання та запису в порівнянні з SATA, що робить їх ідеальними для таких вимогливих завдань, як редагування відео, ігри та передача великих файлів.
Вбудоване в підставку рішення для зберігання даних є привабливою альтернативою офіційним зовнішнім SSD-накопичувачам Apple, які можуть бути дуже дорогими. Наприклад, карту microSD об’ємом 512 Гб можна придбати за частину вартості порівнянного зовнішнього SSD, що забезпечує бюджетний спосіб збільшення обсягу пам’яті.
Усунення потенційних недоліків
Незважаючи на численні переваги підставки та концентратора Satechi, важливо враховувати і можливі недоліки:
Порт USB-C на підставці не забезпечує достатньої потужності для заряджання потужних пристроїв, наприклад ноутбуків.
Тепловий режим: Компактна конструкція підставки може призвести до підвищеного тепловиділення, особливо при використанні високопродуктивних твердотільних накопичувачів NVMe. Забезпечте належну вентиляцію для підтримання оптимальної робочої температури.
Комплексне рішення для користувачів Mac Mini
Satechi Stand & Hub для Mac mini – це універсальне та економічне рішення, яке перетворює роботу з Mac Mini. Безліч портів, розташованих на передній панелі, вбудований накопичувач та елегантний дизайн роблять його безцінним доповненням для будь-якого користувача Mac mini. Якщо вам потрібно збільшити обсяг пам’яті, підключити додаткові периферійні пристрої або просто покращити естетичний вигляд робочої станції, Satechi Stand & Hub стане відмінним вибором.
Встановлення та продуктивність:
Встановлення NVMe SSD в підставку і концентратор не складе труднощів завдяки викрутці і гвинтам, що входять в комплект. Процес зручний для користувача та не вимагає спеціальних технічних знань. У плані продуктивності Satechi Stand & Hub перевершує всіх інших, забезпечуючи вражаючі швидкості читання та запису. При використанні твердотільного накопичувача Western Digital SN850X NVMe об’ємом 1 ТБ підставка показала швидкість запису більше 1 ГБ/с та швидкість читання майже 900 МБ/с – значне прискорення для Mac mini.
Сумісність з Mac Studio:
Крім сумісності з Mac mini, підставка та концентратор також легко вписуються у потужну систему Apple Mac Studio. Це робить його доступним варіантом для збільшення обсягу пам’яті на новітньому професійному настільному комп’ютері Apple, являючи собою бюджетну альтернативу дорожчим оновленням внутрішньої пам’яті.
Вибір відповідної моделі:
Satechi пропонує версію Stand & Hub без корпусу SSD на 20 доларів дешевше. Хоча ця модель дозволяє заощадити гроші, ви можете виявити, що додатковий простір для зберігання даних знадобиться вам пізніше. Рекомендуємо модель з корпусом NVMe SSD, оскільки вона забезпечує захист на майбутнє і додаткову гнучкість.
Підставка та концентратор для Mac mini з корпусом NVMe SSD доступна в сріблястому кольорі, що відповідає останнім моделям Mac mini. Однак важливо відзначити, що ця модель не сумісна з старішими поколіннями Mac mini. Підставка та концентратор без корпусу також пропонуються у кольорі Space Gray, що робить їх сумісними із моделями Mac mini 2018 року.
Проблеми з продуктивністю Wi-Fi:
Деякі користувачі повідомляють про зниження швидкості Wi-Fi під час розміщення Mac mini або Mac Studio на підставці Satechi. Хоча Satechi стверджує, що сам хаб не впливає на Wi-Fi сигнали, в деяких випадках можуть виникати перешкоди.
Вирішення проблем з Wi-Fi:
Щоб зменшити можливі проблеми з Wi-Fi, Satechi рекомендує підключити Mac mini до мережі 2,4 ГГц замість 5 ГГц. Таке перемикання часто вирішує проблему та забезпечує оптимальну роботу Wi-Fi. Однак ми розуміємо, що цей спосіб вирішення проблеми може підійти не всім користувачам і зараз активно вивчаємо це питання.
Дротове підключення: надійна альтернатива:
Якщо у вас виникли проблеми з Wi-Fi, надійним та стабільним рішенням буде підключення вашого Mac до мережі через кабель Ethernet. Це дозволить обійти можливі перешкоди і позбавитися необхідності покладатися на бездротове підключення.
Satechi Stand & Hub для Mac mini з NVMe SSD Enclosure пропонує привабливе поєднання функціональності, зручності та доступності. Його здатність додавати швидке сховище, розміщуватись під Mac Studio і легко інтегруватися з Mac mini робить його цінним аксесуаром для багатьох користувачів. Проте потенційні проблеми з Wi-Fi вимагають додаткового вивчення та обережності під час використання підставки в бездротових мережах. Слідкуйте за оновленнями, оскільки ми продовжуємо розслідування та пошук рішень.
Цей матеріал – не редакційнийЦе – особиста думка його автора. Редакція може не розділяти цю думку.
Ілюстративне зображення Indiana Jones and the Great Circle . Джерело: IGN
MachineGames випустила третє велике оновлення для Indiana Jones and the Great Circle, що містить значні покращення, особливо для власників PC: воно додає підтримку DLSS 4 та FSR 3.1 з генерацією кадрів та XESS 1.4 від Intel, що має на меті підвищити продуктивність та якість зображення. Крім того, для гравців з відеокартами AMD та Intel тепер доступна функція трасування контурів, що підвищує реалістичність тіней в інтер’єрі.
Що відомо
Помітне покращення якості життя дозволяє гравцям використовувати ремонтні набори безпосередньо зі свого інвентарю, що спрощує обслуговування обладнання. Оновлення також усуває різні помилки, включаючи проблеми, які раніше заважали гравцям використовувати драбини або лазити по ліанах у регіоні Сухотай, зокрема під час місії «Благословенна перлина». Ще одне виправлення вирішує проблеми з підбором певних пляшечок з ліками в районі Ватикану.
Забігаючи наперед, MachineGames розглядає можливість додавання в майбутні оновлення функцій, які користувачі просили, таких як модифікації HUD і підтримка технології волосся Nvidia RTX
Де можна пограти?
Гра доступна на Xbox Series та PC.Реліз для PlayStation 5 заплановано на весну цього року, хоча конкретну дату ще не оголошено.
Інженерів SpaceX призначили старшими радниками керівника Федерального авіаційного управління / Depositphotos
Джерела видання WIRED повідомляють, що інженерів SpaceX призначили старшими радниками адміністратора Федерального авіаційного управління (FAA) — організації, яка серед іншого надає дозволи на запуски космічних ракет (компанії Ілона Маска зокрема).
У неділю Шон Даффі, секретар Департаменту транспорту, який контролює FAA, оголосив у дописі на X, що інженери SpaceX відвідають командний центр системи управління повітряним рухом у Вірджинії «для екскурсії», але на той час, як пише видання, вони вже були включені у склад авіаційного управління — через спеціальне повноваження, яке дозволяє державним керівникам «наймати людей з обмеженими повноваженнями без урахування конкуренції в роботі».
Інший нюанс полягає в тому, що «жоден з інженерів SpaceX не пройшов повну перевірку до моменту початку роботу» — хоча, на відміну від деяких молодих працівників Ілона Маска в DOGE, які отримали доступ до критично важливих систем різних установ США, працівники його космічної компанії принаймні мають досвід, пов’язаний з FAA, і їхні імена повноцінно розкриті у звіті (Тед Маласка, Томас Кірнан, Сем Сміл і Брейді Ґланц).
Ілон Маск і команда SpaceX під час запуску Starship / Скриншот з трансляції SpaceX
Маласка, згідно з дописом у LinkedIn, є старшим директором із прикладного програмного забезпечення в SpaceX, а раніше працював старшим директором з розробки даних у Capitol One і старшим архітектором у FINRA. Решта троє — молоді інженери-програмісти SpaceX, які до роботи на Маска, здається, лише закінчили коледжі та університети.
Попри заяви Даффі в соцмережах про «просту екскурсію», в.о. адміністратора FAA Кріс Рошело відправив електронного листа працівникам, де повідомив, що агенція найняла в команду «спецдержслужбовців» — так, це та сама посада, яку Маск отримав в адміністрації Трампа.
«Ми просимо їхньої допомоги для розробки рішень», – написав Рошело в листі, який переглянули журналісти WIRED.
За тиждень до цього секретар Департаменту транспорту заявляв, що не проти отримати «допомогу від розумних інженерів» зокрема для реформи системи сповіщень NOTAM — у відповідь на питання про роль DOGE у справах національного повітряного простору.
Згідно зі звітами The New York Times (власне, які підтвердили й джерела WIRED), SpaceX функціонувала як «плацдарм» для команди DOGE перед інавгурацією Трампа і дійсно чимало працівників космічної компанії (як власне xAI й Tesla) приєдналися до департаменту ефективності як «спеціальні державні службовці» — тобто зарплати не отримуватимуть, але матимуть доступ до деяких секретних документів.
Starship на стартовому майданчику / SpaceX
Як зазначає Arstechnica, Федеральне авіаційне управління США тісно контактує із SpaceX Ілона Маска — і ця співпраця часто перебувала на межі конфліктів. У січні FAA тимчасово призупинило програму космічної компанії після того, як ракета Starship вибухнула під час польоту, пошкодивши державну власність на островах Теркс і Кайкос у Карибському басейні. Розслідування інциденту триває до сьогодні, а сам Маск схарактеризував невдачу, як «незначну вибоїну на дорозі», і нарікав, що це сповільнить темпи запусків SpaceX, яка запланувала їх на 2025 рік аж 25.
У вересні FAA також пропонувала накласти на компанію штраф у розмірі $633 000 через два інциденти 2023 року, коли SpaceX нібито не дотрималась умов ліцензії.
«Фундаментальна проблема полягає в тому, що людство назавжди залишиться на Землі, якщо FAA не проведе радикальних реформ!», — писав Маск на той час, закликаючи тодішнього голову управління Майка Вітакера піти у відставку.
І Вітакер таки пішов — у січні.
«Я сказав Ілону, що він має уникати конфліктів інтересів», — заявив Трамп на пресконференції цього тижня. «Тож ми не дозволимо Ілону брати участь в будь-чому такому, пов’язаному, можливо, навіть з космосом».
Концепт скасованої гри Batman Beyond. Джерело: Reddit
Студія Rocksteady, відома завдяка серії Batman Arkham, нібито працює над новою грою, заснованою на Batman Beyond, яка може стати ексклюзивом PlayStation.
Що відомо
Чутки про новий проєкт з’явилися після звіту Джейсона Шрайера з Bloomberg, який підтвердив, що Rocksteady планує повернутися до світу однокористувацького Бетмена. За інформацією інсайдера Lunatic Ignus, гра адаптуватиме сюжет Batman Beyond, де Бетменом вже є не Брюс Уейн (він тепер наставник для нового Бетмена), а події відбуваються у майбутньому.
Цікаво те, що чутки вказують на те, що нова гра може стати ексклюзивом для PlayStation 5.
Нагадаємо, що вже були спроби створити гру на основі Batman Beyond, яка була скасована на етапі розробки.
На цю мить жодна зі сторін — PlayStation, WB Games або Rocksteady Studios — не прокоментувала ці чутки. Проте провал Suicide Squad натякає на те, що студія дійсно може повернутися до однокористувацьких ігор, а ексклюзивна угода із Sony залучить більше фінансування.
Ілон Маск оголосив про запуск ігрової студії. Depositphotos / X
Хто йому скаже?
Під час презентації останньої версії Grok 3 Ілон Маск і команда його ШІ-стартапу xAI оголосили про намір створити студію, яка генеруватиме ігри за допомогою штучного інтелекту.
«Ми запускаємо ігрову студію штучного інтелекту. Якщо ви зацікавлені приєднатися до нас, долучайтесь до xAI», — сказав Маск під час прямого ефіру.
Деталі про потенційний проєкт поки незначні, але на презентації Маск показав, як Grok 3 генерує копію Tetris за допомогою Python.
Він також розмірковував над назвою, сміливо запропонувавши варіант «Epic Games», на що звернув увагу tomshardware, перш ніж згадав, що та вже зайнята.
В іншому прикладі, опублікованому користувачем, Grok 3 створював власну версію базової 2D-гри Bubble Trouble, однак ШІ-модель проігнорувала підказку відтворити звукові ефекти в стилі ретро.
Btw, you can improve the graphics resolution simply by asking Grok to do so.
We’re working on being able to integrate photo-realistic graphics into AI games for the @xAI game studio. https://t.co/hLSgr9Kdjw
Маск, який відомий своєю любов’ю до відеоігор і оманливими заявами про свої успіхи в них, також стверджує, що можна буде покращити графічну роздільну здатність гри, просто попросивши про це чатбота.
Нагадаємо, що днями xAI представила сімейство моделей Grok 3, яке також включає меншу версію Grok 3 mini і моделі міркування, що конкуруватимуть з DeepSeek та OpenAI й нібито вже перевершують їх у стандартних тестах. Початково Grok 3 був доступний у беті для передплатників X Premium+, ціну якої за пару годин після анонсу моделей підвищили вдвічі. Наразі (і, ймовірно, на це вплинули публікації журналістів про різке підвищення цін) Grok 3 запустили для всіх користувачів X.
Нова функція дозволяє користувачам iOS шукати будь-що на екрані в Chrome або Google, обводячи предмет
Розділ Технології виходить за підтримки
Google оголосила про оновлення, яке дозволяє власникам iPhone швидко шукати інформацію прямо з екрана за допомогою простого жесту. Нову функцію можна використовувати у додатках Google Chrome та Google Search на iOS. Ця можливість схожа на функцію Circle to Search, яка вже є на Android. Вона дозволяє виділяти об’єкти на екрані різними способами та одразу знаходити інформацію про них у Google.
Як працює аналог Circle to Search на iPhone?
На iPhone пошук на екрані можна виконати, просто намалювавши коло, виділивши або натиснувши на потрібний об’єкт у додатках Chrome або Google Search. Наприклад, якщо ви читаєте статтю та бачите картину, що вас зацікавила, тепер можна просто обвести її або натиснути на неї, щоб дізнатися більше. Якщо вам сподобався якийсь предмет під час перегляду відео, можна виділити його за допомогою Google Lens і знайти схожі товари.
Ця нова функція дозволяє миттєво виконувати візуальний пошук без необхідності робити знімок екрана чи відкривати нову вкладку. Це також ще один спосіб швидко почати звичайний пошук в інтернеті.
Після виділення об’єкта Google покаже візуально схожі результати та додаткову інформацію. Можна уточнити пошук за кольором, брендом або іншими параметрами. Також є можливість поставити додаткове запитання, щоб дізнатися ще більше.
Щоб скористатися новою функцією в Chrome або Google Search, необхідно відкрити меню (три крапки) та обрати пункт Search Screen with Google Lens. Незабаром у Chrome з’явиться окрема піктограма Lens в адресному рядку, щоб зробити використання зручнішим.
Оновлення з новою можливістю пошуку на iPhone поступово розгортається для всіх користувачів iOS у всьому світі й буде розповсюджуватися протягом тижня.
AI Overviews тепер у Google Lens
Окрім цього, Google розширює використання функції AI Overviews, яка надає короткий підсумок інформації на початку сторінки результатів пошуку.
AI Overviews у Google Lens
Раніше AI Overviews з’являлися у пошуку через Google Lens лише в тих випадках, коли користувач додавав текстовий запит. Тепер ця функція працюватиме автоматично, навіть без додаткових запитань. Наприклад, якщо ви бачите цікаву модель автомобіля, просто сфотографуйте її в Google Lens – і одразу отримуєте коротку довідку разом із посиланнями на корисні ресурси.
Оновлення з AI Overviews стане доступним цього тижня для користувачів англійською мовою у країнах, де підтримується ця функція. Спочатку воно з’явиться в додатку Google для Android та iOS, а пізніше – у Chrome для настільних комп’ютерів і мобільних пристроїв.
Функцію Circle to Search запустили минулого року. Її планувалося використовувати в «обраних преміальних» Android-смартфонах.
Favbet Tech – це ІТ-компанія зі 100% украінською ДНК, що створює досконалі сервіси для iGaming і Betting з використанням передових технологіи та надає доступ до них. Favbet Tech розробляє інноваційне програмне забезпечення через складну багатокомпонентну платформу, яка здатна витримувати величезні навантаження та створювати унікальний досвід для гравців.
Китайський анімаційний фільм «Нечжа 2» випередив за зборами хітовий «Думками навиворіт 2» і став «найбагатшим» мультфільмом в історії.
За даними Reuters, касові збори «Нечжа 2» у вівторок перевищили $1,69 млрд — майже така сама сума у мультфільму Pixar, але китайський все ще транслюється в прокаті. Окрім звання найкасовішого мультфільму, він отримав восьме місце в рейтингу «найбагатших» фільмів всіх часів, тоді як експерти прогнозують, що він запросто перетне позначку у $2 млрд каси вже найближчим часом.
Що цікаво, 99% каси «Нечжа 2» отримано саме з Китаю, який покладається у зборах на домашні результати на відміну від голлівудських фільмів, що обирають більш глобальну стратегію розповсюдження.
«Нечжа 2» — це продовження хіта 2019 року, заснованого на китайському романі XVI століття «Одяг богів» і знятого аніматором-самоучкою Ян Юєм (Цзяоцзи). В центрі сюжету — хлопчик, що володіє магічною силою і намагається захистити місто-фортецю Чентангуань.
Китайський анімаційний фільм Ne Zha 2 продовжує встановлювати нові рекорди, ставши найкасовішим китайським анімаційним фільмом усіх часів. За 20 днів після прем’єри він уже зібрав понад $1.6 мільярда, і, за прогнозами, досягне позначки у $2 мільярди найближчим часом.
Що відомо
Мультфільм дебютував під час святкування Китайського Нового року та швидко обійшов касові збори свого попередника, а також попередній рекорд китайського кіно — The Battle of Lake Changjin. Ne Zha 2 вже зайняв дев’яте місце в списку найкасовіших фільмів усіх часів, випередивши такі хіти, як The Lion King і Jurassic World.
Китайська платформа Maoyan прогнозує, що загальний дохід фільму в Китаї може перевищити $2 мільярди, що поставить його поруч з такими класичними проєктами, як Titanic і Avatar.
Разом з тим Ne Zha 2 дуже близький до того, щоб перебити доходити Inside Out 2 та стати найкасовішим мультфільмом за всю історію.
Ne Zha 2 продовжує історію персонажа Нежа, який бореться з морськими монстрами та божественними силами.
В попередній раз ми згадували RTX 3000 Ampere та RTX 4000 Ada. Сьогодні настав час подивитися на нові RTX 5000 Blackwell. Розглянемо особливості відеокарт нового покоління (GDDR7, DLSS), їх SM блоки та нові технології в Тензорних ядрах. Та й скажемо кілька слів про RTX 5070.
Зміст
Особливості NVIDIA RTX 5000 Blackwell
До основних технологічних та архітектурних нововведень у відеокартах NVIDIA RTX Blackwell можна віднести:
Нові функції для SM-блоків: RT Core і Tensor Core, покращують і прискорюють можливості нейронної візуалізації. Вони забезпечують подвоєння пропускної здатності для цілочисленної математики за такт порівняно з графічними процесорами RTX 4000 Ada.
Нові ядра RT 4-го покоління. Значні вдосконалення архітектури ядра RT було внесено в Blackwell, що дає змогу використовувати нові технології трасування променів і нейронної візуалізації.
Нові Тензорні Ядра 5-го покоління – включають нові можливості FP4, які можуть подвоїти пропускну здатність штучного інтелекту, вдвічі зменшивши вимоги до пам’яті. Також включена підтримка нового FP8 Transformer Engine другого покоління, який використовується для центрів обробки даних.
NVIDIA DLSS 4. Архітектура Blackwell підтримує АІ генерацію кількох кадрів, яка підвищує частоту кадрів до 2 разів у порівнянні з попередньою версією DLSS 3/3.5, зберігаючи або навіть перевищуючи оригінальну якість зображення та забезпечуючи низькі затримки у систем.
Процесор керування штучним інтелектом (AMP) – дає змогу вбудовувати АІ моделі в процес класичного рендерингу та паралельно використовувати GPU для графічних навантажень.
Пам’ять GDDR7 — це новий стандарт пам’яті GDDR із наднизькою напругою, який використовує технологію сигналізації PAM3 (Pulse Amplitude Modulation), включаючи більш швидкісні підсистеми пам’яті та покращення енергоефективності.
Технологія Mega Geometry – нова технологія RTX, спрямована на різке збільшення геометричних деталей, можливих у програмах із трасуванням променів.
Архітектура NVIDIA RTX 5000 Blackwell
Чіп GB202 та SM блоки
Чіп GB202 – це новий флагманський графічний процесор у відеокартах сьогоднішнього покоління для споживчого ринку. Поки є лише у складі нової графічної карти GeForce RTX 5090. Графічний процесор GB203 використовується у відеокартах GeForce RTX 5080 та GeForce RTX 5070 Ti, а GB205 — у GeForce RTX 5070. Ці графічні процесори базуються на одній базовій архітектурі та налаштовані для різних сегментів ринку.
Про GB205 скажу кілька слів окремо нижче.
Повноцінний графічний процесор GB202 включає 12 кластерів обробки графіки (GPC), 96 кластерів обробки текстур (TPC), 192 потокових мультипроцесори (SM) і 512-розрядний інтерфейс пам’яті з шістнадцятьма 32-розрядними контролерами пам’яті.
GPC є пріоритетним високорівневим апаратним блоком у всіх графічних процесорах сімейства GB20x Blackwell, при цьому всі ключові графічні процесори знаходяться в GPC. Кожен GPC включає спеціальний Raster Engine, два розділи Raster Operations (ROP), причому кожен розділ містить вісім окремих блоків ROP і вісім TPC. Останній своєю чергою включає один PolyMorph Engine і два SM блоки.
У RTX 5090 хоча й стоїть GB202, проте він дещо «порізаний». А саме, вимкнений 1 GPC.
GB202 (повний)
GB202 (RTX 5090)
GPC
12
11
TPC
96
85
SM блоки
192
170
CUDA ядра
24576
21760
RT ядра
192
170
Тензорні ядра
768
680
L2 кеш
128 МБ
96 МБ
Зображення №1. GPU GB202. Автор: Nvidia.
Кожен SM блок складається зі 128 ядер CUDA, одного RT ядра четвертого покоління, чотирьох тензорних ядер п’ятого покоління, чотирьох блоків текстур, реєстрового файлу розміром 256 КБ і 128 КБ L1/спільної пам’яті.
Зауважте, що кількість можливих цілочисельних операцій INT32 у Blackwell подвоєна порівняно з Ada завдяки їх повній уніфікації з ядрами FP32, як показано на Зображенні №2 нижче. Однак уніфіковані ядра можуть працювати лише як ядра FP32 або INT32 у будь-якому заданому тактовому циклі.
Зображення №2. SM блок в архітектурі Blackwell. Автор: Nvidia.
Ще раз нагадаю, що відносно RTX 4000 Ada я робив окрему статтю. Детальніше ви можете прочитати в попередньому матеріалі. Навіть зараз очевидно, що нове покоління буде краще підходити під нові нейронні шейдери та роботи з AI.
Зображення №3. Порівняння SM блоків двох поколінь. Автор: Nvidia.
Що не так з RTX 5070?
І першим, про що ви могли подумати — Ні, RTX 5070 не рівня RTX 4090. Те, що ця фраза була сказана й показана на презентації є повною нісенітницею. Вона просто занадто слабка для цього. Звісно, якщо увімкнути DLSS 4 з генератором кадрів, то fps зрівняється за показниками оверлею. Першою грою з його підтримкою стала Cyberpunk 2077. Однак, затримки натискання клавіш та артефакти зображення скасовувати не можна.
Зображення №4 та №5. Слайд з презентації та класний жарт. Автор: NVIDIA, IndianGaming.
Тут ми можемо побачити дещо дивне — назва графічного чіпа сильно виділяється. Це GB205. Ось ця остання пʼятірка все руйнує, бо зазвичай, просто не було такої назви у чіпів. Були або xx204, або xx206. Тому я думаю, що RTX 5070 напочатку називалася RTX 5060 або RTX 5060 Ti.
Для тих кому цікаво, у 5070 Ti стоїть той самий чіп, що у RTX 5080 — GB203. І виходить, що немає проміжного GB204, який і повинен був стояти у RTX 5070.
Підсистема пам’яті GDDR7
Відеокарти Blackwell постачаються з новою відеопам’яттю стандарту GDDR7. Вони живляться наднизькою напругою, який використовує технологію сигналізації PAM3 та забезпечує суттєвий прогрес у високошвидкісній конструкції пам’яті. Співпраця NVIDIA з технологічною асоціацією JEDEC, допомогла у створенні PAM3 (Амплітудна Модуляція Імпульсу з трьома рівнями). Саме вона є основоположною технологією високочастотної сигналізації для GDDR7 DRAM.
Зображення №6. Порівняння GDDR6X та GDDR7. Автор: Nvidia.
Перехід від PAM4 (4 рівні передають 2 біти за цикл) у GDDR6X до PAM3 (3 рівні передають 1,5 біта за цикл) у GDDR7, у поєднанні з інноваційною схемою pin-кодування, дозволяє GDDR7 досягти значно покращеного співвідношення сигнал/шум (SNR). Ця еволюція також подвоює кількість незалежних каналів з мінімальними витратами на щільність вводу-виводу.
І ні, це не квантовий компʼютер чи квантова памʼять.
Завдяки збільшеній щільності каналів, покращеному SNR PAM3, розширеним схемам вирівнювання, оновленій архітектурі тактування та вдосконаленому навчанню вводу/виводу GDDR7 забезпечує значно вищу пропускну здатність. GeForce RTX 5090 постачається з пам’яттю GDDR7 28 Гбіт/с і забезпечує пікову пропускну здатність пам’яті 1,792 ТБ/с, тоді як GeForce RTX 5080 постачається з пам’яттю GDDR7 30 Гбіт/с, що забезпечує пікову пропускну здатність пам’яті 960 ГБ/с.
Тензорні ядра Blackwell 5-го покоління
Тензорні ядра Blackwell підтримують операції з FP4, FP6, FP8, INT8, FP16, BF16, TF32. Однак, саме з підтримкою FP4 пов’язана необхідність запускати нові генеративні моделі штучного інтелекту. Ці моделі збільшують вимоги до обчислювальних ресурсів і пам’яті, і через це буває важко запускати такі моделі навіть на новітньому апаратному забезпеченні.
FP4 забезпечує метод нижчого квантування, подібний до стиснення файлів, який зменшує розмір моделі. Порівняно з FP16 (використовується більшістю моделей за замовчуванням), FP4 вимагає менше половини пам’яті, а графічні процесори Blackwell забезпечують у 2 рази більшу продуктивність порівняно з попереднім поколінням. FP4 практично не втрачає якості завдяки розширеним методам квантування, які пропонує NVIDIA TensorRT Model Optimizer.
Простими словами, FP4 дозволяє ефективніше використовувати локальні «нейронки», яким знадобиться менше пам’яті. Крім того, зросте швидкість генерації ціною незначних втрат якості кінцевого результату.
RT Ядра Blackwell 4-го покоління
У графічних процесорах RTX 2000 Turing, RTX 3000 Ampere та RTX 4000 Ada існують спеціальні апаратні блоки для прискорення обходу структури даних Ієрархії Обмежувальних Томів (Bounding Volume Hierarchy, BVH) і виконання обчислень як перетину променів із трикутником (Ray-triangle intersection), так і перетину обмежувальних прямокутників (Ray-bounding box intersection). Підрахунок перетину променів — це складна операція, яка виконується з високою частотою під час візуалізації сцени з трасуванням променів. Ядро RT четвертого покоління забезпечує подвійну пропускну здатність, ніж в Ada.
Зображення №7. Нове четверте покоління RT ядер. Автор: Nvidia.
Ядра RT, які є як у графічних процесорах Ada, так і в Blackwell, включають спеціальний блок, відомий як Opacity Micromap Engine. Механізм Opacity Micromap Engine оцінює Маску Непрозорості (Opacity Mask), яка є звичайним трикутним мешем/сіткою, визначеною за допомогою барицентричної системи координат. Вона використовується для звітування про перетини променів і трикутників.
Інші два блоки (Triangle Cluster Intersection Engine та Triangle Cluster Compression Engine) необхідні для використання нової технології – Mega Geometry. Це нова технологія RTX, спрямована на різке збільшення геометричної деталізації, яка можлива в програмах із трасуванням променів. Зокрема, Mega Geometry дає змогу таким ігровим двигунам, як Unreal Engine 5, які використовують сучасні системи рівня деталізації (Level-of-Detail, LOD), як-от Nanite, відстежувати свою геометрію з повною точністю. Більше не потрібно повертатися до проксі із низькою роздільною здатністю для ефектів трасування променів, що забезпечує нові рівні якості для тіней, відображень і непрямого освітлення.
Різні варіанти примітивів кривих зазвичай використовуються для зображення волосся, хутра, трави та інших «пасмоподібних» об’єктів. Для трасування променів ці примітиви, як правило, реалізуються в програмному забезпеченні за допомогою спеціальних шейдерів перетину. Проте перетин променевої кривої потребує інтенсивних обчислень, що обмежує використання кривих у рендерингу з трасуванням променів у реальному часі та збільшує час візуалізації для офлайн-рендерів.
Blackwell’s RT Core представляє апаратну підтримку перетину променів для нового примітиву під назвою Лінійні розгорнуті сфери (Linear Swept Spheres, LSS). LSS подібна до мозаїчної кривої, але побудована шляхом розгортання сфер у просторі лінійними сегментами. Радіуси сфер можуть відрізнятися між початковою та кінцевою точками кожного сегмента, що дозволяє гнучко апроксимувати різні типи ниток. Звичайні випадки використання, як-от візуалізація волосся на людях, LSS приблизно у 2 рази швидші, а для зберігання геометрії потрібно приблизно в 5 разів менше VRAM.
Зображення №8. Лінійні розгорнуті сфери (Linear Swept Spheres, LSS). Автор: Nvidia.
Процесор керування AI (AI Management Processor, AMP)
Процесор керування AI (AMP) — це повністю програмований планувальник контексту на графічному процесорі, призначений для розвантаження контекстів від CPU до GPU. AMP покращує планування контекстів GPU у Windows, щоб ефективніше керувати різними робочими навантаженнями, що виконуються на GPU. Контекст GPU інкапсулює всю інформацію про стан, необхідну GPU для виконання одного чи кількох завдань.
Кілька контекстів можна використовувати для забезпечення того, що кілька програм можуть одночасно використовувати GPU без конфліктів. Прикладом може бути координація та планування робочих навантажень асинхронної моделі штучного інтелекту, як-от NVIDIA Avatar Cloud Engine (ACE) із моделями мовлення, перекладу, бачення, анімації та поведінки, а також G-Assist, які працюють одночасно з іншими графічними робочими навантаженнями на GPU.
AMP реалізований за допомогою спеціального процесора RISC-V, розташованого на передній частині GPU, і забезпечує швидше планування контекстів графічного процесора з меншою затримкою, ніж попередні методи, керовані CPU.
Архітектура планування Blackwell AMP відповідає архітектурній моделі Microsoft, яка описує настроюване ядро планування на GPU за допомогою Aпаратно-Прискореного Графічного Планування Windows (Hardware-Accelerated GPU Scheduling, HAGS). Він представлений ще в Windows 10 (Оновлення від Травня 2020 р.!). HAGS дозволяє графічному процесору ефективніше керувати власною пам’яттю, зменшуючи затримку та потенційно покращуючи продуктивність в іграх та інших додатках, які інтенсивно працюють із графікою.
Зображення №9. AMP планує роботу різних задач. Автор: Nvidia.
Роль AMP полягає в тому, щоб взяти на себе відповідальність за планування завдань GPU, зменшуючи залежність від CPU, який часто є вузьким місцем для продуктивності гри. Насправді дозволивши GPU керувати власною чергою завдань, можна зменшити затримку через менший зворотний зв’язок між графічним і центральним процесором. Це забезпечує більш плавну частоту кадрів в іграх і кращу багатозадачність у Windows, оскільки CPU менш навантажений.
Deep Learning Super Sampling 4
І тут потрібно зробити поправку. Зараз NVIDIA використовує під назвою DLSS кілька технологій. А саме:
DLSS (Deep Learning Super Sampling) – масштабування зображення з меншої роздільності в потрібну користувачеві;
MFG (Multi Frame Generation) – той самий генератор додаткових кадрів між реальними;
RR (Ray Reconstruction) – покращення роботи трасування променів;
SR (Super Resolution) – також масштабування зображення;
Тому доречніше замінити слово Sampling (Семплінг/Відбір) в DLSS на Services (Сервіси). Так буде значно зрозуміліше, як на мене.
Зображення №10. Підтримка нових технологій у різних RTX серіях. Автор: Nvidia.
А для тих, кому далі ліньки читати, NVIDIA підготувала спеціальне відео:
DLSS 4 Multi Frame Generation
Технологія генерації кадрів була вперше представлена в архітектурі Ada у 2022 році. Один кадр був згенерований між кожною парою традиційно відтворених кадрів за допомогою поля оптичного потоку разом з векторами руху гри та мережею AI. Архітектура Blackwell дає змогу DLSS Multi Frame Generation підвищувати FPS, генеруючи до трьох додаткових кадрів на кожен традиційно візуалізований кадр.
Нова модель для генерації кадрів на 40% швидша, використовує на 30% менше відеопам’яті та потребує лише одного запуску для відтвореного кадру, щоб створити кілька кадрів. Генерацію поля оптичного потоку було прискорено завдяки заміні апаратного оптичного потоку дуже ефективною моделлю AI.
Зображення №11. Приклад роботи MFG. Автор: Nvidia.
Моделі Transformer в DLSS 4
DLSS переходить на абсолютно нову архітектуру нейронної мережі, і це приносить багато переваг. Здатність штучного інтелекту класифікувати зображення стала революційною завдяки технології, що називається Згортковою Нейронною Мережею (Convolutional Neural Network, CNN). CNN працюють шляхом локальної генерації пікселів і аналізу даних у формі дерева від нижчого рівня до вищого.
DLSS 4 покращує якість зображення та плавність рендерингу, впроваджуючи потужніші моделі штучного інтелекту на основі Transformer для DLSS Super Resolution, DLSS Ray Reconstruction і Deep Learning Anti-Aliasing (DLAA), навчені суперкомп’ютерами NVIDIA для кращого розуміння та відтворення складних сцен.
Нейронні мережі, які використовують архітектуру Transformer, чудово справляються із завданнями, пов’язаними з послідовними та структурованими даними. Ідея моделей Transformer полягає в тому, що увагу до того, як витрачаються обчислення та як вони аналізуються, мають керувати самі дані, тому нейронна мережа повинна навчитися спрямовувати свою увагу, щоб дивитися на частини даних, які є найцікавішими чи корисними для прийняття рішень.
Transformer також ефективніше масштабується, дозволяючи моделям, які використовуються для DLSS 4, отримувати вдвічі більше параметрів, а також використовувати більше процесорної потужності тензорних ядер для реконструкції зображень із ще кращою якістю для всіх власників RTX.
Результатом цього стає покращена стабільність від одного кадру до іншого, покращена деталізація освітлення та більше деталей у русі. Зміна архітектури нейронної мережі з CNN на Transformer призвела до значного підвищення якості зображення в багатьох сценаріях.
DLSS Super Resolution (SR)
SR підвищує продуктивність, використовуючи штучний інтелект для виведення кадрів вищої роздільної здатності з нижчої. DLSS відбирає кілька зображень з нижчою роздільною здатністю та використовує дані руху та зворотний зв’язок із попередніх кадрів для створення високоякісних зображень. Кінцевий продукт моделі Transformer є стабільнішим у часі з меншою кількістю ореолів, більшою деталізацією зображення в русі та покращеним згладжуванням порівняно з попередніми версіями DLSS.
Зображення №12. Приклад роботи Super Resolution. Автор: Nvidia.
DLSS Ray Reconstraction (RR)
RR покращує якість зображення за допомогою штучного інтелекту для створення додаткових пікселів для інтенсивних сцен із трасуванням променів. DLSS замінює налаштовані вручну «шумопоглиначі» мережею штучного інтелекту, навченою суперкомп’ютером NVIDIA, яка генерує пікселі вищої якості між вибірковими променями. У інтенсивному контенті з трасуванням променів модель Transformer для RR отримує ще більше підвищення якості, особливо для сцен зі складним освітленням. Фактично, усі звичайні артефакти типових «шумопоглиначів» значно зменшені.
Зображення №13. Приклад роботи Ray Reconstruction. Автор: Nvidia.
Deep Learning Anti-Aliasing (DLAA)
DLAA забезпечує вищу якість зображення за допомогою технології згладжування на основі штучного інтелекту. DLAA використовує ту саму технологію Super Resolution, розроблену для DLSS, створюючи більш реалістичне високоякісне зображення з оригінальною роздільною здатністю.
Як бачимо, попри те, що технологічно зміни між Ada Lovelace та GeForce RTX 5000 Blackwell не є кардинальними, проте весь акцент поставлено на суттєві архітектурні зміни з наголосом на технології штучного інтелекту.
Стаття підготовлена на основі на основі офіційних матеріалів: NVIDIA.
Не забудьте почитати редакційні огляди від ITC.ua про найкращих представників покоління Blackwell:
Favbet Tech – це ІТ-компанія зі 100% українською ДНК, що створює досконалі сервіси для iGaming і Betting з використанням передових технологій та надає доступ до них. Favbet Tech розробляє інноваційне програмне забезпечення через складну багатокомпонентну платформу, яка здатна витримувати величезні навантаження та створювати унікальний досвід для гравців.