64bitová Nvidia Tegra K1 se představuje

Nvidia více poodhalila hlavní technologické vychytávky v Tegra K1-64. Nejde jen o šířku sběrnice, bude výrazně rychlejší.

Projekt Denver poprvé Nvidia představila v lednu 2011. Za tímto kódovým označením se skrývá 64bitový ARM procesor a byť se postupem času měnily cílové produkty a vlastnosti, letos Nvidia Denver oficiálně představila jako 64bitovou variantu čipu Tegra K1.

418500672
Už z půdorysu je vidět, že 64bitové jádro zabírá více místa. Proto se do čipu vešly jen dvě

Zatímco Tegra K1 se už v produktech objevuje, 64bitová verze na své uvedení na trh ještě čeká. Před třemi lety vypadal 64bitový ARM jako něco úžasného, ale už loňský čip A7 od Apple má podporu 64bitů. Letos oznámil 64bitový procesor i Mediatek, vyhlášený levnými čipy. Může tedy Nvidia ještě něčím zaujmout?

Zatímco dříve Nvidia licencovala hotová jádra A15 (čtyři jsou nyní v Tegra K1), u Tegry K1-64 nelicencovala 64bitové jádro ARM A57. Sáhla po náročnější licenci ARM v8 ISA, kdy si celý návrh udělala sama a jen musela splnit instrukční kompatibilitu s ARMv8. To Nvidii rozvázalo ruce a mohla více optimalizovat výkon a spotřebu. Právě kvůli spotřebě je ostatně v čipech Tegra 4 a Tegra K1 kromě čtyř A15 jader ještě jedno úsporné na období klidu. To pro Denver už nebylo třeba.

Tegra K1-64 obsahuje dvě jádra Denver a 192 CUDA procesorů. Marketing se už u Tegry K1 soustředí na 192 jader a těch 5 pro CPU ignoruje, proto nebude v prospektech tak vadit, že výkonnější procesor má méně jader než ten 32bitový.

64 bitů přitom u Nvidie neznamená jen větší množství dostupné paměti. Ostatně na 4GB strop pro 32bitů si už pomalu tablety a telefony začínají sahat. Rychlejší je i samotné zpracování instrukcí. Jádro Denver je schopné zpracovat současně až sedm instrukcí v jednom taktu, 32bitové jádro A15 a 64bitové jádro A57 jen tři.

298921050
Během zpracování instrukcí se rovnou prohánějí optimalizací pro pozdější využití

Samozřejmě ale takové souběžné zpracování je náročné na optimalizaci. Nvidia zvolila netradiční přístup průběžné optimalizace zpracovávaného kódu. Obecně se procesory dělí podle zpracování instrukcí na in-order (tak jak jdou instrukce za sebou) a out-of-order (instrukce se mohou zpracovávat i mimo zadané pořadí, pokud se neovlivňují). In-order je jednodušší na plochu čipu a spotřebu, out-of-order je výkonnější. Tradičně jsou tedy in-order obvykle mobilní čipy a out-of-order desktopové procesory. Speciální optimalizací ale Denver používá in-order řešení s výkonem blízkým out-of-order procesorům.

927419093
Když se najde už optimalizovaná verze kódu, vytáhne se z mezipaměti

Denver totiž neustále analyzuje přicházející instrukce a optimalizuje je do rychlejší podoby. Může pro to vyhradit rovnou celé jádro u jednovláknových aplikací, případně část cyklů, když jedou naplno obě jádra. V operační paměti si vyhradí 128 MB cache pro optimalizované kusy kódu a pokud se tedy nějaký kód opakuje, vytáhne si jeho optimalizovanou podobu z paměti. Kromě toho je přímo na čipu ještě 128 kB cache na instrukce, aby se nemuselo stále hledat v pomalejší hlavní paměti.

Procesor je tedy typu in-order, ale upravuje si sám přicházející instrukce, včetně jejich případného přeskládání, aby se co nejvíce využívalo 7 současných instrukcí. Programátoři přitom nemusejí nic řešit. Celý systém jede v uzavřeném stavu a z vnějšku se chová procesor zcela standardně.

Nvidia zveřejnila pár základních testů srovnávajících Tegru K1-64 s 32bitovou verzí a několika dalšími procesory. Byť nejde o nezávislé testy, nestydí se Nvidia přiznat slabší výkon oproti konkurenci. Vidíme tak, že se výkon Tegry K1-64 blíží procesoru Celeron 2955U s jádrem Haswell a vždy je rychlejší než Apple A7. Apple samozřejmě za měsíc v iPhone 6 představí procesor A8 a čeká se opět podstatný nárůst výkonu.

218503812
Zatímco Haswell je vždy rychlejší než 32bitová verze, u Tegry K1-64 to tak jednoznačné není

Kromě výkonu bude mít Denver i zajímavou spotřebu. Díky vlastnímu návrhu mohla Nvidia zabudovat nový úsporný stav, který uchovává registry a stavové informace a přitom je téměř tak úsporný jako odpojení napájení do částí procesoru. Samozřejmě tady budeme ale muset počkat na finální produkty.

128545339
Zelená linka ukazuje nové řešení. Modré vypnutí napájení je pomalejší kvůli nutnému úklidu dat před vypnutím napájení a tedy jejich ochraně

Nvidia nyní začíná Tegru K1-64 dodávat formou vzorků výrobcům, unikly informace o tabletech Google Nexus 9 a HTC T1, které by měly tento procesor obsahovat. Na trh by měly přijít koncem roku. Už nyní je ale jasné, že procesorový výkon bude u 64bitové varianty Tegry K1 opravdu zajímavý. 

Zdroj: Nvidia, Tirias Research

Diskuze (8) Další článek: Athos Gear: Tričko a trenky do posilovny plné senzorů

Témata článku: , , , , , , , , , , , ,