Como parte do trabalho de habilitação do compilador da Intel para CPUs Sierra Forest e Grand Ridge, o suporte para x86_64 AVX-NE-CONVERT é o recurso mais recente sendo mesclado no GCC Git a tempo para o GCC 13. Então, o compilador GCC 13 mescla suporte para Intel AVX-NE-CONVERT.

Tabela de conteúdo

Compilador GCC 13 mescla suporte para Intel AVX-NE-CONVERT RADV PLOC BVH Builder mesclado para rastreamento de raios Radeon Vulkan mais rápido

Os engenheiros de compiladores da Intel estiveram ocupados recentemente iniciando o trabalho de habilitação para novos recursos de conjunto de instruções para processadores de próxima geração, de Meteor Lake a Sierra Forest. Isso também está acontecendo no lado do LLVM, além da GNU Compiler Collection, amplamente usada em sistemas Linux.

A partir desta manhã, o Intel AVX-NE-CONVERT é o mais novo recurso que foi mesclado no GCC 13 pelo engenheiro da Intel Lingling Kong. Como parte disso, a opção “-mavxneconvert” é adicionada ao GCC para habilitar a funcionalidade para habilitar instruções AVXNECONVERT enquanto ele será ativado automaticamente com as próximas opções “-march=” para essas CPUs Intel de próxima geração.

Compilador GCC 13 mescla suporte para Intel AVX-NE-CONVERT

O manual de referência de programação da Intel deste mês delineou o AVX-NE-CONVERT juntamente com outras novas instruções para Sierra Forest e Grand Ridge. O AVX-NE-CONVERT permite converter BF16 para FP32, FP16 para FP32 e valores de ponto flutuante de precisão simples para BF16. Todos os detalhes do AVX-NE-CONVERT são descritos na íntegra por meio da atualização mais recente do PRM.

A plataforma Grand Ridge da Intel será de até 24 núcleos Atom SoCs, enquanto o Sierra Forest é para os processadores de servidor Xeon somente de núcleo E de primeira geração. Essas CPUs E-core não possuem o AVX-512, mas pelo menos adicionam várias novas instruções para melhorar seu desempenho geral.

RADV PLOC BVH Builder mesclado para rastreamento de raios Radeon Vulkan mais rápido

O driver Radeon Vulkan da Mesa “RADV” vem desfrutando de muitas otimizações de desempenho e outras melhorias nos últimos meses em torno de seus recursos de rastreamento de raios. A fusão de hoje é outra otimização significativa para melhorar o suporte ao rastreamento de raios Radeon Vulkan e nos próximos dias antes do anúncio RDNA3 da AMD.

Na semana passada, escrevi sobre uma nova solicitação de mesclagem para o construtor PLOC BVH e esse é o código agora mesclado a tempo para o Mesa 22.3. Embora o “construtor PLOC BVH” possa não parecer empolgante, para os jogadores pode significar melhorias significativas no desempenho do Vulkan RT – como o Quake II RTX sendo cerca de 33% mais rápido em uma Radeon RX 6700 XT.

Friedrich Vock e Bas Nieuwenhuizen criaram esse suporte para PLOC (Parallel Locally-Ordered Clustering) para construir nós de hierarquia de volume (BVHs) delimitadores. Este trabalho foi parcialmente inspirado pela biblioteca de rastreamento de raios “GPURT” de código aberto da AMD. O Quake II RTX deve ter um desempenho muito melhor com esse código agora mesclado, bem como várias demos NVIDIA Vulkan. Mas títulos como o jogo Control tiveram apenas algumas melhorias no FPS.

Com Mesa 22.3 esperado para ser ramificado nos próximos dias, eu terei novos benchmarks de driver Mesa OpenGL/Vulkan no Phoronix logo em seguida para ver os ganhos sobre a série estável de 22,2 do último trimestre. Depois que o Mesa 22.3 for ramificado e congelado, a versão estável será lançada algumas semanas depois com essas melhorias do RADV Vulkan e uma variedade de outras melhorias sobre as quais escrevi nos últimos três meses.