Questão 4142173

4142173 Ano: 2025
Disciplina: TI - Desenvolvimento de Sistemas
Banca: ITA
Orgão: ITA

Provas:

Tecnologista - TL-05
Provas ×

Na programação com aceleradores, usando CUDA, por exemplo, é comum que se utilize um modelo SIMT, em que os núcleos de processamento do acelerador sejam usados para executar o mesmo código sobre partes distintas dos dados. Considerando o trecho de código a seguir, que é parte de uma soma de vetores, indique a alternativa CORRETA:

#define N (1<<20)
...

__global__
void add(int n, float *x, float *y) {
int index = blockIdx.x * blockDim.x + threadIdx.x;
int stride = blockDim.x * gridDim.x;

for (int i = index; i < n; i += stride)
y[i] = x[i] + y[i];
}
...
main() {

. . .

int blockSize = 256;
int numBlocks = (N + blockSize - 1) / blockSize;

add <<< numBlocks, blockSize >>> (N, x, y);
...
}

Os índices das threads, passados como parâmetros na invocação de um kernel, indicam qual elemento cada thread deve manipular.

A organização da grade de blocos de threads, realizada na invocação de um kernel, fixa a execução das threads aos blocos multiprocessadores (SMs) da GPU.

A organização das grades de blocos de threads para execução pode ser realizada em uma, duas ou três dimensões, que têm igual impacto no desempenho do programa.

Pelo cálculo dos índices das threads, é possível que existam threads que não devem realizar a manipulação dos dados, pois extrapolariam o número de elementos nas estruturas particionadas.

Cada thread será responsável pelo cálculo de 1 elemento do vetor resultante, associado ao número do bloco multiprocessador (Stream Multiprocessor - SM) em que essa thread é executada.

Provas

Questão presente nas seguintes provas

Tecnologista - TL-05

25 Questões

Provas

Tecnologista - TL-05

Acesse sua Conta

Crie uma Conta