Bom, antes de começar a explicar os detalhes de como fazer funcionar, eu vou passar pelo contexto do problema. Se você quer programar aplicações paralelas utilizando a sua placa de vídeo nVidia precisará do CUDA Toolkit, mas além disso precisará também do driver de vídeo mais atualizado para o seu sistema (isso pode ser conseguido na mesma página do link que eu coloquei). Também pode ser uma ótima ideia baixar o GPU Computing SDK que tem vários exemplos de aplicações prontas (também no mesmo link).
Começa então o drama (no caso do Linux, não tentei fazer isso no Windows). No meu caso estou trabalhando em uma máquina que tem o OpenSuse11.4 que é uma distribuição apoiada pela Novell e da qual eu gosto muito (a versão mais atual do OpenSuse é a 12..1 e o que eu vou descrever aqui deve funcionar nela também, mas não sei quando vou poder testar).
Nas versões mais recentes do Linux você encontrará o gcc 4.5 ou 4.6, mas o CUDA 4.x só é compatível com o gcc 4.4. Até aí tudo bem, você pode pensar em desinstalar o gcc atual da sua distribuição e instalar o antigo, só que isso implica em diversas depenências e basicamente quebra o seu sistema todo. A outra saída seria usar uma versão mais antiga do sistema como um todo que já viesse com o gcc 4.4, neste caso podemos pensar no OpenSuse 11.2 que inclusive...
Leia mais...