实例介绍
《GPU高性能计算之CUDA》书中实例源代码,经调试正常。GPU高性能计算系列丛书的第一本《GPU高性能计算之CUDA》已经出版,由张舒,褚艳利,赵开勇,张钰勃所编写。GPU高性能运算之CUDA---源代码
【实例截图】
【核心代码】
gpu高性能运算之cuda_codes
└── GPU高性能运算之CUDA代码
├── bin
│ └── win32
│ └── debug
│ └── simpleCUBLAS.exe
└── 《GPU高性能运算之CUDA》-张舒-6543-源代码
├── ACsearch_DPPcompact_with_driver
│ ├── ACsearch.cu
│ ├── ACsearch.cu.cpp
│ ├── ACsearch.sln
│ ├── ACsearch.suo
│ ├── ACsearch.vcproj
│ ├── ACsearch_kernel.cu
│ ├── ACsearch_vc90.sln
│ ├── ACsearch_vc90.vcproj
│ ├── GPU_AC_Search.h
│ ├── Thumbs.db
│ ├── acsmx.c
│ ├── acsmx.h
│ ├── cudpp.h
│ ├── cudpp64.dll
│ ├── cutil.h
│ ├── cutil_inline.h
│ ├── data
│ │ └── lena_bw_out.pgm
│ ├── entry.c
│ └── test.txt
├── Bitonic
│ ├── bitonic.cu
│ ├── bitonic.sln
│ ├── bitonic.suo
│ ├── bitonic.vcproj
│ ├── bitonic_kernel.cu
│ ├── bitonic_vc90.sln
│ └── bitonic_vc90.vcproj
├── Readme.pdf
├── VectorAdd
│ ├── template.cu
│ ├── template.sln
│ ├── template.suo
│ ├── template.vcproj
│ ├── template_vc90.sln
│ └── template_vc90.vcproj
├── VectorAddDrv
│ ├── template.cu
│ ├── template.cubin
│ ├── template.sln
│ ├── template.suo
│ ├── template.vcproj
│ ├── template_vc90.sln
│ └── template_vc90.vcproj
├── asyncAPI
│ ├── asyncAPI.cu
│ ├── asyncAPI.sln
│ ├── asyncAPI.suo
│ ├── asyncAPI.vcproj
│ ├── asyncAPI_vc90.sln
│ └── asyncAPI_vc90.vcproj
├── bandwidthTest
│ ├── bandwidthTest.cu
│ ├── bandwidthTest.sln
│ ├── bandwidthTest.suo
│ ├── bandwidthTest_vc90.sln
│ └── bandwidthTest_vc90.vcproj
├── conjugateGradient
│ ├── template.cu
│ ├── template.sln
│ ├── template.suo
│ ├── template.vcproj
│ ├── template_vc90.sln
│ └── template_vc90.vcproj
├── cudaMPI
│ ├── MPICH.pdf
│ ├── MPI_1.bmp
│ ├── template.cu
│ ├── template.sln
│ ├── template.suo
│ ├── template.vcproj
│ ├── template_vc90.sln
│ └── template_vc90.vcproj
├── cudaOpenMP
│ ├── cudaOpenMP.cu
│ ├── cudaOpenMP.sln
│ ├── cudaOpenMP.vcproj
│ ├── cudaOpenMP_vc90.sln
│ ├── cudaOpenMP_vc90.vcproj
│ └── readme.txt
├── deviceQuery
│ ├── deviceQuery.cpp
│ ├── deviceQuery.sln
│ ├── deviceQuery.vcproj
│ ├── deviceQuery_vc90.sln
│ └── deviceQuery_vc90.vcproj
├── histKernel
│ ├── simpleAtomicIntrinsics.cu
│ ├── simpleAtomicIntrinsics.sln
│ ├── simpleAtomicIntrinsics.suo
│ ├── simpleAtomicIntrinsics.vcproj
│ ├── simpleAtomicIntrinsics_gold.cpp
│ ├── simpleAtomicIntrinsics_kernel.cu
│ ├── simpleAtomicIntrinsics_vc90.sln
│ └── simpleAtomicIntrinsics_vc90.vcproj
├── matrixAssign
│ ├── example_1.cu
│ ├── example_1_kernel.cu
│ ├── example_2.cu
│ ├── example_2_kernel.cu
│ ├── template.sln
│ ├── template.suo
│ ├── template.vcproj
│ ├── template_vc7.sln
│ ├── template_vc7.suo
│ └── template_vc7.vcproj
├── matrixMul
│ ├── matrixMul.cu
│ ├── matrixMul.h
│ ├── matrixMul.sln
│ ├── matrixMul.suo
│ ├── matrixMul.vcproj
│ ├── matrixMul_gold.cpp
│ ├── matrixMul_kernel.cu
│ ├── matrixMul_vc90.sln
│ └── matrixMul_vc90.vcproj
├── matrixMul_Berkeley
│ ├── License.txt
│ ├── dgemmN.cu
│ ├── dgemmN.sln
│ ├── dgemmN.suo
│ └── dgemmN.vcproj
├── reduction
│ ├── doc
│ │ └── reduction.pdf
│ ├── reduction.cu
│ ├── reduction.h
│ ├── reduction.sln
│ ├── reduction.vcproj
│ ├── reduction_kernel.cu
│ ├── reduction_kernel_sm10.cu
│ ├── reduction_kernel_sm13.cu
│ ├── reduction_vc90.sln
│ ├── reduction_vc90.vcproj
│ └── sharedmem.cuh
├── scan
│ ├── doc
│ │ └── scan.pdf
│ ├── scan.cu
│ ├── scan.sln
│ ├── scan.suo
│ ├── scan.vcproj
│ ├── scan_best_kernel.cu
│ ├── scan_gold.cpp
│ ├── scan_naive_kernel.cu
│ ├── scan_vc90.sln
│ ├── scan_vc90.vcproj
│ └── scan_workefficient_kernel.cu
├── scanLargeArray
│ ├── scan.cu
│ ├── scanLargeArray.cu
│ ├── scanLargeArray.sln
│ ├── scanLargeArray.vcproj
│ ├── scanLargeArray_kernel.cu
│ ├── scanLargeArray_vc90.sln
│ ├── scanLargeArray_vc90.vcproj
│ └── scan_gold.cpp
├── simpleCUBLAS
│ ├── Debug
│ │ ├── BuildLog.htm
│ │ ├── mt.dep
│ │ ├── simpleCUBLAS.exe.intermediate.manifest
│ │ ├── simpleCUBLAS.obj
│ │ ├── simpleCUBLAS.pdb
│ │ ├── vc80.idb
│ │ └── vc80.pdb
│ ├── simpleCUBLAS.c
│ ├── simpleCUBLAS.ncb
│ ├── simpleCUBLAS.sln
│ ├── simpleCUBLAS.suo
│ ├── simpleCUBLAS.vcproj
│ ├── simpleCUBLAS.vcproj.X8355L156E2RG78.Administrator.user
│ ├── simpleCUBLAS_vc90.sln
│ └── simpleCUBLAS_vc90.vcproj
├── simpleCUFFT
│ ├── simpleCUFFT.cu
│ ├── simpleCUFFT.sln
│ ├── simpleCUFFT.vcproj
│ ├── simpleCUFFT_vc90.sln
│ └── simpleCUFFT_vc90.vcproj
├── simpleD3D10
│ ├── data
│ │ └── ref_simpleD3D10.ppm
│ ├── simpleD3D10.cpp
│ ├── simpleD3D10.sln
│ ├── simpleD3D10.vcproj
│ ├── simpleD3D10_kernel.cu
│ ├── simpleD3D10_vc90.sln
│ └── simpleD3D10_vc90.vcproj
├── simpleD3D9
│ ├── data
│ │ └── ref_simpleD3D9.ppm
│ ├── doc
│ │ ├── sshot_lg.JPG
│ │ ├── sshot_md.JPG
│ │ └── sshot_sm.JPG
│ ├── simpleD3D9.cpp
│ ├── simpleD3D9.sln
│ ├── simpleD3D9.vcproj
│ ├── simpleD3D9_kernel.cu
│ ├── simpleD3D9_vc90.sln
│ └── simpleD3D9_vc90.vcproj
├── simpleGL
│ ├── data
│ │ ├── ref_simpleGL.bin
│ │ └── ref_simpleGL.ppm
│ ├── doc
│ │ ├── Thumbs.db
│ │ ├── sshot_lg.JPG
│ │ ├── sshot_md.JPG
│ │ └── sshot_sm.JPG
│ ├── simpleGL.cpp
│ ├── simpleGL.sln
│ ├── simpleGL.vcproj
│ ├── simpleGL_kernel.cu
│ ├── simpleGL_vc90.sln
│ └── simpleGL_vc90.vcproj
├── simpleMultiGPU
│ ├── simpleMultiGPU.cpp
│ ├── simpleMultiGPU.h
│ ├── simpleMultiGPU.sln
│ ├── simpleMultiGPU.vcproj
│ ├── simpleMultiGPU_kernel.cu
│ ├── simpleMultiGPU_vc90.sln
│ └── simpleMultiGPU_vc90.vcproj
├── simpleStreams
│ ├── simpleStreams.cu
│ ├── simpleStreams.sln
│ ├── simpleStreams.vcproj
│ ├── simpleStreams_vc90.sln
│ └── simpleStreams_vc90.vcproj
├── simpleTexture
│ ├── data
│ │ ├── lena_bw.pgm
│ │ ├── lena_bw_out.pgm
│ │ └── ref_rotated.pgm
│ ├── simpleTexture.cu
│ ├── simpleTexture.sln
│ ├── simpleTexture.suo
│ ├── simpleTexture.vcproj
│ ├── simpleTexture_kernel.cu
│ ├── simpleTexture_vc90.sln
│ └── simpleTexture_vc90.vcproj
├── simpleTextureDrv
│ ├── data
│ │ ├── lena_bw.pgm
│ │ ├── lena_bw_out.pgm
│ │ ├── ref_rotated.pgm
│ │ ├── simpleTexture_kernel.cubin
│ │ └── simpleTexture_kernel.ptx
│ ├── simpleTextureDrv.cpp
│ ├── simpleTextureDrv.sln
│ ├── simpleTextureDrv.suo
│ ├── simpleTextureDrv.vcproj
│ ├── simpleTextureDrv_vc90.sln
│ ├── simpleTextureDrv_vc90.vcproj
│ └── simpleTexture_kernel.cu
├── sortingNetworks
│ ├── bitonicSort.cu
│ ├── main.cpp
│ ├── oddEvenMergeSort.cu
│ ├── sortingNetworks.sln
│ ├── sortingNetworks.suo
│ ├── sortingNetworks.vcproj
│ ├── sortingNetworks_common.cuh
│ ├── sortingNetworks_common.h
│ ├── sortingNetworks_validate.cpp
│ ├── sortingNetworks_vc90.sln
│ └── sortingNetworks_vc90.vcproj
├── threadMigration
│ ├── threadMigration.cpp
│ ├── threadMigration.cu
│ ├── threadMigration.sln
│ ├── threadMigration.vcproj
│ ├── threadMigration_vc90.sln
│ └── threadMigration_vc90.vcproj
├── timing
│ ├── clock_kernel.cu
│ ├── template.cu
│ ├── template.sln
│ ├── template.suo
│ ├── template.vcproj
│ ├── template_gold.cpp
│ ├── template_vc90.sln
│ └── template_vc90.vcproj
├── transpose
│ ├── transpose.cu
│ ├── transpose.sln
│ ├── transpose.suo
│ ├── transpose.vcproj
│ ├── transpose_gold.cpp
│ ├── transpose_kernel.cu
│ ├── transpose_vc90.sln
│ └── transpose_vc90.vcproj
└── transposeDiagonal
├── transpose.cu
├── transpose.sln
├── transpose.suo
├── transpose.vcproj
├── transpose_gold.cpp
├── transpose_kernel.cu
├── transpose_vc90.sln
└── transpose_vc90.vcproj
47 directories, 263 files
标签:
小贴士
感谢您为本站写下的评论,您的评论对其它用户来说具有重要的参考价值,所以请认真填写。
- 类似“顶”、“沙发”之类没有营养的文字,对勤劳贡献的楼主来说是令人沮丧的反馈信息。
- 相信您也不想看到一排文字/表情墙,所以请不要反馈意义不大的重复字符,也请尽量不要纯表情的回复。
- 提问之前请再仔细看一遍楼主的说明,或许是您遗漏了。
- 请勿到处挖坑绊人、招贴广告。既占空间让人厌烦,又没人会搭理,于人于己都无利。
关于好例子网
本站旨在为广大IT学习爱好者提供一个非营利性互相学习交流分享平台。本站所有资源都可以被免费获取学习研究。本站资源来自网友分享,对搜索内容的合法性不具有预见性、识别性、控制性,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,平台无法对用户传输的作品、信息、内容的权属或合法性、安全性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论平台是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二与二十三条之规定,若资源存在侵权或相关问题请联系本站客服人员,点此联系我们。关于更多版权及免责申明参见 版权及免责申明
网友评论
我要评论