win10(GetForce GTX 1650 Ti)+cuda11.0.228+cudnn-x64-v8.0.2.39+Tensorflow-gpu2.4.1+Pytorch1.8.1(三)

在裝tensorflow-gpu之前,很重要的一點,一定要充分了解自己的電腦,再去安裝!不然後面會踩很多坑!
我的電腦是win10-64位、GetForce GTX 1650 Ti,以及anaconda環境的Python3.8(當然python不合適還可以換)。了解自己的顯卡特別重要!
然後再去安裝適合自己電腦的cuda和cudnn。

此處需要首先確認了自己的顯卡是否支援cuda,這個可以透過在NVIDIA:Your GPU Compute Capability查到,先找到對應系列,再去系列下面找型號,如果有就表示支援。但我沒有找到我的1650Ti,聽說是因為官網沒更新。此時有大佬說可以透過軟體GPU-Z來檢視是否支援CUDA以及算力的情況(但是我沒嘗試)。後來自己實踐,確定1650Ti是可以安裝cuda的。

由於我對硬體懂得不多,所以以下可能有些專業辭彙不太恰當,主要紀錄本人的安裝過程。

第一步:檢視配置
關於自己電腦顯卡的配置,是透過搜尋自己購買電腦官網得知的,自己是GetForce GTX 1650 Ti。然後發現自己有一個軟體叫:NVIDIA GetForce。這個是對應我自己的顯卡驅動軟體,一般都是開著的。

右鍵點選,開啟它的控制面板->系統訊息:

檢視套件,找到cuda的支援版本。

這裡還有一種方法是:在cmd里輸入:
nvidia-smi
可以看到:你的Gpu訊息和gpu使用情況(這樣應該也呢個確定你可以安裝cuda)。重點看第一行,有cuda version。這個不代表已經安裝了cuda,而是表示可以安裝cuda的最高版本!!這也是和上圖對應的。

第二步:安裝cuda
確定可以安裝的cuda之後,我們再來看tensorflow-gpu這張版本對應表。
可以發現 tensorflow CUDA cuDNN Python VS這五個是一連串的對應關係
其中前四個的對應關係(一定)要弄對。vs2015和2017都行?vs電腦貌似自帶?反正我沒有下載。


因為,我是Python3.8的,然後我查到,正好我能安裝到cuda11.0,所以我後面就下載了cuda11.0.228+cudnn-x64-v8.0.2.39。但是我最後裝的tensorflow-gpu實際是2.4.1的。emmm具體為啥不是2.3.0,就很「碰巧」的裝了2.4.1對了,然後2.3.0當時因為一個Bug測試不對,後來就解除安裝了,不過後來發現bug不是版本問題,但是也懶得嘗試2.3.0了。不過我的電腦裝的2.4.1也是可以執行的哦。

(看了很多教學,一直感覺版本安裝的其實越高越不好,好像Pytorch之前都不支援coda11.0來著,不過現在是支援了)
然後,可以從自己電腦支援的CUDA入手 在表格中搜尋適合自己的配置,然後依次進行安裝。
cuda Toolkit安裝地址:https://developer.nvidia.com/cuda-downloads
cuda安裝的還挺慢的,他讓自己定cuda的安裝位置,But!最後不知道什麼原因他還是給我裝進了C盤。我看有小夥伴一度安裝完之後,沒有找到cuda的位置。安裝過程如下:
這裡,我看大佬都是選擇的自定義,因為後面有一個外掛不安裝,因為聽說安了總會出錯,第一個「精簡」其實選了也沒錯,就是全部給你安了(emmm在這裡,我選擇的是「精簡」,也就是全安了,也沒有報錯,為啥選精簡,因為當時以為真的「精簡」,後來發現是「all」)


如果選擇:自定義,那麼按照大佬們的教學是:


安裝完畢後,檢視環境變數,會發現:
cuda已經在了

此時,cmd里檢視版本訊息nvcc --version

成功。
如果你找不到你的cuda安那裡了。
cmd裡面:where nvcc

就找到你的cuda到哪了。

第三步,安裝cudnn.
cudnn安裝:https://developer.nvidia.com/rdp/cudnn-archive
按照剛才的tf表格,找到對應的cudnn!下載,解壓。(安裝到哪都無所謂,你找的到就行)
把cudnn中的這三個目錄,複製下來。

複製到cuda目錄下:

然後在Path中新增4個路徑:

1
2
3
4
5
6
7
C:Program FilesNVIDIA GPU Computing ToolkitCUDAv9.0

C:Program FilesNVIDIA GPU Computing ToolkitCUDAv9.0in

C:Program FilesNVIDIA GPU Computing ToolkitCUDAv9.0libx64

C:Program FilesNVIDIA GPU Computing ToolkitCUDAv9.0libnvvp

(這裡copy別的大佬裡面的,請對照自己的新增!)

然後,cmd進入到你的demo下:
(我的是:cd C:Program FilesNVIDIA GPU Computing ToolkitCUDAv11.0extrasdemo_suite)
執行
deviceQuery.exe
bandwidthTest.exe


如果兩個都pass,那麼cuda以及cudnn都安裝成功啦~


貌似感覺這一切都很順利,然鵝,cuda和cudnn雖然安裝完畢,令人抓狂就是在於安裝之後,安裝tensorflow-gpu卻發現自己始終沒有使用到gpu執行tf。後面開始填坑之路,但願大家沒有遇到這些錯誤,如果遇到了,請對照解埋坑(還有一些坑,遇到了,可能忘了怎麼填了,也可能留下來暫時也沒找到填坑方法,歡迎指正~)
下一節講如何安裝tensorflow-gpu,以及如何看是否是在gpu上執行的。