国产视频一区二区在线观看,精品久久av,国产精品婷婷

天堂av免费 I av无码小缝喷白浆在线观看 I 欧美日韩一区在线播放 I 污黄瓜视频 I 色av色 I 亚洲加勒比少妇无码av I 久久人人97超碰国产精品 I 黑料网址成人免费观看 I 色鬼三级在线播放 I 2019久久久最新精品 I 国产成a人片在线观看视频 I 伊人精品久久久久中文字幕 I 日韩中出 I 亚洲第一欧美 I 火辣日本少妇 I 国产97av I 亚洲浮力影院 I 国产亚洲精品自在久久蜜tv I 黄色网址av I www.欧美色图.com I 碰碰精品 I 五月综合激情网 I 黄色片在线免费 I 精品久久久久久久久久ntr影视 I 日本黄色绿像 I 免费视频久久久久久久 I 久草在线视频看看 I 中文字幕国产在线观看 I 性色欲情网站iwww九文堂 I 偷拍对白清晰情侣视频 I 国产老头和老头xxxxx免费 I 麻豆精品在线 I 国产精伦一区二区三区 I 91麻豆精品国产91 I 一区二区三区在线视频看

全部產品

熱門產品
域名
企業服務
云計算
云安全

熱門產品
- 域名注冊 HOT
- 云主機
- SSL證書 NEW
- 企業郵箱
- 云虛擬主機
- 備案
- 商標
- 企業建站
- 內容分發網絡CDN
- 云數據庫MySQL
域名
- 域名注冊
- 域名注冊
- 批量注冊標準版
- 域名轉入
- 域名交易
- 一口價域名
- 域名搶注
- 委托購買
- 增值服務
- 域名停放
- 域名注冊局
- 域名安全鎖
- 常用工具
- WHOIS信息查詢
- 域名推薦
企業服務
- 知識產權
- 商標
- - 商標服務
- - 商標查詢
- - 版權登記
- 企業郵箱
- 全球郵外貿版
- 全球郵標準版
- 全球郵初創版
- 郵件營銷
- - 云推送
- 企業建站
- 速成建站
- - 速成建站-標準版
- - 速成建站-高級版
- - 速成建站-尊貴版
- 企業云官網
- - 基礎版
- - 營銷專業版
- - 外貿專業版
- 源碼建站
- 標準版-單語
- 標準版-雙語同風格
- 定制開發
- 小程序
- 電商型小程序
- 生活服務型小程序
- 展示型小程序
- 備案
- ICP備案
- 備案管家
- 服務與支持
- 云專家服務
- 云代維服務
- 服務器遷移
云計算
- 云主機
- 國內云主機
- 香港云主機
- GPU云主機
- 云虛擬主機
- 通用虛擬主機
- 免備案虛擬主機
- 數據庫
- 云數據庫MySQL
- 云數據庫SQL server
- 存儲
- 對象存儲
- 網絡與CDN
- 負載均衡
- 內容分發網絡CDN
云安全
- SSL證書 NEW
- Web應用防火墻WAF
- 等保合規

新網 > 云服務器 > 正文

GPU云服務器深度學習性能模型初探

作者：新網
來源：新網
瀏覽：100
2018-04-26 16:40:05

本文根據實測數據初步探討了在彈性GPU云服務器上深度學習的性能模型，希望可以幫助大家科學選擇GPU實例的規格。得益于GPU強大的計算能力，深度學習近年來在圖像處理、語音識別、自然語言處理等領域取得了重大突GPU服務器幾乎成了深度學習加速的標配。

本文根據實測數據初步探討了在彈性GPU 云服務器上深度學習的性能模型，希望可以幫助大家科學選擇GPU實例的規格。

一、背景

得益于GPU強大的計算能力，深度學習近年來在圖像處理、語音識別、自然語言處理等領域取得了重大突GPU服務器幾乎成了深度學習加速的標配。

如何提供一個合適的實例規格，從而以最高的性價比提供給深度學習客戶，是我們需要考慮的一個問題，本文試圖從CPU、內存、磁盤這三個角度對單機GPU云服務器的深度學習訓練和預測的性能模型做了初步的分析，希望能對實例規格的選擇提供一個科學的設計模型。

下面是我們使用主流的學習框架在NVIDIA GPU上做的一些深度學習的測試。涉及NVCaffe、MXNet主流深度學習框架，測試了多個經典CNN網絡在圖像分類領域的訓練和推理以及RNN網絡在自然語言處理領域的訓練。

二、訓練測試

我們使用NVCaffe、MXNet主流深度學習框架測試了圖像分類領域和自然語言處理領域的訓練模型。

2.1 圖像分類

我們使用NVCaffe、MXNet測試了圖像分類領域的CNN網絡的單GPU模型訓練。

NVCaffe和MXNet測試使用ImageNet ILSVRC2012數據集，訓練圖片1281167張，包含1000個分類，每個分類包含1000張左右的圖片。

2.1.1 CPU+Memory

2.1.1.1 NVCaffe

NVCaffe是NVIDIA基于BVLC-Caffe針對NVIDIA GPU尤其是多GPU加速的開源深度學習框架。LMDB格式的ImageNet訓練集大小為240GB ，驗證集大小為9.4GB。

我們使用NVcaffe對AlexNet、GoogLeNet、ResNet50、Vgg16四種經典卷積神經網絡做了圖像分類任務的模型訓練測試。分別對比了不同vCPU和Memory配置下的訓練性能。性能數據單位是Images/Second(每秒處理的圖像張數)。圖中標注為10000指的是迭代次數10000次，其它都是測試迭代次數為1000次。

2.1.1.2 MXNet

MXNet的數據集使用RecordIO格式，ImageNet訓練集 93GB ，驗證集 3.7GB。

我們使用網絡Inception-v3(GoogLeNet的升級版)做了圖像分類的訓練測試。分別對比了不同vCPU和Memory配置下的訓練性能。數據單位是Samples/Second(每秒處理的圖像張數)。

2.1.2 磁盤IO

我們在阿里云GN5(P100)實例上使用NVCaffe測試了GoogLeNet網絡模型在NVMe SSD本地盤、SSD云盤和高效云盤上的訓練性能，測試結果如下(性能數據單位是Images/Second)：

2.2 自然語言處理

我們使用MXNet測試了RNN網絡的LSTM模型的訓練，使用PennTreeBank自然語言數據集。PennTreeBank數據集的文本語料庫包含近100萬個單詞，單詞表被限定在10000個單詞。分別對比了不同vCPU和Memory配置下的訓練性能：

三、推理測試

3.1 圖像分類

我們使用NVCaffe測試了圖像分類領域的CNN網絡的模型推理。

測試使用ImageNet ILSVRC2012數據集，驗證測試圖片 50000張。

3.1.1 CPU+Memory

我們使用NVcaffe對AlexNet、GoogLeNet、ResNet50、VGG16四種經典卷積神經網絡做了圖像分類的推理測試。分別對比了不同vCPU和Memory配置下的訓練性能。數據單位是Images/Second(每秒處理的圖像張數)。

3.1.2 磁盤IO

我們使用NVCaffe測試了GoogLeNet網絡在NVMe SSD本地盤、SSD云盤和高效云盤上的圖像分類推理性能，測試結果如下(數據單位是Images/Second)：

四、數據預處理測試

在訓練模型之前，往往要對訓練數據集做數據預處理，統一數據格式，并做一定的歸一化處理。

我們使用NVCaffe對ImageNet ILSVRC2012數據集做了數據預處理的測試，分別對比了NVMe SSD本地盤、SSD云盤和高效云盤的數據預處理時間，數據單位是秒，數據如下：

五、數據分析

5.1 訓練

5.1.1 圖像分類

從NVCaffe和MXNet的測試結果來看，圖像分類場景單純的訓練階段對CPU要求不高，單GPU 只需要4vCPU就可以。而內存需求則取決于深度學習框架、神經網絡類型和訓練數據集的大小：測試中發現NVCaffe隨著迭代次數的增多，內存是不斷增大的，但是內存需求增大到一定程度，對性能就不會有什么提升了，其中NVCaffe AlexNet網絡的訓練，相比其它網絡對于內存的消耗要大得多。相比之下MXNet的內存占用則要小的多(這也是MXNet的一大優勢)，93G預處理過的訓練數據集訓練過程中內存占用不到5G。

對于磁盤IO性能，測試顯示訓練階段NVMe SSD本地盤、SSD云盤性能基本接近，高效云盤上的性能略差1%。因此訓練階段對IO性能的要求不高。

5.1.2 自然語言處理

從MXNet的測試結果來看，對于PennTreeBank這樣規模的數據集，2vCPU 1GB Mem就能滿足訓練需求。由于自然語言處理的原始數據不像圖像分類一樣是大量高清圖片，自然語言處理的原始數據以文本文件為主，因此自然語言處理對內存和顯存的要求都不高，從我們的測試來看，4vCPU 30GB 1GPU規格基本滿足訓練階段需求。

5.2 推理

5.2.1 圖像分類

從NVCaffe的圖像分類推理測試來看，除AlexNet 2vCPU剛剛夠用外，其它網絡2vCPU對性能沒有影響，而9.4GB的驗證數據集推理過程中內存占用大概是7GB左右，因此對大部分模型來看，2vCPU 30GB 1GPU規格基本滿足圖像分類推理的性能需求。

對于磁盤IO性能，推理性能NVMe SSD本地盤、SSD云盤很接近，但高效云盤差15%。因此推理階段至少應該使用SSD云盤保證性能。

5.2.2 自然語言處理

對于自然語言處理，參考訓練性能需求，我們應該可以推測2vCPU 30GB 1GPU規格應該也能滿足需求。

5.3 數據預處理

從NVCaffe對ImageNet ILSVRC2012數據集做數據預處理的測試來看，數據預處理階段是IO密集型，NVMe SSD本地盤比SSD云盤快25%，而SSD云盤比高效云盤快10%。

六、總結

深度學習框架眾多，神經網絡類型也是種類繁多，我們選取了主流的框架和神經網絡類型，嘗試對單機GPU云服務器的深度學習性能模型做了初步的分析，結論是：

深度學習訓練階段是GPU運算密集型，對于CPU占用不大，而內存的需求取決于深度學習框架、神經網絡類型和訓練數據集的大小;對磁盤IO性能不敏感，云盤基本能夠滿足需求。

深度學習推理階段對于CPU的占用更小，但是對于磁盤IO性能相對較敏感，因為推理階段對于延遲有一定的要求，更高的磁盤IO性能對于降低數據讀取的延時進而降低整體延遲有很大的幫助。

深度學習數據預處理階段是IO密集型階段，更高的磁盤IO性能能夠大大縮短數據預處理的時間。

上一篇：Nginx、Apache的工作原理以及Nginx為何比Apac...

下一篇：五大原則教你選對數據庫服務器

免責聲明：本文內容由互聯網用戶自發貢獻自行上傳，本網站不擁有所有權，也不承認相關法律責任。如果您發現本社區中有涉嫌抄襲的內容，請發送郵件至：operations@xinnet.com進行舉報，并提供相關證據，一經查實，本站將立刻刪除涉嫌侵權內容。

域名管理	我要充值
未支付訂單	發票管理
安全退出	進入我的賬戶

全部產品

熱門產品

域名

企業服務

云計算

云安全

一元買熱門域名后綴

9折虛擬主機

注冊即送

GPU云服務器深度學習性能模型初探

相關文章

推薦閱讀

售前咨詢電話

售前咨詢

域名信息查詢（WHOIS）

售后咨詢 (7*24小時)

售前咨詢