为什么你应该选择gcp而不是阿里云


(George Zhang) #1

墙内的同学可能会有人在纠结云计算哪家强。最近看到讨论GCP和阿里云的同学比较多,所以就在下面做了个对比,以供参考。

假如GCP上面用Preemptible Instance的话,GPU的价格简直便宜到离谱。下面是最新的价目表

GPU Standard (Prices vary by location) Previous Preemptible (All Locations) New Preemptible (All Locations)
V100 $2.48 $1.24 $0.74
P100 $1.46 $0.73 $0.43
K80 $0.45 $0.22 $0.135

基础instance的价格相对于GPU基本可以忽略不计。我们选的类型是 n1-highmem-8 ,$0.12/h ,已经是52G内存,8 vCPU了。

按照2019/03/06的汇率算,GCP上面V100也就¥5.78/小时,P100更是只有¥3.69/小时。这年代小学生三线城市网吧上网都不止这个价钱了吧 :rofl:

下面是我查到的阿里云在张家口,相对来说应该已经是较便宜的一个节点的价目表:

毫不客气地说,GCP上面V100都比阿里云的P4便宜;而P100的算力差不多是P4的两倍,而V100差不多是P100的两倍。V100上假如能正确使用mixed-precision training的话,还可以提速近一倍,所以最后达到P4训练速度的6-8倍是很轻松的。更别提连外网的速度GCP上面要更快,下载数据集也更迅速。从价格方面来看,没有任何理由选择阿里云。


一些可能需要面对的挑战

唯一美中不足的是,倘若你是在使用Shadowsocks的话,GCP的本地CLI可能需要通过Proxifier或ProxyChain这些Networking工具才能够正常使用。当然,你依然可以顺畅地在浏览器中使用GCP的Cloud Shell来创建新instance和通过ssh对接Jupyter Notebook。更方便的是,GCP的Deep Learning VM目前已经加入了通过GCP的API URL无需ssh直接连接你的notebook server的功能,这样即便是对墙内的同学们来说,也可以在开启instance后轻松连接。

以上几点倘若有哪位在墙内遇到了困难的,还请在下方留言,倘若哪些问题常见的话,我可以写个教程。


Fast.ai v3 2019课程中文版笔记
(George Zhang) #2

Hey @rachel, is it okay to use our mother tongue when discussing country-specific issues in the time zone specific channel? For example, students located in China has the special challenge of Great Fire Wall to face, which put hurdles between them and many foreign services, especially those provided by Google. This post mostly focuses on this issue.


#3

你好!我是墙内的学生。你上面的方法我没太看懂。搭建fastai的环境我已经花了很多时间,最终搭建成功了,但自己小小的2G显卡很少的数据也跑不完完整的文本分类流程。国内与GPU又贵。server setup 里的那个,墙内学生能够简单快速搭建起来做实验。我主要要做文本分类的实验,谢谢!


(fanyi) #4

crestle.ai就很好用,我也在墙内,也是对文本分类有兴趣。我用4万条文本在crest了上训练,一个epoch用时8分钟左右,最长一次算了十个小时,也才3个美元多一点。唯一的问题是注册时,需要能访问一次外网,因为注册时用到了Google的那个验证机器人。解决办法是找国外的同学帮你注册一个账号,以后再过内就可以直接用了。


(Hao) #5

其实你们可以试试kaggle kernel

kaggle的好处是

  1. 免费
  2. 6小时 k80
  3. 现有数据集

即使你想上传自己的数据集也可以开一个empty kernel (kernel -> new kernel), 之后无论你是untar还是upload都可以.


(George Zhang) #6

赞同。跑训练之前的所有步骤都可以在Kaggle上面免费跑。


#7

你看的是阿里云的按量付费实例, 阿里云的抢占式实例要便宜不少的。
最近涨价了一点, 便宜的时候, gn5 差不多是¥2.3/h gn5i 大概是¥0.7/h
比AWS 和 GCE 的都便宜

我之前写了个自动查询阿里云价格最低的实例,和自动购买 ecs 并安装开发环境的工具,感兴趣的同学可以看看


#8

我更推荐用 colab,

  • GPU 时间更长 12h vs 6h
  • 磁盘大很多200g vs 12g
  • kaggle 的编辑器有点反人类

(George Zhang) #9

很赞很赞,感谢!