如何让你的gpu认真p盘. 看完节省不少时间。

在测试GPU P盘的过程中遇到一些问题,浪费了不少时间,在这里列出来,让大家避坑。

1:显卡在占用,但无负载,而是CPU继续P, 显式禁用CPU,则P盘完全停止。

  • 原因:Farmer内的扇区是7.5号前P好的,V0格式,而显卡P的扇区是V1格式的,两个格式并不兼容,因此为了保证farmer正常运行,会继续用CPU进行P盘,这里引用一段官方文档的原文

    Plot Format Compatibility
    GPU plotting employs the new v1 plot format, which is applicable to any plots created with versions released on or after July 5th. In contrast, older software versions generated plots in the v0 format, which is only compatible with CPU plotting.

  • 解决方法:完全删除旧的扇区,重新P盘即可

2:显卡在P盘,但速度较慢。

这里说的是单机P盘遇到的情况,如果你是用farmer cluster,可能的情况会更加复杂。

  • 原因: 如果你单机P盘,发现GPU甚至比CPU还慢,那很可能是你的Farmer容量较小,容量较小的Farmer对应的piece cache也相对较小,在P盘的过程中间就要下载这些piece cache,导致P盘时间增长,当前piece cache约为107G,默认piece cache占farmer size的1%,因此,如果你的farmer size低于10.5TB,你大概率会受此影响,显卡跑不到最佳状态。
  • 解决方法:
    1: 单机方案,设置--cache-percentage 参数,根据farmer size 反推 piece cache的比例, piece cache / farmer size 即是我们要设置的参数,举例,farmer size为 500G,则 cache percentage应该设置为 107/500=0.214=21.4% 此时设置稍大一点,–cache-percentage = 22即可。这个比例可以P完以后再设置成默认值,减少空间浪费的情况。
    2:使用farmer cluster. cluster有专用的piece cache组件,不管你的farmer size是多大。均可以正常存储全量的piece cache.

单机熟悉命令行的,建议第一种方案,否则,建议使用cluster. 尤其是规模大的,应采用cluster.

1 Like