黄小兰坐到电脑前,双手放在键盘上,深吸一口气。
屏幕上,那些原始日志还在滚动。
她随手关掉,打开一个空白的编程界面。
然后她开始敲键盘。
啪。啪。啪。
手指落在键盘上的声音,清脆而有节奏。
她没有急着写代码,而是在脑子里先把昨晚和一号老师讨论的内容过了一遍。
算力有限——那就不能跑大模型。
数据匮乏——那就得在算法上找补。
传统机器学习方法在这个时代是主流。支持向量机、随机森林、adaboost……这些算法对算力的要求低得多,而且在小样本数据上表现不错。
她可以先把这些基础框架搭起来,然后在上面慢慢叠加。
就像盖房子一样。
先打地基,再砌墙,最后才是装修。
她开始写第一行代码。
定义数据结构。
初始化参数。
设置训练接口。
一行一行,一个函数一个函数。
她的度很快,快到旁边那几台老服务器还没来得及反应,她已经写完了基础框架。
然后她停下来,盯着屏幕看了一会儿。
不对。
太常规了。
常规的算法,常规的思路,常规的架构——那出来的也只能是常规的结果。
她要的不是常规。
她想要的是,在现有硬件的极限上,尽可能逼近那个“不可能”。
一号老师说过,那是“精美工艺品”的路子——不是靠堆料,而是靠巧思。
她删掉刚写的一半代码,重新开始。
这一次,思路变了。
不是从算法出,而是从硬件出。
她要先摸清这几台老服务器的底细。cpu型号、缓存大小、内存带宽、io吞吐……每一个细节,都会影响最后的设计。
她调出系统信息,一行一行看下去。
pentiu,单核,ghz。
gb内存,还不如未来一个智能手机的内存。
硬盘-块,gb,scsi硬盘。
黄小兰看着那些数据,嘴角抽了抽。
这也太老了。
不过有双千兆以太网口,算是比较前。
但她没抱怨,只是深吸一口气,继续敲键盘。
先测cpu算力极限。
她写了一个简单的循环,跑浮点运算。服务器出低沉的嗡鸣声,风扇开始加转动。
三分钟后,结果出来了。
每秒大约能跑亿次浮点运算。
后世一块普通显卡的千分之一都不到。
黄小兰沉默了两秒。