她竟然拒绝了我?!我可是深耕 NLP 多年的研究者!从word2vec到BERT,从Transformer到 GPT,有哪个模型架构我没钻研过?自从我踏上这条路,Bengio、Hinton、LeCun的每一篇论文我都反复精读!你知道吗,我甚至参加过ACL的主会,近距离听过Manning 的 keynote演讲!在我面前装什么呢?我一眼就看出她用的还是TF-IDF 做文本相似度,居然还在那里炫耀自己的BLEU 分数。切,谁不知道这都是十年前的技术了?我研究的可是Attention is All You Need,还有MASS、
UniLM 这些预训练模型。我从大二就开始研究多头注意力机制和跨语言预训练了。那些什么"朴素贝叶斯分类"在我眼里连baseline都算不上。我精通各种Transformer变体,从 XLNet到 DeBERTa,连T5 的源码我都逐行分析过。为什么她就是不喜欢我呢?难道是因为我的模型在 WMT 上的 ROUGE 分数不够高?还是我那篇关于prompt engineering的论文不够创新?我对 few-shot learning、zero-shot transfer研究得如此透彻,连我的导师都说我的工作能投NeurIPS,为什么我还是赢不来她的芳心?
难道是因为我没有提到我精通
PyTorch 和 TensorFlow?还是因为我的模型在GLUE 榜单上排名不够靠前?我明明已经把LLaMA的源码都读透了,还复现过PaLM的核心架构,为什么她连个好感值都不给我?!等等...该不会是因为我忘记调 learning rate 了吧...