小技巧大功效,「仅阅读两次提示」让循环语言模型超越Transformer++ | 长亭百川云