LLM(廿六):从信息论的角度解释 scaling law