[1]

Franz Schiller, “OPTIMIZING ATTENTION AND INFERENCE IN LARGE LANGUAGE MODELS: BALANCING EFFICIENCY, INTERPRETABILITY, AND ENERGY CONSUMPTION”, imjrd, vol. 12, no. 11, pp. 582–588, Nov. 2025.