CGO 2024
2024 IEEE/ACM International Symposium on Code Generation and Optimization (CGO)

Powered by

2024 IEEE/ACM International Symposium on Code Generation and Optimization (CGO), March 02–06, 2024, Edinburgh, United Kingdom

CGO 2024 – Proceedings

Contents - Abstracts - Authors

Frontmatter

Title Page

Welcome from the General Chairs

Welcome from the Program Chairs

CGO 2024 Organization

CGO 2024 Sponsors and Supporters

Compilers for Machine Learning

A Tensor Algebra Compiler for Sparse Differentiation
Amir Shaikhha, Mathieu Huot, and Shideh Hashemian
(University of Edinburgh, United Kingdom; University of Oxford, United Kingdom)

Energy-Aware Tile Size Selection for Affine Programs on GPUs
Malith Jayaweera, Martin Kong, Yanzhi Wang, and David Kaeli
(Northeastern University, USA; Ohio State University, USA)

Published Artifact

Artifacts Available

Artifacts Functional

PolyTOPS: Reconfigurable and Flexible Polyhedral Scheduler
Gianpietro Consolaro, Zhen Zhang, Harenome Razanajato, Nelson Lossing, Nassim Tchoulak, Adilla Susungi, Artur Cesar Araujo Alves, Renwei Zhang, Denis Barthou, Corinne Ancourt, and Cédric Bastoul
(Huawei Technologies, France; Mines Paris-PSL, France; Huawei Technologies, China)

Published Artifact

Artifacts Available

Artifacts Reusable

Results Reproduced

Machine-Learning Guided Optimizations

AskIt: Unified Programming Interface for Programming with Large Language Models
Katsumi Okuda and Saman Amarasinghe
(Massachusetts Institute of Technology, USA; Mitsubishi Electric Corporation, Japan)

Published Artifact

Artifacts Available

Artifacts Reusable

Results Reproduced

Revealing Compiler Heuristics through Automated Discovery and Optimization
Volker Seeker, Chris Cummins, Murray Cole, Björn Franke, Kim Hazelwood, and Hugh Leather
(Meta AI Research, USA; University of Edinburgh, United Kingdom)

SLaDe: A Portable Small Language Model Decompiler for Optimized Assembly
Jordi Armengol-Estapé, Jackson Woodruff, Chris Cummins, and Michael F. P. O'Boyle
(University of Edinburgh, United Kingdom; Meta AI Research, USA)

Published Artifact

Artifacts Available

TapeFlow: Streaming Gradient Tapes in Automatic Differentiation
Milad Hakimi and Arrvindh Shriraman
(Simon Fraser University, Canada)

Video

Compilers for GPUs

A Framework for Fine-Grained Synchronization of Dependent GPU Kernels
Abhinav Jangda, Saeed Maleki, Maryam Mehri Dehnavi, Madan Musuvathi, and Olli Saarikivi
(Microsoft Research, USA; University of Toronto, Canada)

Published Artifact

Artifacts Available

Artifacts Reusable

Results Reproduced

Enhancing Performance through Control-Flow Unmerging and Loop Unrolling on GPUs
Alnis Murtovi, Giorgis Georgakoudis, Konstantinos Parasyris, Chunhua Liao, Ignacio Laguna, and Bernhard Steffen
(TU Dortmund, Germany; Lawrence Livermore National Laboratory, USA)

Published Artifact

Artifacts Available

Artifacts Reusable

Results Reproduced

Retargeting and Respecializing GPU Workloads for Performance Portability
Ivan R. Ivanov, Oleksandr Zinenko, Jens Domke, Toshio Endo, and William S. Moses
(Tokyo Institute of Technology, Japan; RIKEN R-CCS, Japan; Google DeepMind, France; University of Illinois at Urbana-Champaign, USA; Google DeepMind, USA)

Published Artifact

Info

Artifacts Available

Artifacts Reusable

Results Reproduced

Seer: Predictive Runtime Kernel Selection for Irregular Problems
Ryan Swann, Muhammad Osama, Karthik Sangaiah, and Jalal Mahmud
(AMD, USA)

Artifacts Reusable

Results Reproduced

Custom Processors

AXI4MLIR: User-Driven Automatic Host Code Generation for Custom AXI-Based Accelerators
Nicolas Bohm Agostini, Jude Haris, Perry Gibson, Malith Jayaweera, Norm Rubin, Antonino Tumeo, José L. Abellán, José Cano, and David Kaeli
(Northeastern University, USA; Pacific Northwest National Laboratory, USA; University of Glasgow, United Kingdom; University of Murcia, Spain)

Published Artifact

Artifacts Available

Artifacts Reusable

Results Reproduced

Ecmas: Efficient Circuit Mapping and Scheduling for Surface Code
Mingzheng Zhu, Hao Fu, Jun Wu, Chi Zhang, Wei Xie, and Xiang-Yang Li
(University of Science and Technology of China, China)

PresCount: Effective Register Allocation for Bank Conflict Reduction
Xiaofeng Guan, Hao Zhou, Guoqing Bao, Handong Li, Liang Zhu, and Jianguo Yao
(Shanghai Jiao Tong University, China; Shanghai Enflame Technology, China)

Tackling the Matrix Multiplication Micro-kernel Generation with Exo
Adrián Castelló, Julian Bellavita, Grace Dinh, Yuka Ikarashi, and Héctor Martínez
(Universitat Politècnica de València, Spain; Cornell University, USA; University of California at Berkeley, USA; Massachusetts Institute of Technology, USA; Universidad de Córdoba, Spain)

Published Artifact

Artifacts Available

Artifacts Reusable

Compiler Construction

One Automaton to Rule Them All: Beyond Multiple Regular Expressions Execution
Luisa Cicolini, Filippo Carloni, Marco D. Santambrogio, and Davide Conficconi
(Politecnico di Milano, Italy)

Published Artifact

Video

Info

Artifacts Available

Artifacts Reusable

Results Reproduced

Whose Baseline Compiler Is It Anyway?
Ben L. Titzer
(Carnegie Mellon University, USA)

Published Artifact

Artifacts Available

Artifacts Reusable

Results Reproduced

Enabling Fine-Grained Incremental Builds by Making Compiler Stateful
Ruobing Han, Jisheng Zhao, and Hyesoon Kim
(Georgia Institute of Technology, USA)

Custom Environments

Compile-Time Analysis of Compiler Frameworks for Query Compilation
Alexis Engelke and Tobias Schwarz
(TU Munich, Germany)

Published Artifact

Artifacts Available

Artifacts Reusable

Results Reproduced

DrPy: Pinpointing Inefficient Memory Usage in Multi-Layer Python Applications
Jinku Cui, Qidong Zhao, Yueming Hao, and Xu Liu
(North Carolina State University, USA)

Artifacts Functional

SCHEMATIC: Compile-Time Checkpoint Placement and Memory Allocation for Intermittent Systems
Hugo Reymond, Jean-Luc Béchennec, Mikaël Briday, Sébastien Faucou, Isabelle Puaut, and Erven Rohou
(Université de Rennes - Inria - CNRS - IRISA, France; Nantes Université - École Centrale Nantes - CNRS - LS2N - UMR 6004, France)

Video

Latent Idiom Recognition for a Minimalist Functional Array Language using Equality Saturation
Jonathan Van der Cruysse and Christophe Dubach
(McGill University, Canada)

Published Artifact

Artifacts Available

Artifacts Reusable

Results Reproduced

Static/Dynamic Analyses

BEC: Bit-Level Static Analysis for Reliability against Soft Errors
Yousun Ko and Bernd Burgstaller
(Yonsei University, South Korea)

Published Artifact

Artifacts Available

Artifacts Reusable

Results Reproduced

Boosting the Performance of Multi-solver IFDS Algorithms with Flow-Sensitivity Optimizations
Haofeng Li, Jie Lu, Haining Meng, Liqing Cao, Lian Li, and Lin Gao
(Institute of Computing Technology at Chinese Academy of Sciences, China; University of Chinese Academy of Sciences, China; Zhongguancun Laboratory, China; TianqiSoft, China)

Published Artifact

Artifacts Available

Artifacts Reusable

Results Reproduced

Representing Data Collections in an SSA Form
Tommy McMichen, Nathan Greiner, Peter Zhong, Federico Sossai, Atmn Patel, and Simone Campanoni
(Northwestern University, USA)

Published Artifact

Artifacts Available

Artifacts Reusable

Results Reproduced

Revamping Sampling-Based PGO with Context-Sensitivity and Pseudo-instrumentation
Wenlei He, Hongtao Yu, Lei Wang, and Taewook Oh
(Meta, USA)

Supporting Tools

Compiler Testing with Relaxed Memory Models
Luke Geeson and Lee Smith
(University College London, United Kingdom; Arm, United Kingdom)

Published Artifact

Info

Artifacts Available

Artifacts Reusable

Results Reproduced

High-Throughput, Formal-Methods-Assisted Fuzzing for LLVM
Yuyou Fan and John Regehr
(University of Utah, USA)

Published Artifact

Info

Artifacts Available

EasyTracker: A Python Library for Controlling and Inspecting Program Execution
Théo Barollet, Christophe Guillon, Manuel Selva, François Broquedis, Florent Bouchez-Tichadou, and Fabrice Rastello
(University Grenoble Alpes - Inria - CNRS - Grenoble INP - LIG, France)

Published Artifact

Artifacts Available

Artifacts Reusable

Results Reproduced

OptiWISE: Combining Sampling and Instrumentation for Granular CPI Analysis
Yuxin Guo, Alex W. Chadwick, Márton Erdős, Utpal Bora, Ilias Vougioukas, Giacomo Gabrielli, and Timothy M. Jones
(University of Cambridge, United Kingdom; Arm, USA; Arm, United Kingdom)

Published Artifact

Video

Artifacts Available

Artifacts Reusable

Results Reproduced

Practice and Experience

EasyView: Bringing Performance Profiles into Integrated Development Environments
Qidong Zhao, Milind Chabbi, and Xu Liu
(North Carolina State University, USA; Scalable Machines Research, USA)

Published Artifact

Artifacts Available

Artifacts Functional

Results Reproduced

Experiences Building an MLIR-Based SYCL Compiler
Ettore Tiotto, Víctor Pérez, Whitney Tsang, Lukas Sommer, Julian Oppermann, Victor Lomüller, Mehdi Goli, and James Brodman
(Intel Corporation, Canada; Codeplay Software, United Kingdom; Intel Corporation, USA)

Published Artifact

Artifacts Available

Unveiling and Vanquishing Goroutine Leaks in Enterprise Microservices: A Dynamic Analysis Approach
Georgian-Vlad Saioc, Dmitriy Shirchenko, and Milind Chabbi
(Aarhus University, Denmark; Uber Technologies, Denmark; Uber Technologies, USA)

Video

Acceleration Techniques

A System-Level Dynamic Binary Translator using Automatically-Learned Translation Rules
Jinhu Jiang, Chaoyi Liang, Rongchao Dong, Zhaohui Yang, Zhongjun Zhou, Wenwen Wang, Pen-Chung Yew, and Weihua Zhang
(Fudan University, China; University of Georgia, USA; University of Minnesota at Twin Cities, USA)

Instruction Scheduling for the GPU on the GPU
Ghassan Shobaki, Pınar Muyan-Özçelik, Josh Hutton, Bruce Linck, Vladislav Malyshenko, Austin Kerbow, Ronaldo Ramirez-Ortega, and Vahl Scott Gordon
(California State University, Sacramento, USA; Advanced Micro Devices, USA)

Published Artifact

Artifacts Available

Artifacts Functional

JITSPMM: Just-in-Time Instruction Generation for Accelerated Sparse Matrix-Matrix Multiplication
Qiang Fu, Thomas B. Rolinger, and H. Howie Huang
(Advanced Micro Devices, USA; NVIDIA, USA; George Washington University, USA)

oneDNN Graph Compiler: A Hybrid Approach for High-Performance Deep Learning Compilation
Jianhui Li, Zhennan Qin, Yijie Mei, Jingze Cui, Yunfei Song, Ciyong Chen, Yifei Zhang, Longsheng Du, Xianhang Cheng, Baihui Jin, Yan Zhang, Jason Ye, Eric Lin, and Dan Lavery
(Intel, USA; Intel, China)

Published Artifact

Artifacts Available

Artifacts Reusable

Results Reproduced

proc time: 0.08